https://www.bleague.jp/schedule/?s=1&tab=2&year=2022&event=7&club=&setuFrom=1
こちらのサイトでスクレイピングを行っています。
試合情報(両チームなど)と試合実施日を取り出したいのですが、
html
<dt>日付</dt><dd> <ul> <li>試合情報1</li> <li>試合情報2</li> </ul><dt>日付</dt><dd></dd> <ul> <li>試合情報3</li> <ul>
HTMLがこのようになっており、日付に対して試合情報がいくつあるか不定となっています。
試合情報ごとにリスト化していきたく、その中の一要素として日付を加えたいと思っています。
また上記のコードにおける dd の要素もいくつあるか不定であり、そのため
python
match = soup.find('dl',class_=CLASS_NAME)results = match.find_all('dd',class_=CLASS_NAME)for i in range(len(results)): game_infos = match.find_all('dd',class_=CLASS_NAME)[i]
上記のようなコードをすでに書いてあります。
したがって li の要素をfind_allで取り出すことができません。
かといってfindだけでは一つの日付に対して一つの試合情報しか取れません。
どうにかして日付の情報を各試合情報に付け加えたいのですが何か方法はありますでしょうか。
0 コメント