実現したいこと
スクレイピングしたデータを最終的に以下のようなリストとして出力したい
['こんにちは', 'こんばんは']
前提
PythonとBeautifulSoupを使用しています。
変数htmlは変更しないものとします。
発生している問題
- <strong>タグを削除すると<br/>タグも同時に削除される
- <br/>タグが削除されることによってsplitを利用した分割が不可になる
該当のソースコード
Python3
1html = '<strong>こんにちは<br/>こんばんは</strong>' 2soup = BeautifulSoup(html, 'html.parser') 3items = soup.select('strong') 4 5print(items[0]) 6print(items[0].text) 7print(type(items[0])) 8 9result = items[0].split('<br/>') 10print(result)
試したこと
Python3
1# 文字列型にしてなんとかできないかと試みました 2str(items[0])
ここに問題に対して試したことを記載してください。
補足情報(FW/ツールのバージョンなど)
Python 3.10.6
beautifulsoup 4.12.2
Windows11
0 コメント