BeautifulSoupのデータをhtmlタグで分割してリストにするには?

実現したいこと

スクレイピングしたデータを最終的に以下のようなリストとして出力したい
['こんにちは', 'こんばんは']

前提

PythonとBeautifulSoupを使用しています。
変数htmlは変更しないものとします。

発生している問題

  1. <strong>タグを削除すると<br/>タグも同時に削除される
  2. <br/>タグが削除されることによってsplitを利用した分割が不可になる

該当のソースコード

Python3

1html = '<strong>こんにちは<br/>こんばんは</strong>' 2soup = BeautifulSoup(html, 'html.parser') 3items = soup.select('strong') 4 5print(items[0]) 6print(items[0].text) 7print(type(items[0])) 8 9result = items[0].split('<br/>') 10print(result)

試したこと

Python3

1# 文字列型にしてなんとかできないかと試みました 2str(items[0])

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

Python 3.10.6
beautifulsoup 4.12.2
Windows11

コメントを投稿

0 コメント