前提
以前、質問をさせていただいた
【スクレイピングでxpathを使い、ツリーを全文表示したい(requests_html)】
と内容は同じなのですが、前回との違いは「requests_html」ではなく「requests」をつかいたいという点です。
実現したいこと
print()表示でhtmlの全文を表示したい
<!DOCTYPE html> <html lang="ja"> <head> ~~~~ </head> </html>
このような形で
該当のソースコード
Python3
import requests from bs4 import BeautifulSoup import lxml if __name__ == "__main__": url = "https://www.yahoo.co.jp/" r = requests.get(url) soup = BeautifulSoup(r.text, 'html.parser') root = lxml.html.fromstring(str(soup))
追加したいコード
print( ##rootのxpathを使用したhtmlの全文表示## )
試したこと
BeautifulSoupのfind()ではなく、xpathを指定してhtml内の全てのツリーを表示したいです。
0 コメント