ページ内容を取得し、新たにcsvファイル化するには

5月 31, 2024

Pandas の read_html() は table 要素を抽出しますが、今回の対象のウェブページは ul 要素で構成されています。
そのため、requests + BeautifulSoup を利用して li 要素内の span 要素を取り出します。

python

1import pandas as pd 2import requests 3from bs4 import BeautifulSoup 4 5def get_popular(url):6 # ページの内容を取得7 res = requests.get(url)8 res.raise_for_status()9 10 soup = BeautifulSoup(res.text, 'html.parser')11 artists = soup.select('span.artistName')12 songs = soup.select('span.songName')13 df = pd.DataFrame(columns=column_names)14 for artist, song in zip(artists, songs):15 df.loc[len(df)] = [artist.text, song.text]16 17 return(df)

ページ内容を取得し、新たにcsvファイル化するには

hsmw

コメントを投稿

0 コメント

このブログを検索

Popular Posts

【Javascript】Photoshopで複数選択したレイヤーを移動する方法6月 14, 2024

NSBluetoothAlwaysUsageDescriptionを設定しているが実機で許可画面がでてこない6月 14, 2024

forEachのループから途中でbreakするには8月 01, 2022

ページ内容を取得し、新たにcsvファイル化するには

hsmw

おすすめの投稿

コメントを投稿

0 コメント

このブログを検索

Social Plugin

Popular Posts

【Javascript】Photoshopで複数選択したレイヤーを移動する方法6月 14, 2024

NSBluetoothAlwaysUsageDescriptionを設定しているが実機で許可画面がでてこない6月 14, 2024

forEachのループから途中でbreakするには8月 01, 2022

Social Footer Widget