ファイルからデータフレーム作成

前提

https://serenard.hatenablog.com/entry/2019/04/07/164337
WindowsでPython3.9を用いています。
現在上のサイトを参考に、青空文庫から複数の小説の文章だけのデータを保存している状態です。その中から学習に使用する作者と作品を選んで新たにファイルを作成しました。
例. D:novel/select/作者名/作品名.txt
これらを用いてDoc2Vecに用いる学習用のデータフレームを作成しようと思っています。
そのためにpandasのデータフレームについて調べたのですが、osのファイルを用いた方法がなかなか見つからずとどまってしまっている状態です。

実現したいこと

ここに実現したいことを箇条書きで書いてください。

・作者名はファイル名から、小説のデータはosのtxtファイルから、とすることは可能でしょうか?

該当のソースコード

https://pythondatascience.plavox.info/pandas/pandas%E3%81%A7%E3%83%87%E3%83%BC%E3%82%BF%E3%83%95%E3%83%AC%E3%83%BC%E3%83%A0%E3%82%92%E4%BD%9C%E3%81%A3%E3%81%A6%E3%81%BF%E3%82%88%E3%81%86
このサイトを参考に手を付けて見たものの全然進んでいないコードになります。

import pandas as pd import os path = './select/' df = pd.dataframe({ 'names' : , 'text' : })

コメントを投稿

0 コメント