CSVファイルのツイートをNeologd辞書で分かち書きし、それをもう一度CSVファイルに書き出したい

実現したいこと

CSVファイルのツイートをNeologd辞書で分かち書きし、それをもう一度CSVファイルに書き出したい

前提

https://teratail.com/questions/192892
この記事を参考にしたがフォルダーにファイルがない

発生している問題・エラーメッセージ

エラー自体は発生していない

該当のソースコード

import csv import glob from janome.tokenizer import Tokenizer t = Tokenizer() def parser(text): result = t.tokenize(text) return "|".join(result) t = Tokenizer(wakati=True) path = "./input" file_list = glob.glob(path + '/' + '*.csv') for filename in file_list: with open(filename, "r+", encoding="cp932", errors="ignore") as f: reader = csv.DictReader(f, delimiter=',') texts = [dict(text=c["text"], result=parser(c["text"]) ) for c in reader] f.seek(0) fieldnames = ['text', 'result'] writer = csv.DictWriter(f, fieldnames=fieldnames) writer.writeheader() for row in texts: writer.writerow(row)

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

コメントを投稿

0 コメント