頻出単語分類　トピック分類するには

7月 01, 2024

イメージ説明

このlyricsの部分全体の頻出単語やトピック分類をしたいのですがどのようなコードを書けばよろしいでしょうか。動詞、形容詞、名詞だけをカウントしたいです。

下記のコードを試しましたが、求めたい結果が得られません。

import MeCab from collections import Counter df_1980 = pd.read_csv('total_1980.csv') def get_word_count(text): tagger = MeCab.Tagger("-Owakati") words = tagger.parse(text).strip().split(" ") word_count = Counter(words) return word_count for i in df_1980["lyrics"]: text = i word_count = get_word_count(text) print("単語毎の出現回数:") for word, count in word_count.items(): print(f"単語: {word}, 出現回数: {count}") コード

コメントを投稿

0 コメント