前提
Mecabを使って文章の単語の分割を行なっています。
その際、名詞を複数つなげた文字列が正しく分割されません。
実現したいことと問題
例えば「ブルーベリーソースチーズケーキ」という単語があった時に、これを「ブルーベリー」「ソース」「チーズ」「ケーキ」と分割されることを想定していました。
しかし、これが「ブルーベリーソースチーズケーキ」という1つの固有名詞の単語と認識されてしまいます。
※他にも同様の事象が発生している単語があります。
発生している問題・エラーメッセージ
以下の3つの単語の実行結果から、「ブルーベリー」「ソース」「チーズ」「ケーキ」はそれぞれ単語として登録されていることは確認しています。
ブルーベリーソースチーズケーキ ブルーベリーソースチーズケーキ 名詞,固有名詞,組織,*,*,*,* EOS ブルーベリーソース ブルーベリー 名詞,一般,*,*,*,*,ブルーベリー,ブルーベリー,ブルーベリー ソース 名詞,一般,*,*,*,*,ソース,ソース,ソース EOS いちごチーズケーキ いちご 名詞,一般,*,*,*,*,いちご,イチゴ,イチゴ チーズ 名詞,一般,*,*,*,*,チーズ,チーズ,チーズ ケーキ 名詞,一般,*,*,*,*,ケーキ,ケーキ,ケーキ EOS
参考までに、もう一つ例を掲載いたします。
ベリーアイスクリーム ベリー 名詞,一般,*,*,*,*,ベリー,ベリー,ベリー アイスクリーム 名詞,一般,*,*,*,*,アイスクリーム,アイスクリーム,アイスクリーム EOS ベリーベリーアイスクリーム ベリーベリーアイスクリーム 名詞,固有名詞,組織,*,*,*,* EOS
補足情報(FW/ツールのバージョンなど)
- 実際はPythonのコード上で実施することが目的です
- 辞書はipadicを使用しています
以上、よろしくお願いいたします

0 コメント