Mecabで連続した名詞の単語が特定の固有名詞として解析されてしまう

前提

Mecabを使って文章の単語の分割を行なっています。
その際、名詞を複数つなげた文字列が正しく分割されません。

実現したいことと問題

例えば「ブルーベリーソースチーズケーキ」という単語があった時に、これを「ブルーベリー」「ソース」「チーズ」「ケーキ」と分割されることを想定していました。
しかし、これが「ブルーベリーソースチーズケーキ」という1つの固有名詞の単語と認識されてしまいます。

※他にも同様の事象が発生している単語があります。

発生している問題・エラーメッセージ

以下の3つの単語の実行結果から、「ブルーベリー」「ソース」「チーズ」「ケーキ」はそれぞれ単語として登録されていることは確認しています。

ブルーベリーソースチーズケーキ ブルーベリーソースチーズケーキ 名詞,固有名詞,組織,*,*,*,* EOS ブルーベリーソース ブルーベリー 名詞,一般,*,*,*,*,ブルーベリー,ブルーベリー,ブルーベリー ソース 名詞,一般,*,*,*,*,ソース,ソース,ソース EOS いちごチーズケーキ いちご 名詞,一般,*,*,*,*,いちご,イチゴ,イチゴ チーズ 名詞,一般,*,*,*,*,チーズ,チーズ,チーズ ケーキ 名詞,一般,*,*,*,*,ケーキ,ケーキ,ケーキ EOS

参考までに、もう一つ例を掲載いたします。

ベリーアイスクリーム ベリー 名詞,一般,*,*,*,*,ベリー,ベリー,ベリー アイスクリーム 名詞,一般,*,*,*,*,アイスクリーム,アイスクリーム,アイスクリーム EOS ベリーベリーアイスクリーム ベリーベリーアイスクリーム 名詞,固有名詞,組織,*,*,*,* EOS

補足情報(FW/ツールのバージョンなど)

  • 実際はPythonのコード上で実施することが目的です
  • 辞書はipadicを使用しています

以上、よろしくお願いいたします

コメントを投稿

0 コメント