形態素解析
Javaで日本語解析するのにIgoを使っていますが解析結果から各単語がどの品詞IDなのか欲しくなるときがあります。 igoの使い方 辞書登録の方法Igoをそのまま使ってもsurfaceとfeatureとstartくらいしか情報がとれません。 「私は日本生まれです」これを解析し…
あれこれ日本語解析していて独自の品詞が欲しくなったので追加してみました。 どういう事かと言うと解析する文章に都道府県名が入っているかを知る必要が出てきて 文章を分解した後に名詞だけを抜き出してその中から47都道府県名があるか ぐるぐるとループを…
前回、「嵐の相葉君は動物が好き」をIgoで分解したところ 「相葉」が「相」と「葉」で分かれました。 今回、キチンと「相葉」で認識してもらうために独自の単語を辞書に登録します。まずは独自の辞書ファイルを作成 C:\igo\mecab-ipadic-2.7.0-20070801にadd…
Javaで形態素解析を行うライブラリはいくつかありますが、初めに本家の純正MeCabをがんばってJNIでJava⇔Cを試しましたが うまくいかなかったので他を試してみることに。 いろいろある中でも私はIgoが使いやすいと思ったのでIgoで説明します。準備 以下をダウ…