mecab コマンド

日本語を形態素解析したり、漢字の読みがなを取得したりするコマンド。

使い方は作者のサイトを見るのが正確である。

MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://taku910.github.io/mecab/

taku910/mecab: Yet another Japanese morphological analyzer
https://github.com/taku910/mecab

インストール

MeCab本体とは別に辞書もインストールが必要。

以下はyumとかapt-getとかのパッケージマネージャではなくて、ソースからインストールする方法。

まずはMeCab本体のインストール。

wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar xvzf mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
sudo make install
cd ..

次はipadicの辞書のインストール。

wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
cd ..

unidicの辞書のインストール。unidicも使いたければ。

wget -O mecab-unidic-2.1.2_src.zip 'http://sourceforge.jp/frs/redir.php?m=osdn&f=%2Funidic%2F58338%2Funidic-mecab-2.1.2_src.zip'
unzip mecab-unidic-2.1.2_src.zip
cd mecab-unidic-2.1.2_src
./configure --with-charset=utf8
make
sudo make install
cd ..

(Ubuntu 13.10, 14.04 で確認)

ふりがなを振るには

-Oyomi オプションを付ける。

$ echo "形態素解析" | mecab -Oyomi
ケイタイソカイセキ
このサイトは筆者(hydrocul)の個人メモの集合です。すべてのページは永遠に未完成です。