mecab コマンド 2016/05/05
日本語を形態素解析したり、漢字の読みがなを取得したりするコマンド。
使い方は作者のサイトを見るのが正確である。
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://taku910.github.io/mecab/
taku910/mecab: Yet another Japanese morphological analyzer
https://github.com/taku910/mecab
インストール 2015/08/29
MeCab本体とは別に辞書もインストールが必要。
以下はyumとかapt-getとかのパッケージマネージャではなくて、ソースからインストールする方法。
まずはMeCab本体のインストール。
wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar xvzf mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
sudo make install
cd ..
次はipadicの辞書のインストール。
wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
cd ..
unidicの辞書のインストール。unidicも使いたければ。
wget -O mecab-unidic-2.1.2_src.zip 'http://sourceforge.jp/frs/redir.php?m=osdn&f=%2Funidic%2F58338%2Funidic-mecab-2.1.2_src.zip'
unzip mecab-unidic-2.1.2_src.zip
cd mecab-unidic-2.1.2_src
./configure --with-charset=utf8
make
sudo make install
cd ..
(Ubuntu 13.10, 14.04 で確認)
ふりがなを振るには 2016/10/27
-Oyomi
オプションを付ける。
$ echo "形態素解析" | mecab -Oyomi
ケイタイソカイセキ