読者です 読者をやめる 読者になる 読者になる

Less is Best

rubyが好き。技術の話とスタートアップに興味があります。

MeCab-pythonのインストール

python 自然言語処理

MeCabのインストール

日本語形態素解析ツールであるMeCabUTF-8でインストールします。 Pythonから使いたいのでmecab-pythonも一緒にインストール。

まずまMecab

$ wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
$ cd mecab-0.996/
$ ./configure
$ make
$ su
# make install

MeCab用の辞書も入れないといけないのでインストール

$ wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz 
$ cd mecab-ipadic-2.7.0-20070801/
$ ./configure --with-charset=utf8
$ make
$ su
# make install

これでMeCabのインストールは完了。

$ mecab
これはめかぶですか?
これ  名詞,代名詞,一般,*,*,*,これ,コレ,コレ
はめ  動詞,自立,*,*,一段,連用形,はめる,ハメ,ハメ
かぶ  動詞,自立,*,*,五段・ラ行,体言接続特殊2,かぶる,カブ,カブ
です  助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ
? 記号,一般,*,*,*,*,?,?,?
EOS

と動いていることを確認。

で、Pythonから動かしたいので、Pythonバインディングをインストール

$ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
$ tar zxfv mecab-python-0.996.tar.gz 
$ cd mecab-python-0.996
$ python2.7 setup.py build
$ su
$ python2.7 setup.py install

でインストール完了。 mecab-pythonにテストがはいっていたので試しにやってみると

$python test.py
Traceback (most recent call last):
  File "test.py", line 4, in <module>
    import MeCab
  File "/home/vagrant/mecab-python-0.996/MeCab.py", line 26, in <module>
    _MeCab = swig_import_helper()
  File "/home/vagrant/mecab-python-0.996/MeCab.py", line 18, in swig_import_helper
    import _MeCab
ImportError: libmecab.so.2: cannot open shared object file: No such file or directory

こんな感じでエラーを吐きました。 libmecab.so.2が見つかっていないと、うむむと悩んでいた所、ここを発見。参考にしてみる。

どうやら/etc/ld.so.confにパスを追加するといいらしい

$ vi /etc/ld.so.conf
+ /usr/local/lib

設定反映のために

$ sudo ldconfig

で完了。 無事にtest.pyも動いてくれて、インストール完了しました。

広告を非表示にする