Less is Best

rubyが好き。技術の話とスタートアップに興味があります。

自然言語処理

dockerでmecab-ipadic-neologdなmecabを試すためのコンテナ作った

久しぶりのブログ。 mecabを久しぶりに弄ろうかと思ったら便利なやつが出てたのでDockerで簡単にインストールできるようにしておきました。 neologd/mecab-ipadic-neologdgithub.com googlecode.comを参照しているので2016/01/25には使えなくなると思います…

エントリーシート添削サービスEScortterを作りました

エントリーシートを自動で添削評価するサービスEScortterを作りました。 What’s This? EScortterでは、文章の長さや、文章の文法的特徴、文末表現などエントリーシートの文章中の特徴を分析して通過する可能性の高いエントリーシートか否かの点数を出してい…

MeCab-pythonのインストール

MeCabのインストール 日本語形態素解析ツールであるMeCabをUTF-8でインストールします。 Pythonから使いたいのでmecab-pythonも一緒にインストール。 まずまMecab $ wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz $ cd mecab-0.996/ $ ./conf…

ChaSenのインストール

ChaSenのインストール 形態素解析による日本語自然言語処理システムであるChaSenをインストールしたメモ。 こことここを参考にインストールしてみました 環境:centos6.3 まずはChaSenの情報を見に行く http://chasen-legacy.sourceforge.jp/ http://sourcefo…

nltkにてProver9導入方法

入門自然言語処理にて、nltkで使用する定理証明器であるProver9のインストール方法でちょっと迷ったので、メモしておきます。 まずはDL $ wget http://www.cs.unm.edu/~mccune/mace4/download/LADR-2009-11A.tar.gz そして解凍 $ tar xvzf LADR-2009-11A.tar…

nltk.MaxentClassifier.train()がエラーを吐く。

入門 自然言語処理作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明出版社/メーカー: オライリージャパン発売日: 2010/11/11メディア: 大型本購入: 20人 クリック: 639回この商品を含むブログ (44件) を見る nltk.MaxentClassifier.tr…

自然言語処理入門第2章演習問題②

とりあえず、中級難易度まで。 15. # -*- coding: utf-8 -*- from __future__ import division import nltk from nltk.corpus import brown text = nltk.Text(brown.words(brown.fileids()[0])) fdist =nltk.FreqDist(text) for w in fdist.keys(): if fdist…

自然言語処理入門第2章演習問題①

1.単語のリストを含んだ変数を作成そして、操作してみる wlist = ["summer","autumn","winter","spring"] print wlist #errorおこる > list同士連結しろ #wlist + "fortal" #print wlist print wlist + ["fortal"] #>['summer', 'autumn', 'winter', 'spring…