2017年3月8日水曜日

word2vecの動かし方

【mecabのインストールと分かち書き】
$ sudo apt-get install mecab libmecab-dev mecab-ipadic
$ sudo apt-get install mecab-ipadic-utf8
$ sudo apt-get install python-mecab

echo "$(<jawiki.txt)" | mecab -F"%f[6] " -U"%m " -E"\n" > jawiki_data.txt

【word2vecの動かし方】
./word2vec -train input-wakati.txt -output jawiki_data.bin -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -binary 1

その後、以下のコマンドで動いた
/usr/local/bin/word2vec-distance jawiki_data.model

【word2vecのコマンド】
word2phrase, word2vec, word2vec-compute-accuracy, word2vec-distance, word2-doc2vec, word2vec-word-analogy

0 件のコメント:

コメントを投稿