2020年11月11日水曜日

word2vec:類似ベクトルの計算

類似ベクトルを表示する。

パターン1:計算モデルをロードし、キーワードを予め与える。
from gensim.models import word2vec

model = word2vec.Word2Vec.load('MODEL.model')
results = model.wv.most_similar(positive=['KEYWORD'], topn=10)
for result in results:
    print(result)


・topn=10はデフォルトなので、省略可能。(20個表示したければtopn=20と書く)

・wv.most_similarを使っている。 



パターン2: modelとキーワードは引数として与える。

from gensim.models import word2vec
import sys

model   = word2vec.Word2Vec.load(sys.argv[1])
results = model.most_similar(positive=sys.argv[2], topn=10)

for result in results:
    print(result[0], '\t', result[1])


・most_similarはmv.most_similarを使うように警告がでている。



0 件のコメント:

コメントを投稿