今までより、次元数を増やしてgensim word2vecを計算していたところ、計算モデルが複数のファイルに出力されるようになった。(計算モデルはMODEL.modelと指定)
・MODEL.model
・ MODEL.model.trainables.syn1neg.npy
・MODEL.model.wv.vectors.npy
MODEL.modelのファイルサイズは、それまでの計算ファイルと比較しても小さいが、これら3つのファイルを同じフォルダにおいておけば、wordvectorの計算は今まで同様にできている。調べたところ、次元数を増やしたりして、データ数を増えると、自動的にファイルを分割するようだ。
参考リンク
gensim word2vecで複数のモデルファイルが作成されるのはなぜですか?
creating word2vec model syn1neg.npy extension
0 件のコメント:
コメントを投稿