2020年11月16日月曜日

gensim word2vecで複数のモデルファイルが作成される。

 今までより、次元数を増やしてgensim word2vecを計算していたところ、計算モデルが複数のファイルに出力されるようになった。(計算モデルはMODEL.modelと指定)

・MODEL.model

・ MODEL.model.trainables.syn1neg.npy

・MODEL.model.wv.vectors.npy

 

MODEL.modelのファイルサイズは、それまでの計算ファイルと比較しても小さいが、これら3つのファイルを同じフォルダにおいておけば、wordvectorの計算は今まで同様にできている。調べたところ、次元数を増やしたりして、データ数を増えると、自動的にファイルを分割するようだ。 


参考リンク

gensim word2vecで複数のモデルファイルが作成されるのはなぜですか?

creating word2vec model syn1neg.npy extension 


0 件のコメント:

コメントを投稿