Thinkなブログ: gensim word2vecで複数のモデルファイルが作成される。

2020年11月16日月曜日

今までより、次元数を増やしてgensim word2vecを計算していたところ、計算モデルが複数のファイルに出力されるようになった。(計算モデルはMODEL.modelと指定)

・MODEL.model

・ MODEL.model.trainables.syn1neg.npy

・MODEL.model.wv.vectors.npy

MODEL.modelのファイルサイズは、それまでの計算ファイルと比較しても小さいが、これら３つのファイルを同じフォルダにおいておけば、wordvectorの計算は今まで同様にできている。調べたところ、次元数を増やしたりして、データ数を増えると、自動的にファイルを分割するようだ。

参考リンク

Thinkなブログ