深層学習とその他

機械学習したいマン

word2vecで学習済みfastTextを読み込んで単語類似度を表示する

アドベントカレンダー9日目です。
今日は、word2vecで学習済みfastTextを読み込んで類似度を出してみたいと思います。

adventar.org

学習済みfastTextのデータをダウンロードする

学習済みfastTextのデータはこちらからダウンロードできます。

fastTextの学習済みモデルを公開しました - Qiita

今回はこちらのDownload Word Vectors(NEologd)からダウンロードしました。

 

単語類似度を出す

出現頻度が高い単語は類似語も正確に出やすいですが、低い単語は怪しい数値が出ます。ソースコードは以下から。