word2vecで学習済みfastTextを読み込んで単語類似度を表示する
アドベントカレンダー9日目です。
今日は、word2vecで学習済みfastTextを読み込んで類似度を出してみたいと思います。
学習済みfastTextのデータをダウンロードする
学習済みfastTextのデータはこちらからダウンロードできます。
fastTextの学習済みモデルを公開しました - Qiita
今回はこちらのDownload Word Vectors(NEologd)からダウンロードしました。
単語類似度を出す
出現頻度が高い単語は類似語も正確に出やすいですが、低い単語は怪しい数値が出ます。ソースコードは以下から。