なぜ Word2Vec で「hot」と「cold」が近くなるのか? ― 連想の3分類で読み解く

Qiita / 2026/5/1

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • Word2Vecで「hot」と「cold」が近くなるのは、単なる共起語の近さではなく、連想を支える複数の要因(近接の作り方)が絡むためだと説明する。
  • 記事では連想のパターンを「3分類」で整理し、それぞれが語の埋め込み空間での距離にどう影響するかを読み解く。
  • 「hot」と「cold」が同じ文脈上の性質(対比・同種の文脈・機能的な関係など)として学習されると、ベクトルが近づきうることをモデルの考え方に沿って解説する。
  • gensimでWord2Vecを触る際に見落としがちな“近さの理由”を、分類と観点から理解することで分析・実験の解像度を上げる狙いがある。
はじめに gensim で Word2Vec を触っていて、こんな経験はないでしょうか。 model.most_similar("hot", topn=5) # → [('warm', 0.74), ('cold', 0.71), ('chilly', 0.66), (...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →