コサイン類似度って何?コサイン距離の違いは?

Qiita / 2026/4/16

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

要点

  • コサイン類似度は、ベクトル間の角度に基づいて「どれだけ似ているか」を測る指標で、値は-1〜1の範囲で解釈されます。
  • コサイン距離はコサイン類似度から導かれることが多く、目的に応じて「近い/遠い」の扱いを切り替えられます。
  • ユークリッド距離とは異なり、スケール(大きさ)の影響を受けにくく、特徴量が正規化されている場合に特に有効です。
  • 自然言語処理(例:文章ベクトル)では、埋め込み同士の類似検索やクラスタリングなどで使われる前提知識として理解が重要です。
  • Pythonでの計算方法や実務での使い分けの観点が整理され、初心者でも実装・判断のイメージが掴める内容です。
コサイン類似度(Cosine Similarity) 一言でいうと:「2つのベクトルの向きがどれだけ近いかを -1〜1 の数値で表す指標。1に近いほど意味が似ている」 テキストのクラスタリングを勉強していて、「文章の近さをどう測るか」という問題にぶつかりました。 最...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →