gemini embedding 2 による資料の類似性は見た目で決まる? 内容で決まる? PDF と画像で検証してみた
Zenn / 3/19/2026
💬 OpinionIdeas & Deep AnalysisModels & Research
Key Points
- Gemini embedding 2 の資料類似性は、見た目の特徴だけで決まらず、本文内容の影響を検証している。
- PDFと画像の2モードを比較した実験で、モード間の挙動差を観察した。
- 見た目ベースの類似性に依存すると誤判定が増える可能性があり、内容ベースの特徴を重視することが推奨される。
- 実務上は視覚特徴とテキスト特徴を組み合わせた埋め込みパイプラインが有効な可能性が示唆される。
前回、gemini-embedding-2 を使って、OCR しづらい資料でもそれっぽく近いものを拾えそう、という話を書きました。
gemini embedding 2 で "資料単位のナレッジ化" が容易に!?OCRできない見た目の知識をRAG化する
https://zenn.dev/bekku/articles/5fcbeae4ec5afb
今回はその続きとして、もう少し気になっていたことを試しました。
それが、PDF や画像のような資料において、embedding は見た目に強く引っ張られるのか、それとも資料中のテキスト内容に強く引っ張られるのか、という点です。
加えて、gemin...
Continue reading this article on the original site.
Read original →Related Articles

Astral to Join OpenAI
Dev.to

PearlOS. We gave swarm intelligence a local desktop environment and code control to self-evolve. Has been pretty incredible to see so far. Open source and free if you want your own.
Reddit r/LocalLLaMA

Why Data is Important for LLM
Dev.to

The Inference Market Is Consolidating. Agent Payments Are Still Nobody's Problem.
Dev.to

YouTube's Deepfake Shield for Politicians Changes Evidence Forever
Dev.to