VOLMO: Versatile and Open Large Models for Ophthalmology
arXiv cs.CV / 3/26/2026
💬 OpinionSignals & Early TrendsModels & Research
Key Points
- 失明を防ぐための早期眼科検査に向けて、画像・構造化データ・自由記述を統合する既存MLLMは眼科領域で性能が十分でなく、オープンな眼科特化モデルも乏しいことが背景として示された。
- VOLMOはモデル非依存かつデータを開放した眼科特化MLLM開発のフレームワークで、(1) 画像—テキスト86,965ペアを用いた眼科知識の事前学習、(2) 12眼疾患のスクリーニング/重症度分類のタスク微調整、(3) 患者症例913件での多段推論までを段階的に行う。
- コンパクトな2BパラメータのVOLMO-2Bを学習し、InternVL-2BやLLaVA-Medなど複数の強いベースラインと比較した結果、画像記述、疾患スクリーニング/ステージ分類、評価と管理の生成の各タスクで一貫して優位だった。
- 12疾患での平均F1が87.4%に達し、年齢関連黄斑変性と糖尿病性網膜症について独立コホートでの外部検証でもより高い評価を得たと報告された。
- 本研究は眼科臨床ワークフローへの多モーダルLLM適用に向けた再現可能な学習パイプラインを提供し、今後の眼科特化モデル開発の“参照実装”になり得る内容となっている。
Related Articles
Regulating Prompt Markets: Securities Law, Intellectual Property, and the Trading of Prompt Assets
Dev.to
Mercor competitor Deccan AI raises $25M, sources experts from India
Dev.to

I asked my AI agent to design a product launch image. Here's what came back.
Dev.to
They Did Not Accidentally Make Work the Answer to Who You Are
Dev.to
Welsh government used Copilot for review to justify closing organization
The Register