MolReFlect:分子とテキスト間の文脈内・精密な対応付けに向けて

arXiv cs.CL / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMを用いた分子理解における重要な課題として、分子とその性質を説明するキャプションの「具体的なフレーズ」との間に、精密な対応付けが欠けている点を扱います。
  • 「微細なアラインメント」を、分子のサブ構造と、それらの性質を説明するテキスト上のフレーズとの明示的な対応関係として定義し、精度と説明可能性の向上を目指します。
  • 専門家による高コストなアノテーションを避けるため、教師–生徒モデルの枠組みであるMolReFlectを提案し、教師LLMがサブ構造とフレーズの対応を生成・改善したうえで、その詳細アラインメントを生徒LLMに教えます。
  • 実験の結果、MolReFlectは「分子キャプション変換」タスクで最先端(SOTA)の性能を達成し、従来のベースラインを上回ることが示されています。
  • さらに、再現や発展研究を支えるために、GitHubでコードが公開されています。