Abstract
嗅覚は、化学構造・神経符号化・言語的知覚の交差点に位置するが、既存の表現手法ではこの経路を十分に捉えきれていない。現在のアプローチは一般に、嗅覚経路の個別の断片のみをモデル化しており、分子から受容体、さらに言語記述に至るまでの完全な連鎖を見落としている。そのような分断によって学習された埋め込みは、生物学的な裏付けと意味的な解釈可能性の両方を欠くことになる。我々は、嗅覚経路に沿って3つのモダリティを整合させる表現学習フレームワークであるNOSE(Neural Olfactory-Semantic Embedding)を提案する。すなわち、分子構造、受容体配列、自然言語による記述の3つである。これらの信号を単に結合するのではなく、直交(orthogonal)な制約によってそれぞれの寄与を切り分け、各モダリティに独自に符号化された情報を保持する。嗅覚言語の疎性に対処するため、意味的類似度を較正する弱い正のサンプル戦略を導入し、特徴空間において似た匂い同士を誤って反発させることを防ぐ。大規模な実験により、NOSEが最先端(SOTA)の性能と優れたゼロショット汎化を達成することが示され、さらに、その表現空間が人間の嗅覚的直感と強く整合していることが確認される。