生成エンジン最適化のための構造的特徴量エンジニアリング：コンテンツ構造が引用行動を形作る方法

arXiv cs.CL / 2026/4/1

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、AI搭載の検索エンジンがユーザの情報発見の仕方を変え、情報源の引用行動がコンテンツの可視性を左右する重要な決定要因になると主張する。
マクロ（文書アーキテクチャ）、メソ（チャンク化）、ミクロ（視覚的強調）の3つのレベルで構造的特徴量エンジニアリングを適用する、生成エンジン最適化の枠組み「GEO-SFE」を提示する。
著者らは、意味的整合性を維持しつつ引用確率を高めるための、アーキテクチャを意識した最適化戦略と予測モデルを構築する。
6つの主要な生成エンジンにまたがる実験では、平均引用率の改善が17.3%、主観的品質の向上が18.5%と報告されており、幅広い有効性を示唆している。
本研究は、構造最適化を、LLM搭載の情報エコシステムにおけるGEOの基盤となるデータ駆動型の構成要素として位置づける。

要旨: AI搭載の検索エンジンの普及により、情報探索は従来のリンクベースの取得から、選択的なソース引用を伴う直接的な回答生成へと移行し、コンテンツの可視性に新たな課題をもたらしている。既存の生成エンジン最適化（GEO）のアプローチは主としてセマンティックなコンテンツ修正に焦点を当てているが、引用行動に影響を与える構造的特徴の役割は十分に調査されていない。
本論文では、生成エンジン最適化における構造的特徴エンジニアリングのための体系的フレームワークであるGEO-SFEを提案する。我々のアプローチは、コンテンツ構造を3つの階層レベルに分解する。すなわち、マクロ構造（文書アーキテクチャ）、メソ構造（情報のチャンク化）、ミクロ構造（視覚的強調）であり、異なる生成エンジンのアーキテクチャにまたがって、これらが引用確率に与える影響をモデル化する。セマンティックな完全性を損なわずに構造的有効性を向上させる、アーキテクチャ対応の最適化戦略と予測モデルを開発する。
主流の6つの生成エンジンに対する実験評価では、引用率（17.3パーセント）および主観的品質（18.5パーセント）の一貫した改善が示され、提案フレームワークの有効性と汎用性が検証された。本研究は、GEOの基礎的な構成要素として構造最適化を確立し、LLM駆動の情報エコシステムにおいてコンテンツの可視性を高めるためのデータ駆動型手法を提供する。