Text2Arch：自然言語記述から科学的アーキテクチャ図を生成するためのデータセット

arXiv cs.CL / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

本論文は、自然言語の説明から科学的アーキテクチャ図を生成するための新しい大規模オープンアクセス・データセット「Text2Arch」を提案しています。
テキストを中間コード（DOT）へ変換し、それを用いて高忠実度の図を描画する言語モデル活用のパイプラインを示しています。
既存のクリーンな大規模オープンデータセットが不足していたため、科学的アーキテクチャ画像、対応するテキスト、DOTコードの組を提供します。
データセットで複数の小型言語モデルを微調整し、さらにGPT-4oによるインコンテキスト学習も評価した結果、DiagramAgentのような既存ベースラインを上回り、GPT-4oの生成と同等の性能を達成したと報告しています。
データセット、コード、学習済みモデルを公開し、テキストから図への課題に対するさらなる研究とオープンモデル開発を促します。

概要: テキストだけで複雑なシステム設計や科学的プロセスを伝えることは非効率で、曖昧さが生じやすいです。高いセマンティック整合性をもってテキストから科学的アーキテクチャ図を自動生成できるシステムは、エンタープライズ・アーキテクチャの可視化、AI駆動のソフトウェア設計、教育コンテンツ作成など、複数の用途で有用になりえます。そこで本論文では、入力テキスト記述の意味理解を言語モデルに行わせ、その結果として、最終的に高精細なアーキテクチャ図を生成するために処理可能な中間コードを生成することに焦点を当てます。残念ながら、このタスクに対するクリーンな大規模オープンアクセス・データセットは存在せず、そのため有効なオープンモデルが欠けています。そこで我々は、
system、科学的アーキテクチャ画像、その対応するテキスト記述、および関連するDOTコード表現から成る包括的なデータセットを提供します。このリソースを用いて一連の小型言語モデルを微調整し、さらにGPT-4oによるインコンテキスト学習も実施します。大規模な実験を通じて、
system{}モデルがDiagramAgentのような既存のベースラインモデルを大きく上回り、GPT-4oのインコンテキスト学習に基づく生成と同等の性能を発揮することを示します。コード、データ、モデルを公開します。