Pythonのためのニューラルデバッガの開発に向けて

arXiv cs.LG / 2026/3/11

Ideas & Deep AnalysisTools & Practical UsageModels & Research

原文を読む →

共有:

要点

本論文はニューラルデバッガを紹介しており、これはPythonコードにおける関数へのステップイン、オーバー、アウトや特定の行へのブレークポイント設定といった従来のデバッガ操作を模倣するようにファインチューニングまたは事前学習された言語モデルである。
ニューラルデバッガは、デバッガの操作に基づいて将来のプログラム状態や出力を予測する順方向実行と、過去の状態や入力を推測する逆方向実行の両方をモデル化できる。
CruxEvalによる評価では、出力と入力の予測において高い性能を示し、頑健な条件付き実行モデリング能力を示した。
本研究は、ニューラルデバッガがシミュレートされたデバッグ環境のワールドモデルとして機能するエージェント型コーディングシステムへの道を開き、コード生成、プログラム理解、自動デバッグの向上に寄与する。
従来のステップ実行デバッグに似たインタラクティブな制御を導入することで、現行のニューラルインタプリタの制限を克服し、Pythonプログラムの開発者の作業効率を向上させる。

コンピュータサイエンス > 機械学習

arXiv:2603.09951 (cs)

[2026年3月10日提出]

題目:Pythonのためのニューラルデバッガに向けて

著者:Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeveによる「Pythonのためのニューラルデバッガに向けて」という題目の論文のPDFを表示

PDFを表示 HTML（実験的）

要旨:大規模言語モデル（LLM）をPythonの実行トレースで学習させることで、それらはコード実行に根付くようになり、Python全プログラムの行ごとの実行予測が可能になり、実質的にニューラル・インタプリタ（FAIR CodeGen Team ほか, 2025）へと変わる。しかし、開発者がプログラムを逐一ステップ実行することは稀である。代わりに、デバッガを使って特定のブレークポイントで実行を停止し、関連部分のみをステップ実行しながら、プログラム変数を検査または変更する。既存のニューラル・インタプリタ手法には、このような対話的な制御が欠けている。この制限に対処するため、我々はニューラルデバッガを導入する。ニューラルデバッガとは、従来のデバッガを模倣する言語モデルであり、関数へのステップイン／ステップオーバー／ステップアウトといった操作に加え、特定のソース行にブレークポイントを設定することを支援する。我々は、ニューラルデバッガが――大規模LLMの微調整によって得られる場合、あるいは小規模モデルをスクラッチから事前学習することによって得られる場合のいずれでも――デバッガ操作に条件付けされて、順方向の実行（将来の状態や出力の予測）と逆方向の実行（過去の状態や入力の推定のいずれも）を確実にモデル化できることを示す。CruxEvalで評価したところ、我々のモデルは出力予測タスクと入力予測タスクの両方で強い性能を達成し、頑健な条件付き実行のモデリングを示している。本研究は、将来のエージェント型コーディングシステムに向けた第一歩を与えるものであり、ニューラルデバッガが模擬デバッグ環境のための世界モデルとして機能し、実行フィードバックを提供したり、エージェントが実際のデバッグツールと相互作用できるようにしたりすることを可能にする。この能力は、より強力なコード生成、プログラム理解、そして自動デバッグのための基盤を築くものである。

コメント:
分野:	機械学習 (cs.LG); 人工知能 (cs.AI); ソフトウェア工学 (cs.SE)
引用:	arXiv:2603.09951 [cs.LG]
	(または、この版のための arXiv:2603.09951v1 [cs.LG])
	https://doi.org/10.48550/arXiv.2603.09951 もっと詳しく知るにはフォーカス DataCite経由で発行されたarXiv DOI

投稿履歴

作成者: Maximilian Beck [メールを表示]
[v1] 2026年3月10日（火）17:47:05 UTC（1,647 KB）

全文リンク:

論文へのアクセス:

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeveによる「Pythonのためのニューラルデバッガに向けて」という題目の論文のPDFを表示

PDFを表示
HTML（実験的）
TeXソース

ライセンスを表示

現在の閲覧コンテキスト:

cs.LG

< prev | next >

new | recent | 2026-03

次の内容を閲覧するには：

cs
cs.AI
cs.SE

参考文献 & 引用

BibTeX引用のエクスポート読み込み中...

BibTeX形式の引用

提供データ：

ブックマーク

書誌ツール

書誌および引用ツール

書誌エクスプローラーの切り替え

書誌エクスプローラー (エクスプローラーとは？)

Connected Papers の切り替え

Connected Papers (Connected Papers とは？)

Litmaps の切り替え

Litmaps (Litmaps とは？)

scite.ai の切り替え

scite Smart Citations (Smart Citations とは？)

コード、データ、メディア

本記事に関連付けられたコード、データ、メディア

alphaXiv の切り替え

alphaXiv (alphaXiv とは？)

コードへのリンクの切り替え

論文のための CatalyzeX コードファインダー (CatalyzeX とは？)

DagsHub トグル

DagsHub (DagsHubとは何ですか？)

GotitPub トグル

Gotit.pub (GotitPubとは何ですか？)

Huggingface トグル

Hugging Face (Huggingfaceとは何ですか？)

コードへのリンクトグル

Papers with Code (Papers with Codeとは何ですか？)

ScienceCast トグル

ScienceCast (ScienceCastとは何ですか？)

Demos

Replicate トグル

Replicate (Replicateとは何ですか？)

Spaces トグル

Hugging Face Spaces (Spacesとは何ですか？)

Spaces トグル

TXYZ.AI (TXYZ.AIとは何ですか？)

レコメンダーおよび検索ツール

Influence Flowerへのリンクトグル

Influence Flower (Influence Flowerとは何ですか？)

COREレコメンダートグル

CORE Recommender (COREとは何ですか？)

IArxiv レコメンダーの切り替え

IArxiv レコメンダー (IArxivとは？)

著者
掲載先
所属機関
トピック

arXivLabs について

arXivLabs：コミュニティの共同協力者と取り組む実験的プロジェクト

arXivLabs は、協力者が当社のウェブサイト上で新しい arXiv の機能を直接開発し、共有できるようにするフレームワークです。

arXivLabs と連携して取り組む個人と組織の双方が、開放性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、それを尊重してきました。arXiv はこれらの価値観にコミットしており、それらを遵守するパートナーとだけ連携します。

arXiv のコミュニティにとって価値を追加するプロジェクトのアイデアはありますか？ arXivLabs について詳しくはこちら。

この論文のどの著者が推奨者ですか？ | MathJax を無効化（MathJax とは？）

1Passwordが人間とAIエージェントのアイデンティティを統一管理する「Unified Access 」発表

Publickey

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

機械学習・ディープラーニングにおける数学の必要性

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

Pythonのためのニューラルデバッガの開発に向けて

要点

コンピュータサイエンス > 機械学習

題目:Pythonのためのニューラルデバッガに向けて

投稿履歴

論文へのアクセス:

参考文献 & 引用

BibTeX形式の引用

ブックマーク

書誌および引用ツール

本記事に関連付けられたコード、データ、メディア

Demos

レコメンダーおよび検索ツール

arXivLabs：コミュニティの共同協力者と取り組む実験的プロジェクト

関連記事

1Passwordが人間とAIエージェントのアイデンティティを統一管理する「Unified Access 」発表

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

機械学習・ディープラーニングにおける数学の必要性

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer