概要: コード変換はソフトウェア開発プロセスにおける基礎的な能力であり、その有効性は入力コードの意味を特徴づけ、変換を導く高品質なコード表現の構築に依存します。既存のアプローチはコード変換をエンドツーエンドの学習タスクとして扱い、意味推論に必要な表現の構築をモデルの重みに黙示的に任せるか、硬直したコンパイラレベルの抽象に依存します。SemRepを提示します。SemRepは生成的なコード表現学習を通じてコード変換を改善するフレームワークです。私たちの重要な洞察は、意味論を保つ変換を中間表現として用いることで、それが生成的な中間トレーニングタスクとして機能するとともに、以降の指示特化型コード変換への指針にもなることです。一般的なコード編集および最適化タスク(例:GPUカーネル最適化)にわたって、SemRepは厳密に同じトレーニング予算で、正確性で6.9%、性能で1.1倍、汎化で13.9%、頑健性で6.7%向上する、広くファインチューニングされたベースラインを上回ります。多様なコード変換の探索を改善することで、SemRepは特に進化的探索に適しています。進化的コーディングエージェントと組み合わせると、SemRepは、685Bのパラメータを持つベースラインが発見できない最適化を見つけつつ、推論計算量を25%削減したまま同じ性能を達成します。
返却形式: {"translated": "翻訳されたHTML"}