大規模言語モデルとバグ参照によるMPIエラー検出と修復の改善

arXiv cs.AI / 2026/4/6

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、高性能計算および分散トレーニングのワークフローにおいて、MPI（Message Passing Interface）プログラムのエラーを検出し修復することが難しい点に取り組む。
モデルは、正しいMPIの使い方と誤ったMPIの使い方、ならびに既知のバグパターンに関するタスク固有の知識を欠いているため、この作業にLLM（例：ChatGPT）を直接用いると性能が低いと主張する。
著者らは、Few-Shot Learning（少数ショット学習）、Chain-of-Thought（連鎖的思考）推論、そして Retrieval Augmented Generation（RAG）を、「バグ参照」手法と組み合わせたLLMベースのパイプラインを提案し、精度を高める。
実験では、ChatGPTを直接用いるベースラインと比べて、エラー検出精度が44%から77%へと大幅に向上したと報告している。
バグ参照アプローチは、初期のモデルにとどまらず、他の大規模言語モデルでもうまく機能し、一般化できることが示されている。