大規模言語モデルとバグ参照によるMPIエラー検出と修復の改善

arXiv cs.AI / 2026/4/6

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高性能計算および分散トレーニングのワークフローにおいて、MPI(Message Passing Interface)プログラムのエラーを検出し修復することが難しい点に取り組む。
  • モデルは、正しいMPIの使い方と誤ったMPIの使い方、ならびに既知のバグパターンに関するタスク固有の知識を欠いているため、この作業にLLM(例:ChatGPT)を直接用いると性能が低いと主張する。
  • 著者らは、Few-Shot Learning(少数ショット学習)、Chain-of-Thought(連鎖的思考)推論、そして Retrieval Augmented Generation(RAG)を、「バグ参照」手法と組み合わせたLLMベースのパイプラインを提案し、精度を高める。
  • 実験では、ChatGPTを直接用いるベースラインと比べて、エラー検出精度が44%から77%へと大幅に向上したと報告している。
  • バグ参照アプローチは、初期のモデルにとどまらず、他の大規模言語モデルでもうまく機能し、一般化できることが示されている。