Transformer、強さの正体は「簡潔さ」 ICLR 2026の有力論文を一挙深掘り

日経XTECH / 2026/5/21

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

ICLR 2026（ブラジル・リオデジャネイロ、採択5357件）でOutstanding Paperとして選出された論文の注目点として、「LLMs Get Lost In Multi-Turn Conversation」が取り上げられた。
複数ターンにわたる会話でプロンプトを与えると、LLMの回答精度と信頼度が劣化しうることを実証で示し、会話型AIの普及に伴う実務上の大課題を浮き彫りにした。
実験ではプロンプトをシャーディングして段階的に指示を与える方式を試したところ、全てを1ターンで与えた場合より精度が低下する傾向が、試したすべてのLLMで確認された。
想定される要因として、情報が揃っていない段階での予測の早さ、誤った予測の「膨張」や排除しきれないこと、中間ターン情報の軽視、冗長な回答など複数のメカニズムが挙げられている。

　2026年4月23日から27日にかけてブラジル・リオデジャネイロで開催された深層学習のトップカンファレンス「ICLR（International Conference on Learning Representations） 2026」。採択論文5357件の中から、注目の論文を紹介する。

　ICLR 2026ではOutstanding Paper（優秀賞）として2本の論文が選出された。1本目は「LLMs Get Lost In Multi-Turn Conversation（大規模言語モデルは複数ターンにわたる会話で混乱する）」。LLM（大規模言語モデル）に複数のやり取り（ターン）にわたってプロンプト（指示文）を入力すると、回答能力と信頼度が劣化することを明らかにした。この論文は2026年2月にSNS上でも注目を集めた。AI（人工知能）と会話形式で作業を進める場面が増えるなか、1つ大きな課題を示した。

先端LLMで例外なく観測された「思わぬ弱点」とは、2月のAI注目論文

　ChatGPTやClaudeといった最先端のLLM（大規模言語モデル）は、単一の質問（プロンプト）に対しては高い精度で回答できる一方、日常会話でよくある、複数回のやり取りからなる質問には精度がガクッ…

2026.03.13

　実証ではひとまとまりのプロンプトを分割（シャーディング）し、指示を少しずつ与えてタスクを解かせた。すると試したすべてのLLMにおいて、1ターンで回答させたときよりも精度が下がることを確認したという。

　原因は幾つか考えられるとしている。例えば情報がそろっていないにもかかわらず、モデルが回答の予測を早く立てすぎている可能性がある。あるいは精度の悪い回答予測であっても排除し切れず、モデルが「膨張」している可能性もある。他にも、中間のターンで与えられた情報を軽視したり、冗長に回答しすぎていたり、といった原因が考えられる。

複数ターンでLLMの回答精度が劣化すると考えられる原因

（出所：「LLMs Get Lost In Multi-Turn Conversation」の発表ポスター）

[画像のクリックで拡大表示]

筆頭著者である米MicrosoftResearc...

この記事は有料会員限定です

日本がロボットで米中に勝つための4つの秘策

日経XTECH

BMWの自動化は第4段階へ、「人型ロボは既にクルマ3万台の製造に活用」

日経XTECH

半導体市場、28年にメモリー価格下落で縮小米ガートナー

日経XTECH

GMOあおぞらネット銀が電話サポートを24時間に、「AIオペレーター」を活用

日経XTECH

「トークン数を数えるのはバカげている」—AIコーディング熟練度を測る無料指標を作りました

Dev.to

Transformer、強さの正体は「簡潔さ」 ICLR 2026の有力論文を一挙深掘り

要点

次のページ

関連記事

日本がロボットで米中に勝つための4つの秘策

BMWの自動化は第4段階へ、「人型ロボは既にクルマ3万台の製造に活用」

半導体市場、28年にメモリー価格下落で縮小米ガートナー

GMOあおぞらネット銀が電話サポートを24時間に、「AIオペレーター」を活用

「トークン数を数えるのはバカげている」—AIコーディング熟練度を測る無料指標を作りました

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

次のページ

関連記事

日本がロボットで米中に勝つための4つの秘策

BMWの自動化は第4段階へ、「人型ロボは既にクルマ3万台の製造に活用」

半導体市場、28年にメモリー価格下落で縮小 米ガートナー

GMOあおぞらネット銀が電話サポートを24時間に、「AIオペレーター」を活用

「トークン数を数えるのはバカげている」—AIコーディング熟練度を測る無料指標を作りました

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

半導体市場、28年にメモリー価格下落で縮小米ガートナー