Transformer、強さの正体は「簡潔さ」 ICLR 2026の有力論文を一挙深掘り

日経XTECH / 5/21/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

Key Points

ICLR 2026（2026/4/23-27、ブラジル・リオデジャネイロ）の採択5357件から、Outstanding Paperとして2本の注目論文が選出され、そのうち1本は「LLMs Get Lost In Multi-Turn Conversation」。
複数ターンにわたってプロンプトを与える会話形式では、LLMの回答精度と信頼度が単一ターンより悪化することを実証で示し、会話ベース利用の現場に重要な課題を提示した。
研究ではプロンプトをシャーディングして段階的に指示を与えるアプローチを試し、その結果すべての検証LLMで1ターン回答より精度が下がることを確認した。
劣化要因として、情報不足なのに早く予測してしまう可能性、誤った中間予測が排除し切れず「膨張」する可能性、中間ターン情報の軽視や冗長化など複数の仮説を挙げている。

　2026年4月23日から27日にかけてブラジル・リオデジャネイロで開催された深層学習のトップカンファレンス「ICLR（International Conference on Learning Representations） 2026」。採択論文5357件の中から、注目の論文を紹介する。

　ICLR 2026ではOutstanding Paper（優秀賞）として2本の論文が選出された。1本目は「LLMs Get Lost In Multi-Turn Conversation（大規模言語モデルは複数ターンにわたる会話で混乱する）」。LLM（大規模言語モデル）に複数のやり取り（ターン）にわたってプロンプト（指示文）を入力すると、回答能力と信頼度が劣化することを明らかにした。この論文は2026年2月にSNS上でも注目を集めた。AI（人工知能）と会話形式で作業を進める場面が増えるなか、1つ大きな課題を示した。

先端LLMで例外なく観測された「思わぬ弱点」とは、2月のAI注目論文

　ChatGPTやClaudeといった最先端のLLM（大規模言語モデル）は、単一の質問（プロンプト）に対しては高い精度で回答できる一方、日常会話でよくある、複数回のやり取りからなる質問には精度がガクッ…

2026.03.13

　実証ではひとまとまりのプロンプトを分割（シャーディング）し、指示を少しずつ与えてタスクを解かせた。すると試したすべてのLLMにおいて、1ターンで回答させたときよりも精度が下がることを確認したという。

　原因は幾つか考えられるとしている。例えば情報がそろっていないにもかかわらず、モデルが回答の予測を早く立てすぎている可能性がある。あるいは精度の悪い回答予測であっても排除し切れず、モデルが「膨張」している可能性もある。他にも、中間のターンで与えられた情報を軽視したり、冗長に回答しすぎていたり、といった原因が考えられる。

複数ターンでLLMの回答精度が劣化すると考えられる原因

（出所：「LLMs Get Lost In Multi-Turn Conversation」の発表ポスター）

[画像のクリックで拡大表示]

筆頭著者である米MicrosoftResearc...

この記事は有料会員限定です

Web devs sleeping with the enemy: AI is doing their job and they worry it's after their desk too

The Register

LlamaStation v0.9 — llama.cpp GUI for Windows with multi-backend support, TurboQuant, MTP and more

Reddit r/LocalLLaMA

Revolutionizing Hotel Front Desk with AI

Dev.to

Apple Silicon as a Serious AI Dev Box: What an M4 Max Actually Does With a 70B Model

Dev.to

Plagio con IA: ChatGPT copió su tutorial con todo y los enlaces internos

Dev.to

Transformer、強さの正体は「簡潔さ」 ICLR 2026の有力論文を一挙深掘り

Key Points

次のページ

Related Articles

Web devs sleeping with the enemy: AI is doing their job and they worry it's after their desk too

LlamaStation v0.9 — llama.cpp GUI for Windows with multi-backend support, TurboQuant, MTP and more

Revolutionizing Hotel Front Desk with AI

Apple Silicon as a Serious AI Dev Box: What an M4 Max Actually Does With a 70B Model

Plagio con IA: ChatGPT copió su tutorial con todo y los enlaces internos

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer