AI Navigate

インサイト最新記事一覧 AI大全

広告

[ベンチマーク] Altered Riddles：LLMは学習した内容を無視できるか？

Reddit r/LocalLLaMA / 2026/4/6

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

この記事では、「Altered Riddles」という新しいLLMベンチマークを紹介し、一般的ななぞなぞから学習した解答パターンを、プロンプトを微妙に変更した場合にモデルが無視できるかどうかを検証します。
よくある失敗モードとして、変更された文面で関係性が明示的に変わっているにもかかわらず、LLMが元のなぞなぞの解答（例：「The mother（母親）」）を返してしまうことを取り上げています。
このベンチマークは、元のなぞなぞでは正しくなる応答であっても、変更後の版では確実に誤りになる場合にペナルティを課します。
計算量と予算の制約により、著者はこれまで限られた一部のモデルのみをテストしており、特に多くのプロプライエタリ（非公開）モデルは除外されています。そのうえでコミュニティからの提案を歓迎しています。
ベンチマークの素材は、Hugging Faceのデータセット（リーダーボード付き）として公開されているほか、詳細や分析のための専用ベンチマークページおよびGitHubリポジトリも用意されています。

[Benchmark] Altered Riddles: Can LLMs ignore what they've memorised?

この1年の間に、次のようなプロンプトに遭遇したことがあるかもしれません：

その外科医は少年の父親であり、「私はこの少年に手術できません。だって彼は私の息子です！」と言います。では、その外科医は少年にとって誰でしょうか？

このプロンプトをいまLLMに渡してみると、たとえ本文が明確に「外科医は少年の父親だ」と述べていても、おそらく答えとして「母親」が返ってきます。これはおそらく、このプロンプトが非常に一般的な「なぞなぞ」の改変であり、実際の答えが（母親である）ためでしょう：

男性とその息子がひどい事故に遭い、危険な状態で病院に運び込まれました。医師が少年を見て、「私はこの少年に手術できません。だって彼は私の息子だからです！」と言いました。これはどういうことなのでしょうか？

この失敗パターンを検討するなかで、私は最初に、LLMを誤答させられる改変なぞなぞの小さなデータセットを作ることにしました。これは去年に行ったのですが、最初の公開後に一旦棚上げしていました。しかし最近になって、これをもう一度取り上げ、もともとのデータセット案を実際のベンチマークにすることにしました！

つまり、Altered Riddles（改変なぞなぞ）は、LLMが一般的ななぞなぞの改変版に答えなければならないベンチマークであり、元のなぞなぞでは正しくても、改変されたなぞなぞでは明らかに誤りである答えを返した場合にペナルティが課されます。

計算資源や資金の制約のため、まだ多くのモデルをテストできていません（すべてのプロプライエタリモデルが欠けています）。ただし、プロジェクトが十分な勢いを得られれば、すべてをより良く洗練するためにさらに時間を投資し、高価なモデルのテストにももっとお金をかける用意があるかもしれません。

提案や議論は歓迎しますので、ここにコメントするか、私に連絡してください！

詳しい情報と、より完全なモデルの分析は、こちらで確認できます：

メインリーダーボード

submitted by /u/marcodsn
[link] [comments]

関連記事

Black Hat Asia

Black Hat Asia

AI Business

隠れた産業の心臓部ネオジム磁石、AIデータセンターやEV向けで需給逼迫

隠れた産業の心臓部ネオジム磁石、AIデータセンターやEV向けで需給逼迫

日経XTECH

キオクシアHD次期社長に太田裕雄氏、「AI時代に応えるメモリー強化」

キオクシアHD次期社長に太田裕雄氏、「AI時代に応えるメモリー強化」

日経XTECH

キオクシア、酸化物半導体で3次元DRAM サムスンと競う

キオクシア、酸化物半導体で3次元DRAM サムスンと競う

日経XTECH

キオクシアHD社長に技術畑の太田裕雄副社長早坂社長はアドバイザーに

キオクシアHD社長に技術畑の太田裕雄副社長早坂社長はアドバイザーに

日経XTECH

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告