なぜ、読書リクエストにおいてさまざまなLLMが私を失望させるのか？

Reddit r/artificial / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

Redditのユーザーが、複数のLLMが、特定の詳細な読書嗜好に合うフィクション小説を推薦するという面で、繰り返し失敗していると説明している。
ユーザーは2つの失敗パターンを報告している。1つは、推薦がリクエストから大きく逸れてしまうこと。もう1つは、存在しない「作り話（ハルシネーション）」の書名／説明を返すこと。
彼らは、既知のターゲット概念（Bonesetterシリーズ）に対して、8〜10個の要望されたテーマ的特徴を用いてテストするが、LLMは結果にそれを取り上げず、代わりに人気作や無関係な作品を返してしまう。
この投稿は、モデルの学習が広く知られた本にバイアスされているのか、それとも嗜好に基づくフィクション推薦という課題自体がLLMにとって本質的に不向きなのかを疑問視している。
ユーザーは、この用途におけるLLMの能力の限界なのか、それともモデルへのプロンプトの出し方に問題があるのかについて、助言を求めている。

ここで重大な質問です。過去1年間、そこそこ多い入力データに基づいて読みたい架空の小説を選ぶのを手伝ってもらうために、さまざまなLLMを試してきました。これはLLMモデルにうまく適した作業だと思ったのですが、提案にはいつも失望させられます。依頼した内容とまったく違うか、存在しないはずの書名や説明をでっち上げた（ハルシネーションの）ものになってしまうのです。

ここでの大きな問題は、学習が非常に人気のある本に対して行われているため、LLMがそれらを結果として出してしまうことなのでしょうか？一度、頭の中に「自分が読みたい正確な本」のイメージを先に置いて検証してみました（この場合は、Laurence Dahners の Bonesetter シリーズでした）。私は、この本で見つけたいと思っている特徴を8〜10個（先史時代の要素、成長物語、コンピテンス・ポルノなど）挙げましたが、10件の提案を求めたときに、LLMはこの本をまったく提案しませんでした。もちろん『Clan of the Cave bear』は出してきます。でも、その後は『Dungeon Crawler Carl』とか『The Martian』みたいな、まったく話が飛んだ提案ばかりでした。

こういう種類の作業は、そもそもLLMの得意分野ではないのでしょうか？それとも、私が何か間違ったやり方をしているのでしょうか？

によって投稿されました /u/Yottahz
[link] [comments]

Black Hat USA

AI Business

Black Hat Asia

AI Business

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

日経XTECH

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

[R] ECIH：モデルモデリングによるエージェンティック・アイデンティティを創発的な関係状態として捉える [R]

Reddit r/MachineLearning

なぜ、読書リクエストにおいてさまざまなLLMが私を失望させるのか？

要点

関連記事

Black Hat USA

Black Hat Asia

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

[R] ECIH：モデルモデリングによるエージェンティック・アイデンティティを創発的な関係状態として捉える [R]

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

Black Hat Asia

日立やNEC、フィジカルAIで脱「人月商売」 リアルな現場も効率化

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

[R] ECIH：モデルモデリングによるエージェンティック・アイデンティティを創発的な関係状態として捉える [R]

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ