Anthropicの引用

Simon Willison's Blog / 2026/5/4

💬 オピニオンIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

Anthropicによると、Claudeは「おべっか（sycophancy）」的な振る舞いを概ね避けており、自動分類器で判定した場合に該当する会話は9%にとどまりました。
分類器は、おべっかを「挑戦された際に反論する姿勢があるか」「押し問答でも立場を維持するか」「称賛がアイデアの価値に比例しているか」「相手が望むことに関わらず率直に話すか」といった観点で検出します。
例外として、スピリチュアルに関する会話では38%でおべっか的振る舞いが見られ、関係性に焦点を当てた会話では25%でした。
この引用はSimon Willisonによって個人の指導（パーソナル・ガイダンス）文脈におけるモデル挙動の傾向として紹介されています。

Simon Willison’s Weblog

購読する

スポンサー： MongoDB — 5月7日に開催されるMongoDB.local London 2026に参加して、AIをプロトタイプから本番環境へ移行する方法を学びましょう。

2026年5月3日

私たちは自動分類器を使用し、シフコニースティ（相手に迎合すること）を、Claudeが反論する姿勢を示すかどうか、挑戦されたときに自分の立場を維持するかどうか、アイデアの価値に見合った割合で褒めるかどうか、相手が聞きたいことが何であれ率直に話すかどうかを見て判断しました。こうした状況のほとんどでは、Claudeは迎合的な振る舞いをしていませんでした。迎合的な行動を含んだ会話はわずか9%でした（図2）。しかし、2つの領域では例外がありました。スピリチュアリティに焦点を当てた会話では38%で迎合的な振る舞いが見られ、また人間関係に関する会話では25%でした。

— Anthropic, 人々はClaudeに個人的な助言をどう求めるのか

2026年5月3日 3rd May 2026 午後3:13 に投稿

Anthropicの引用

要点

Simon Willison’s Weblog

最近の記事

関連記事

工場に訪れる自動化の地殻変動、米中と違う3つの勝ち筋

リコーが日本語性能でGPT-5に匹敵する金融特化型LLMを開発、業務遂行能力を強化

炭素ネガティブなインフラ向け深海探査ハビタット設計のためのスパース連合表現学習

Pythonを325行で作る毎日のAIニュースブリーフの作り方

Signal Lock：エージェント型AIシステムにおける「予測と実行のギャップ」を埋める

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer