あなたがClaudeにメッセージを入力すると、中で何か目に見えないことが起こります。あなたが送った言葉は、モデルがコンテキストを処理し、応答を生成するために使う「アクティベーション」と呼ばれる長い数のリストに変換されます。これらのアクティベーションは、言ってみれば、モデルの「思考」が存在する場所です。問題は、誰もそれらを簡単には読み取れないことです。 […]
記事 Anthropic は Claude の内部アクティベーションを直接、人が読めるテキストの説明へ変換する自然言語オートエンコーダを発表 は、MarkTechPost に最初に掲載されました。
