Claudeと会話してみて気づいたのですが、それが話し方の点でとてもとても特徴的です。私が知っている他のいくつかのLLMより、はるかに「個性」があります。同じシステムプロンプト「Sonnet 4.5」をQwen3.5 27Bにそのまま与えても、その振る舞いは変わらなかったので、システムプロンプトが大きく作用している可能性は除外しました。
Claudeの回答/思考トレースが別のモデルに蒸留されたと主張するものを、たくさんたくさん見てきましたが、テストしてみると正直…がっかりです。私はあちこち探しましたが、何かを見落としていない限り(見落としていたらごめんなさい…そうでないことを願っています)、次の問いをするのは妥当だと思います:
なぜClaudeのように話すモデルを作れないのでしょうか?
それは推論というより、ただの「話し方のスタイル」や「雰囲気」であって、ClaudeのAPI/Web UIからはそれ自体が隠されているわけでもありません。単に、どう頑張ってもモデルがClaudeのように話せないような、何らかのアーキテクチャの違いが偶然あるのでしょうか? それとも、モデルサイズの問題に加えて、良いシステムプロンプト(きちんと指示すれば、>200BモデルならClaudeのように話せる)みたいなものが必要なのでしょうか?
私はシステムプロンプトを試すことに、あまりにも長い時間を費やしてきました。でもモデルはいつも次を見逃します:
- フォーマット(Claudeは絵文字から逸れがちで、他のモデルと比べて箇条書きをできるだけ使わないようにしているのを見つけました)
- 回答の長さ(たとえば、Satinが何であるかについて5段落も延々と語ったりするのに、Gated DeltaNetsについては1))
ありがとうございます!
[link] [comments]



