みなさんこんにちは、
要するに(TL;DR)、複数の人からAssistant_Pepe_32B版を作るよう頼まれました。しかし、最有力のベースモデル候補はQwen3-32Bでした。これはSTEM以外の用途に合わせて調整するのが非常に難しいモデルです。
Assistant_Pepeのコンセプトは、典型的な「アシスタント用の脳」を持たないアシスタントで、同調しすぎ(シフコフィー)を減らすために、ネガティブ・バイアスが注入されています。以前の議論は こちら、こちら で確認できます。
長文の壁であまり退屈させたくありません。なぜなら、上記の議論が本当に素晴らしい仕事をしていて、そこでは優れたアイデアや仮説がたくさん出てきたからです。
結論はこれです。これは、おそらく世の中にある「より人間っぽい」モデルの1つです。しかもそれ自体がかなり興味深いのは、ベースがQwenだからです。
詳細はモデルカードで:
https://huggingface.co/SicariusSicariiStuff/Assistant_Pepe_32B
[リンク] [コメント]
