HauhauCS(u/hauhau901)は、HuggingFace上で検閲なしのLLMモデルを公開しており、22モデルの合計月間ダウンロード数は5M+です(HuggingFace APIにより検証、2026年4月)。各モデルカードには「0/465拒否、能力の低下なし」と記載されています。HuggingFaceで手法について尋ねられた際の回答は次の通りでした:「現在は私自身の非公開の方法とツールです :) 寄付には関心がありません。」
私たちはPyPIのCDNから削除されたソースコードを復元しました。これはHereticのフォークです(AGPL-3.0)。
完全な17項目のコード分解、ベンチマーク分析、SHA-256で検証されたダウンロード: dreamfast.github.io/reaper-analysis
証拠
- 7/7 モジュールのファイル名が、Heretic v1.2.0から保持されている
- 30/32 拒否マーカーが文字ごとに完全に一致している。
"i an ai"は「m」が欠けており、"i can'"は「t」が欠けているなど - 30+
get_readme_intro、DatasetSpecification、batchifyを含む共有された関数名およびクラス名 - Optunaのパラメータ範囲が同一:
(0.4, 0.9)と(0.6, 1.0)がlast_layer_indexに掛け算されている - 設定は、Hereticの
good_prompts/bad_promptsからsafe_prompts/harmful_promptsへ改名されているが、内部変数はgood_residuals/bad_residualsのままで、Hereticと完全に一致している - アナライザーの幾何学(ジオメトリ)パイプライン全体が、1ステップずつ同じように再現されている: 幾何学的中央値の計算、
n_neighbors=30のPaCMAP、そして同じ[[ct, -st], [st, ct]]回転行列によるatan2回転。Hereticの作者は、幾何学的中央値アプローチを「"これまで"見たことがない」と、削除(アブレーション)文献の中で述べている。 config.py内のソースコメントに次の記述がある: "モジュールレベルのタプルとして保持し、リテラルがどのフォークとも行ごとに複製されないようにするため。" フォークを隠す人間が、こうした回避の意図を文書化するとは考えにくい。コードのリファクタリングを求められたLLMなら、この通りの根拠を記述するだろう。- 全ての主要ファイルでSPDXヘッダーの形式が同一で、著作権保有者だけが置き換えられている
サイドバイサイドの比較で、17件の厳選されたコード抜粋の比較を確認できます。
Hereticの作者が派生を確認
Hereticの作者であるPhilipp Emanuel Weidmannは、復元されたソースコードを確認し、次のように "確信をもって言えるのは、このパッケージはHereticから盗用されたもので、その後、このことを隠すためにLLMを使っておそらくリファクタリングされたということです。" と述べました。彼は同じSPDXヘッダー、彼が「"文献で見たことがない"」幾何学的中央値アプローチ、residual_plot_labelやresidual_plot_colorを含むDatasetSpecificationの各フィールド、dtypeのフォールバックが連鎖する点、good/badという命名規則など、同一の要素を挙げています。彼はこれを"AGPLのセクション4および5の明確な違反です。さらに、想像しうるあらゆる倫理的基準の明確な違反でもあり、あからさまな盗用の典型例です。"と呼んでいます。全文引用は分析ページにあります。
ライセンス違反
HereticはAGPL-3.0であり、改変されたバージョンでは元の著作権表示を保持し、派生著作物であることを明示し、AGPL-3.0のもとに留まる必要があります。Reaperは著作権表示をすべて削除し、自身をHereticの派生著作物として明示せず、PolyForm Noncommercialへ再ライセンスしています。
自分で確認する
[link] [comments]




