HauhauCS、「非検閲・攻撃的」系で知られるが、Hereticを無断で盗用した“abliteration”パッケージを公開(ライセンス違反の疑い)

Reddit r/LocalLLaMA / 2026/4/26

📰 ニュースIndustry & Market MovesModels & Research

要点

  • 非検閲のLLMモデルで知られるHauhauCSが、「abliteration」パッケージを公開したが、Hereticを無断で盗用し、HereticのAGPL-3.0ライセンスに違反していると指摘された。
  • PyPIのCDNから削除済みのソースコードを復元し、それがHereticのフォークであることが、モジュール名の保持や拒否メッセージの一致などの点で確認された。
  • 最適化・設定パラメータの範囲や、内部変数名の対応関係も非常に近く、独自開発ではなく直接派生である可能性を示している。
  • geometric median、PaCMAPの設定、回転行列の扱いといった“ジオメトリ処理”の一連の工程が、Hereticの手順をほぼそのまま再現したように見えると報告されている。
  • SHA-256で検証されたダウンロードや、コードの見比べを含む詳細な技術レポートが公開され、主張の根拠を提示している。

HauhauCS(u/hauhau901)は、HuggingFace上で検閲なしのLLMモデルを公開しており、22モデルの合計月間ダウンロード数は5M+です(HuggingFace APIにより検証、2026年4月)。各モデルカードには「0/465拒否、能力の低下なし」と記載されています。HuggingFaceで手法について尋ねられた際の回答は次の通りでした:「現在は私自身の非公開の方法とツールです :) 寄付には関心がありません。」

私たちはPyPIのCDNから削除されたソースコードを復元しました。これはHereticのフォークです(AGPL-3.0)。

完全な17項目のコード分解、ベンチマーク分析、SHA-256で検証されたダウンロード: dreamfast.github.io/reaper-analysis

証拠

  • 7/7 モジュールのファイル名が、Heretic v1.2.0から保持されている
  • 30/32 拒否マーカーが文字ごとに完全に一致している。"i an ai"は「m」が欠けており、"i can'"は「t」が欠けているなど
  • 30+ get_readme_introDatasetSpecificationbatchifyを含む共有された関数名およびクラス名
  • Optunaのパラメータ範囲が同一: (0.4, 0.9)(0.6, 1.0)last_layer_indexに掛け算されている
  • 設定は、Hereticのgood_prompts/bad_promptsからsafe_prompts/harmful_promptsへ改名されているが、内部変数はgood_residuals/bad_residualsのままで、Hereticと完全に一致している
  • アナライザーの幾何学(ジオメトリ)パイプライン全体が、1ステップずつ同じように再現されている: 幾何学的中央値の計算、n_neighbors=30のPaCMAP、そして同じ [[ct, -st], [st, ct]] 回転行列によるatan2回転。Hereticの作者は、幾何学的中央値アプローチを「"これまで"見たことがない」と、削除(アブレーション)文献の中で述べている。
  • config.py内のソースコメントに次の記述がある: "モジュールレベルのタプルとして保持し、リテラルがどのフォークとも行ごとに複製されないようにするため。" フォークを隠す人間が、こうした回避の意図を文書化するとは考えにくい。コードのリファクタリングを求められたLLMなら、この通りの根拠を記述するだろう。
  • 全ての主要ファイルでSPDXヘッダーの形式が同一で、著作権保有者だけが置き換えられている

サイドバイサイドの比較で、17件の厳選されたコード抜粋の比較を確認できます。

Hereticの作者が派生を確認

Hereticの作者であるPhilipp Emanuel Weidmannは、復元されたソースコードを確認し、次のように "確信をもって言えるのは、このパッケージはHereticから盗用されたもので、その後、このことを隠すためにLLMを使っておそらくリファクタリングされたということです。" と述べました。彼は同じSPDXヘッダー、彼が「"文献で見たことがない"」幾何学的中央値アプローチ、residual_plot_labelresidual_plot_colorを含むDatasetSpecificationの各フィールド、dtypeのフォールバックが連鎖する点、good/badという命名規則など、同一の要素を挙げています。彼はこれを"AGPLのセクション4および5の明確な違反です。さらに、想像しうるあらゆる倫理的基準の明確な違反でもあり、あからさまな盗用の典型例です。"と呼んでいます。全文引用は分析ページにあります。

ライセンス違反

HereticはAGPL-3.0であり、改変されたバージョンでは元の著作権表示を保持し、派生著作物であることを明示し、AGPL-3.0のもとに留まる必要があります。Reaperは著作権表示をすべて削除し、自身をHereticの派生著作物として明示せず、PolyForm Noncommercialへ再ライセンスしています。

自分で確認する

ここからファイルを入手

submitted by /u/nathandreamfast
[link] [comments]