AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

Qwen3.6-35B-A3B-Uncensored-Wasserstein-GGUF（Wassersteinメトリクスで量子化GGUFのssm_conv1dドリフトを修正）

Reddit r/LocalLLaMA / 2026/4/19

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

著者は、量子化GGUFモデルの<em>ssm_conv1d</em>レイヤーで発生するテンソルドリフト問題を、Wassersteinメトリクス（W1）で数値的不安定性を検出することで修正できたと主張しています。
課題は3つの<code>ssm_conv1d.weight</code>層（blk.36〜blk.38）に限られており、修正後にW1値が大きく低下したとされています。
モデルの他のテンソルは「健康」とされており、問題が局所的である可能性が示されています。
修正版のモデルがHugging Faceで公開され、関連ベースモデル、システムプロンプト、チャットテンプレート、推奨量子化・設定（LM Studio向け、例：Q4_K_P）へのリンクも提示されています。

みなさんこんにちは。ついに、量子化GGUFモデルにおけるssm_conv1dテンソルのドリフトを、ワッサースタイン距離（W1）によって修正する方法を見つけました。テンソルの数値的不安定性やドリフトを検出する点で、Kullback Leiblerよりもずっと優れています。

3つともssm_conv1d.weight層です。これは長いコンテキストのメモリに関与するリカレント状態遷移層です。Qwenチームが、SSM層におけるこの特定のドリフト問題を把握していないようです。この同じバグを、Unsloth由来の量子化（quants）でも見つけました。

テンソル	α	D (対数比)	W1（修正前）	W1（修正後）
blk.36.ssm_conv1d.weight	0.5765	0.553	0.0038	0.0009
blk.37.ssm_conv1d.weight	0.5768	0.725	0.0040	0.0009
blk.38.ssm_conv1d.weight	0.6533	0.649	0.0026	0.0006

モデル内の他のテンソルは問題ありません。

修正済みモデル：https://huggingface.co/LuffyTheFox/Qwen3.6-35B-A3B-Uncensored-Wasserstein-GGUF

モデルのベースはこちら：https://huggingface.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 。素晴らしい仕事をしてくれたHauhauCSに感謝します。

システムプロンプト：https://pastebin.com/pU25DVnB

チャットテンプレート：https://pastebin.com/Dy2fmmpN

推奨クオンタイズ：Q4_K_P

推奨設定（LM Studio）：

パラメータ	値
Temperature	0.7
Top K サンプリング	20
Presence Penalty	1.5
Repeat Penalty	無効
Top P サンプリング	0.8
Min P サンプリング	0
Seed	42

モデルの特徴：

ほぼ人間のように話します。短くて簡潔です。
完全に検閲なし（uncensored）。
プログラミングは問題なく動作します。

私のシステムプロンプトを使ったロールプレイで、モデルの長いコンテキストウィンドウをテストしました。私の好みの範囲では、次のキャラクターに問題は見つかりませんでした。

楽しんでください ^_^

投稿者 /u/EvilEnginer
[リンク] [コメント]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/19Dailyインサイトを見る →

関連記事

Black Hat USA

Black Hat USA

AI Business

ブラックハット・アジア

ブラックハット・アジア

AI Business

チューリング、E2E自動運転で公道走行 VLAでは「国内初」

チューリング、E2E自動運転で公道走行 VLAでは「国内初」

日経XTECH

「横浜銀行など地銀5行が統合DBを刷新」など、3月に読まれた記事

「横浜銀行など地銀5行が統合DBを刷新」など、3月に読まれた記事

日経XTECH

2026年のAI検索に必要な「たった1つのファイル」

2026年のAI検索に必要な「たった1つのファイル」

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告