CountsDiff：自然数上の拡散モデル——計数（カウント）ベースデータの生成と補完

arXiv cs.LG / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、自然数（計数ベース／順序離散分布）で定義されるデータをネイティブに生成および補完する拡散モデル枠組み、CountsDiffを提案する。
CountsDiffはBlackout拡散フレームワークに基づき、それを生存確率スケジュールと明示的な損失重み付けにより再定式化することで、既存の拡散アプローチと明確な対応関係をもつ設計パラメータを導出する。
本手法は、計数領域ではこれまであまり検討されてこなかった最新の拡散的特徴を取り込み、連続時間での学習、classifier-free guidance、さらに非単調な逆行程を可能にするchurn／re-masking（入れ替え／再マスキング）型の逆ダイナミクスを含む。
実験の結果、CountsDiffの初期実装が自然画像データセット（CIFAR-10、CelebA）で競争力のある性能を示し、単一細胞RNA-seqの計数補完タスク（胎児細胞・心臓細胞アトラス）で強い結果が得られた。
著者らは、単純版が最先端の離散生成モデリングおよび主要なRNA-seq補完手法と同等、あるいはそれを上回る可能性を報告しており、より良いパラメータ最適化によってさらなる性能向上が見込まれるとしている。

概要: 拡散モデルは、連続領域およびトークンベース領域の両方における生成タスクで優れた性能を発揮してきましたが、離散の順序データへの適用はいまだ十分に開発されていません。私たちは、自然数上の分布をネイティブにモデル化するための拡散フレームワーク「CountsDiff」を提案します。CountsDiffは、サバイバル確率スケジュールに関する直接的なパラメータ化と、明示的な損失の重み付けによってその定式化を簡素化し、Blackout拡散フレームワークを拡張します。これにより、既存の拡散モデリングの枠組みに対応する設計パラメータを通じた柔軟性が導入されます。この再パラメータ化に加えて、CountsDiffは、これまで計数ベースの領域には存在しなかった、現代的な拡散モデルの特徴を導入します。具体的には、連続時間での学習、クラス分類器なしガイダンス、そして非単調な逆方向軌道を可能にする、チャーン／リマスキング型の逆ダイナミクスが含まれます。私たちはCountsDiffの初期の実装を提案し、それを自然画像データセット（CIFAR-10、CelebA）で検証します。導入した設計パラメータを変化させたときの影響を、複雑で、よく研究され、かつ解釈可能なデータ領域において探ります。次に、生物学的な計数アッセイを自然なユースケースとして取り上げ、胎児の細胞および心臓細胞アトラスにおける単一細胞RNA-seqの欠損補完に対してCountsDiffを評価します。注目すべきことに、この単純な実装であっても、最先端の離散生成モデルおよび主要なRNA-seq補完手法の性能に匹敵する、あるいはそれを上回ることを見出しつつ、今後の研究において最適化された設計選択によってさらなる改善の余地が大きく残されていることを示します。

Black Hat Asia

AI Business

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

日経XTECH

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別

日経XTECH

CountsDiff：自然数上の拡散モデル——計数（カウント）ベースデータの生成と補完

要点

関連記事

Black Hat Asia

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

三井住友カードが「AIオペレーター」 電話で円滑に対話、回答内容は顧客別

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別