LLMベースのセマンティック・プロトタイプ最適化によるゼロショット分類のための反復的定義精緻化

arXiv cs.CV / 2026/5/1

📰 ニュースSignals & Early TrendsModels & Research

共有:

要点

本論文はWebフィルタリング向けのゼロショットWebコンテンツ分類を扱い、埋め込みベースの手法はカテゴリ定義の指定のされ方に強く影響され、定義が曖昧だと埋め込み空間での意味の重なりが生じて誤分類につながると述べています。
モデル自体のパラメータを更新せず、カテゴリ定義を段階的に改良することで分類精度を高める、学習不要の適応的反復定義精緻化フレームワークを提案しています。
例ガイド型、混同行動（confusion）対応型、履歴活用型の3つの精緻化戦略を検討し、誤分類インスタンスから得られる構造化された信号を用いてクラス記述を改善します。
人手でラベル付けしたベンチマーク（URLカテゴリ10種、各1,000サンプル）を公開し、13の最先端埋め込み基盤モデルで評価した結果、幅広いアーキテクチャで一貫して性能が向上することを示しています。
定義品質が、埋め込みベースのゼロショット・システムにおける重要かつ十分に掘り下げられてこなかった要因であることを強調し、データセットを公開して追試・発展を可能にしています。

要旨: Webフィルタリングシステムは、サイバー脅威を遮断し、データの不正な持ち出しを防止し、コンプライアンスを確保するために、正確なWebコンテンツの分類に依存している。しかし、現代のWebが動的かつ急速に進化している性質により、分類はますます困難になっている。埋め込みベースのゼロショット手法は、コンテンツとカテゴリの説明文を共有された意味空間に写像することで、ラベル付きの学習データなしでラベル付与を可能にするが、定義の品質に対して非常に敏感である。不適切に指定された、または曖昧な定義は、埋め込み空間に意味の重なりを生み出し、その結果として体系的な誤分類が生じる。
本論文では、モデルのパラメータを更新するのではなく、カテゴリーの定義を段階的に最適化することで、ゼロショットのWebコンテンツ分類を改善する、学習不要の適応的反復定義洗練（refinement）フレームワークを提案する。フィードバックに基づく定義オプティマイザとしてLLMを用い、すなわち、例ガイド型、混同（confusion）対応型、履歴（history）対応型の3つの洗練戦略を調査し、それぞれが誤分類された実例から得られる構造化された信号を用いてクラスの記述文を洗練する。さらに、各クラス1,000サンプルを含むURLカテゴリ10種について、人手でラベル付けしたベンチマークを導入し、13の最先端の埋め込み基盤モデルにわたって評価を行う。結果は、反復的な定義洗練が、多様なアーキテクチャにわたって一貫して分類性能を向上させることを示しており、定義の品質が埋め込みベースのシステムにおいて重要でありながら十分に検討されていない要因であることを明らかにする。データセットは https://github.com/naeemrehmat/B2MWT-10C で公開されている。

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

日経XTECH

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

Dev.to

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

ITmedia AI+

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

Reddit r/artificial

NVIDIA Nemotron 3 Super Buildコンテストの発表

Dev.to

LLMベースのセマンティック・プロトタイプ最適化によるゼロショット分類のための反復的定義精緻化

要点

関連記事

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

NVIDIA Nemotron 3 Super Buildコンテストの発表

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIの次に来る技術、投資データで浮き彫りに ランキング上位を徹底解説

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？ 開発者に聞く “文字化け解消”の秘訣

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

NVIDIA Nemotron 3 Super Buildコンテストの発表

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣