機密文書のためのリトリーバル拡張型分類（Retrieval Augmented Classification）

arXiv cs.AI / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本論文は、機密文書を分類しつつ漏えいを最小化するための Retrieval Augmented Classification（RAC）を提案する。具体的には、機密性のあるコンテンツでモデルの重みを更新するのではなく、外部のリトリーバル／ベクターストアに基づいて判断を行うことで、漏えいリスクを抑える。
現実的なシーケンス長の制約下で、WikiLeaks の米国外交資料コーパスを用いた実験では、RAC はバランスの取れたデータにおいて教師あり微調整（FT）と同等の性能を示す一方、アンバランスなデータではより安定している。
報告されている結果では、RAC は元のアンバランスなデータセットおよび増補したバランスのデータセットの両方で約 96% の精度を達成し、適切なプロンプト設定により最大で 94% の F1 を示す。一方、FT はクラス不均衡の設定間での汎化が弱い。
RAC は、統制された運用（governed deployment）により実用的であると位置づけられている。再インデックス（reindexing）により新しいデータを組み込めるため再学習が不要であり、クラスバランス、コンテキスト長、ガバナンス要件の変化に対して頑健であるよう設計されている。
著者らは、RAC の分類パイプラインと評価レシピ、クラス不均衡とコンテキスト長の影響を切り分ける実験的研究、ならびにセキュリティを保護する制御環境における RAC の設計指針を提供する。

もるこ🍒🐈スマホで1日10分副業🎵AI（ChatGPT）活用で月収10万円を目指す！

note

現状AIはどれくらいの速度で進化しているのか

note

Copilotと物語を作ってみた #225 幼馴染は今日も「あなたの子を身籠ったの」と言う

note

『女性の社会進出と少子化』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その陸拾貳

note

たとえ自分が損をしなくても、AIエージェントは協力を渋る？

note

機密文書のためのリトリーバル拡張型分類（Retrieval Augmented Classification）

要点

関連記事

もるこ🍒🐈スマホで1日10分副業🎵AI（ChatGPT）活用で月収10万円を目指す！

現状AIはどれくらいの速度で進化しているのか

Copilotと物語を作ってみた #225 幼馴染は今日も「あなたの子を身籠ったの」と言う

『女性の社会進出と少子化』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その陸拾貳

たとえ自分が損をしなくても、AIエージェントは協力を渋る？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

もるこ🍒🐈スマホで1日10分副業🎵AI（ChatGPT）活用で月収10万円を目指す！

現状AIはどれくらいの速度で進化しているのか

Copilotと物語を作ってみた #225 幼馴染は今日も「あなたの子を身籠ったの」と言う

『女性の社会進出と少子化』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その陸拾貳

たとえ自分が損をしなくても、AIエージェントは協力を渋る？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『女性の社会進出と少子化』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その陸拾貳