完全観測可能な非決定論的問題における状態の安全性を決定するアルゴリズム：技術報告書

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、TarjanSafe の最良ケースの性能と完全観測可能な非決定論的問題における安全性検査のための最悪ケースを多項式時間で保証する性質を組み合わせた、ポリシー反復アルゴリズム iPI を導入している。
安全性を、ある状態から安全な方策が存在するかを決定することとして定義し、欠陥を安全から安全でないへ遷移する状態-行動ペアとして同定する。
TarjanSafe は最悪ケースが指数時間の実行時間を要する。線形時間の代替手段が存在するが、実務上は遅い。これに対して iPI は最悪ケースの性能を多項式時間で達成し、好条件下では TarjanSafe の実用的効率に匹敵する。
実験の結果、iPI は TarjanSafe に適合する問題に対して TarjanSafe に匹敵し、TarjanSafe が適さない問題でははるかに良いスケーリングを示し、手法の堅牢性を確認している。

要旨: 学習されたアクションポリシーは逐次意思決定でますます人気が高まっていますが、安全性の保証が欠如しているという課題があります。最近の研究では、初期状態とアクション結果の非決定性の下でこのようなポリシーの安全性を検証するパイプラインが導入されました。パイプラインの中核には、安全である状態を決定する問題（その状態から安全なポリシーが存在するか）と、欠陥を特定する問題、すなわち安全な状態から安全でない状態へ遷移する状態-アクションの組を見つける問題があります。安全性を決定する最も有効なアルゴリズムである TarjanSafe は、ベンチマーク上で有効ですが、私たちはそれが状態空間に対して指数関数的な最悪ケースの実行時間を持つことを示します。線形時間の代替手段も存在しますが、実務上は遅いです。このギャップを埋める新しいポリシー反復アルゴリズム iPI を提案します。これにより、両者の長所を組み合わせます。すなわち、TarjanSafe の最良ケースの実行時間に匹敵しつつ、最悪ケースは多項式で保証します。実験は我々の理論を裏付け、TarjanSafe に適した問題では iPI が同様の性能を示す一方で、適さない問題では iPI が指数関数的により良くスケールします。

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

Innovatopia

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

GIGAZINE

完全観測可能な非決定論的問題における状態の安全性を決定するアルゴリズム：技術報告書

要点

関連記事

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer