DRAFT: エージェントの安全性のためのタスク分離型潜在推論

arXiv cs.LG / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 著者らは、読出しの前に連続的に潜在推論を行うことは、疎な重要証拠による長文脈の監督下での、頑健なエージェント安全性にとって有望な方向性であると結論づけている。