私はJanusというプロジェクトに取り組んできました。AI支援による開発システムのためのガバナンス層です。
中核となる考え方はシンプルです:
性能を評価するのではなく、エビデンスとプロトコルへの適合によってガバナンスを評価します。
先日、2本目の論文を公開したところで、理論モデルから測定可能なガバナンスへと前進しました:
エビデンスに基づくモデル(E+/E−)
省略の検出
人間の権限境界
決定論的な再構成
ベンチマーク(ECR、GVL、PVDR)
論文1(モデル):
https://doi.org/10.5281/zenodo.18974356
論文2(検証):
https://doi.org/10.5281/zenodo.19239183
さらに、それを動かしているライブシステムもあります:
https://lluviadeideas-juegosdidacticos.github.io/trivias/
そして、それを実行するためのフレームワーク:
https://framework.janusgovernance.org/
ぜひフィードバックをいただけると大変ありがたいです。特に、オブザーバビリティ、イベントソーシング、またはAIツールに取り組んでいる方からの意見を歓迎します。




