スノーフレイクのマネージャーがAIエージェントのデータアクセスに関する「スパイダーマン理論」を説明
優れたデータへのアクセスには、重大な責任が伴う
スノーフレイクは、より多く、より良いAIエージェントを構築する際の最大のボトルネックは、モデルそのものではなく、エージェントが依存するデータが「クリーンで、利用可能で、ガバナンス(統制)が効いているかどうか」だと賭けている。スノーフレイクのプロダクトマネジメント担当ディレクターであるJames Rowland-Jones氏がThe Registerに語った。
同氏は、この課題を解決するために、同社がオープンな標準により一段と注力していると述べた。
今週のApache Iceberg Summitを受けて、Rowland-Jones氏は、スノーフレイクがApache Icebergのオープンなテーブル形式を軸に構築された「完全に相互運用可能なスタック」に向けて取り組んでいると語った。
「実質的には、データに支えられたAIプラットフォームと、AIによって動くデータプラットフォームがあるんです」同氏は言う。「しかしAIの時代にそれを機能させるには、非常に簡単かつアクセスしやすい形で取り出せるデータのまとまりを用意できる必要があります。そこで、相互運用性の物語が本当に始まるのです。というのも、ますますデータのコピーを1つだけ持つ必要が出てくるからです。」
トークンコストを削減し、AIエージェントのパフォーマンスを向上させるには、エージェントに明確で首尾一貫した一連のコンテキストを提供する必要があり、それは統一されたガバナンスのレイヤー経由でデータが利用可能である場合にのみ実現できる、と同氏は言う。
しかし、データアクセスを拡大すれば、新たな責任も生まれる。同氏はそれを「スパイダーマンの物語」と呼んだ。
「もし私があなたにデータへのダイレクトなアクセスを与えるなら、そのデータに対して責任ある形で行動できる必要もあるのです」とRowland-Jones氏は語った。
返却形式: {"translated": "翻訳されたHTML"}彼はアイスバーグRESTカタログ仕様と、彼が「技術に中立で、標準に基づくデータアクセス」と表現したものの土台としての、安全なベンダー認証情報の活用を指し示した。
「つまり、データの土台を Apache Iceberg のような相互運用可能な形式や標準に置き、Iceberg REST のような標準を使い、さらにそのデータへのアクセスを実現するためのガバナンス層として Apache Polaris ベースのものを使っているなら、やっていることは、顧客がその後、ほかのエンジンを取り付けて、いわゆるマルチリーダー、マルチライターによる、そのデータへの適切な領域への直接のアクセスを可能にすることです。つまり、Snowflake のコンピュートエンジン経由であろうとなかろうと関係なく、です」と彼は述べた。
Rowland-Jones によれば、Snowflake の構想は、Amazon S3 のようなクラウド・オブジェクト・ストレージに保存されたデータへのアクセスを、アクセスするコンピュートエンジンが Snowflake 自社のものであっても、Apache Spark のような第三者のものであっても、とにかく可能にすることだ。
「妥協なき相互運用性」と Rowland-Jones は述べ、目的は、同一の基盤データに直接アクセスするほかのエンジンもサポートしながら、顧客が Snowflake のガバナンス機能を利用できるようにすることだと説明した。
- Snowflake の継続的な売り込み: データを AI に持っていくのではなく、AI をデータへ
- Snowflake、PostgreSQL を自社の AI Data Cloud に接続
- Snowflake のアップデートが世界中で大規模な障害の吹雪を引き起こした
- Snowflake、Observe を買収して「直近の障害までの日数」カウンターを時代遅れにする
ロードマップには、Iceberg v3 サポートの一般提供、Snowflake Horizon Catalog を通じたあらゆるエンジンでの相互運用可能な読み書き、そして Iceberg テーブル向けの Snowflake 管理のストレージ機能が含まれている。
「私たちは、Iceberg コミュニティに対して貢献すること、そしてそこから得る恩恵の両方について、非常に強い情熱を持っています」と Rowland-Jones は述べた。「私たちは、オープンソースは双方向の取り組みだと考えています — ただ消費するだけではいけません」
彼は、Snowflake が現在 Iceberg v3 でパブリックプレビュー段階にあり、Rowland-Jones が「ベンダー間でおそらく最も広範な Iceberg v3 仕様のカバー範囲」と呼ぶ状況だと述べた。
「私たちには、非常に非常に強い関心があると思います。Snowflake の顧客だけでなく、その実装を見ることへのエコシステム全体の関心もです」と彼は The Register に語った。「その一例として、ほかのベンダーでさえも、今すでに Snowflake に接続して Iceberg v3 を消費できるようになっています。そして私たちは、それを現実のものにするために、顧客やコミュニティと非常に密接に協力しています。」 ®


