ConntourがGeneral Catalyst、YCから700万ドルを調達――セキュリティ映像システム向けのAI検索エンジンを構築

TechCrunch / 2026/3/26

📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

要点

  • 映像監視スタートアップのConntourは、General Catalystがリードし、Y Combinator、SV Angel、Liquid 2 Venturesが参加する形で、シードラウンド700万ドルを調達。セキュリティ映像システム向けのAI検索エンジンを構築する。
  • 記事は、この資金調達の勢いを、監視における安全性とプライバシーをめぐる議論の激化と結び付けている。具体的には、政府のカメラ網をめぐる論争や、家庭用カメラの機能が法執行機関からの要請を可能にし得る点などが挙げられている。
  • ConntourのCEOは、同社が利用者(クライアント)を選別していると述べる。既存の大口政府・公共の顧客(シンガポールの中央薬物取締局を含む)を活用することで、許可されたユースケースの範囲をコントロールしているという。
  • 今回の資金調達は、ビジョン言語モデルの進歩を、企業や公共の安全監視ワークフローに適用することへの投資家の関心が高まっていることを示唆する。一方で、ガバナンスや法的・倫理的な制約をプロダクトの位置づけの一部として強調している。

監視テクノロジー業界は今日、脚光を浴びていますが、良い理由ではありません。米国の移民・関税執行局(ICE)をめぐっては、Flockのカメラ・ネットワークに接続して人々を監視することに関する論争があり、また家庭用カメラメーカーのRingは、治安当局が住民に自分の近隣で撮影された映像を求められるようにする新機能を構築したことで、批判を集めています。こうした状況のなか、安全性、プライバシー、そして「誰が誰を監視するのか」をめぐって、現在は大きな議論が広がっています。

しかし、論争は市場を消し去りません。さらに、視覚と言語のモデルの継続的な進歩は、事業者が自社の施設内で起きていることを監視する新しい手段を作ろうとする流れに、ますます追い風を吹かせています。

動画監視スタートアップのConntourの共同創業者兼CEOであるMatan Goldnerによると、このテーマに関する倫理観は非常に重要であるため、同社は販売先を選り好みしているほどだといいます。2年にも満たないスタートアップとしては、ビジネス上の合理性があるように見えないかもしれませんが、Goldnerは、Conntourにはすでに複数の大口の政府系顧客と上場企業の顧客があるため、それが可能だと述べています。そのうちの1つが、シンガポールのCentral Narcotics Bureau(中央麻薬取締局)です。

「これほど大きな顧客がいるからこそ、選定できるし、コントロールも維持できます。[…] 私たちは、誰がそれを使うのか、どのようなユースケースなのかを本当にコントロールできます。そして、私たちが道徳的だと思うもの、もちろん法的に問題ないものを選ぶことができます。私たちはあらゆる判断を使い、[協業しても]いいと考える特定の顧客に基づいて意思決定をします。彼らがどう使うかを私たちは知っているからです」と、GoldnerはTechCrunchに行った独占インタビューで語りました。

その勢いは、選別すること以上にもConntourを助けています。投資家も注目しています。同社は最近、General Catalyst、Y Combinator、SV Angel、Liquid 2 Venturesから総額700万ドルのシードラウンドを調達しました。

Goldnerによれば、ラウンドは72時間以内にクローズしたとのことです。「8日くらいで90件ほどの会議を組んだと思いますが、3日ほど経ったちょうどそのあたりで、月曜に始めて水曜の午後には終わっていました」と彼は述べました。

それでもConntourが選り好みするのが正しいのだとしても不思議ではありません。とくに、この領域でAIツールがどれほど強力になったかを考えると、その可能性はさらに高まります。同社自身の動画プラットフォームはAIモデルを使って、セキュリティ担当者が自然言語でカメラの映像フィードにクエリを投げ、映像内のあらゆる物体・人物・状況をリアルタイムに見つけられるようにしています。セキュリティ動画フィード専用に作られた、Googleのような検索エンジンです。さらに、あらかじめ設定したルールに基づいて脅威を自動で監視・検知し、自動的にアラートを出すこともできます。

特定の物体、動きのパターン、あるいは行動を検知するために、事前に定義された分類やパラメータに依存する従来のシステムとは異なり、Conntourは、自社のシステムが自然言語モデルと視覚と言語モデルを使っていると主張しています。これにより、高い柔軟性と使いやすさが得られるのです。ユーザーが「スニーカーを履いた誰かがロビーでバッグを通り過ぎている場面を見つけて」と尋ねると、Conntourのシステムは録画済みの映像すべて、またはライブ映像フィードをすぐに検索して、関連する結果を返します。

Conntourのプラットフォームが稼働している様子のスクリーンショット画像クレジット:Conntour

また、プラットフォームにはAIモデルが組み込まれているため、ユーザーは映像について質問するだけで、関連する映像フィードとともにテキストで回答を得られ、さらにインシデントレポートも作成できます。

ただし同社の売りは、そのスケーラビリティ(拡張性)です。Goldnerは、このプラットフォームは主に、他のAI動画検索サービスと違う点として、数千台のカメラフィードから成るシステムへ効率よくスケールできるように設計されていることを挙げました。実際、彼によれば、ConntourのシステムはNvidiaのRTX 4090のような1台のコンシューマー向けGPUで最大50台のカメラフィードを監視できるとのことです。

同社は、複数のモデルやロジックシステムを使用し、そのうえで、各クエリごとにアルゴリズムがどのモデルやシステムを使うべきかを特定することで、ユーザーに最良の結果を提供するために必要な計算処理能力の最小量で済むようにしています。

Conntourは、自社のシステムはオンプレミスに完全に導入できるほか、クラウド上で完全に運用することも、両方を組み合わせることも可能だと主張しています。既に運用中のほとんどのセキュリティシステムに接続できるほか、それ自体で完全な監視プラットフォームとして機能することもできます。

しかし、映像監視業界には長く続いている問題があります。監視の品質は、記録された映像の出来にしか左右されないということです。たとえば、汚れたレンズを備えた低解像度カメラで撮影された、照明の不十分な駐車場の映像から細部を判別するのは難しいのです。

Goldnerは、Conntourがこの必然性に備えとして、検索結果とともに信頼度スコアを提供していると述べます。カメラ映像の出所の品質が十分でない場合、システムは信頼度が低いレベルの結果を返します。

今後に向けて、Goldnerは、効率を維持しながら、そのシステムにLLMのフルレベルの機能を取り込むことが最大の技術課題だと語ります。

「私たちが同時にやりたいことが2つあって、それらは互いに矛盾しています。ひとつは、何でも聞けるようにするため、LLMのような形で、完全な自然言語の柔軟性を提供したいということです。そしてもうひとつは効率です。つまり、できるだけ少ないリソースを使うようにしたい。なぜなら、[何千]ものフィードを処理することが、またとんでもなく非現実的だからです。この矛盾が、私たちの領域における最大の技術的な障壁であり技術課題であって、私たちは本当に本当に一生懸命、それを解決しようと取り組んでいます。」