AffordTissue: ツール動作に特化した組織インタラクションのための高密度アフォーダンス予測

arXiv cs.CV / 2026/4/3

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

AffordTissueは、外科手術の場においてツール動作に特化した安全な組織インタラクション領域を予測するための新しいマルチモーダル・フレームワークであり、胆嚢摘出術向けに高密度のアフォーダンス・ヒートマップを出力します。
この手法は、時間的なビジョン・エンコーダ（ツールの動きと組織のダイナミクスを捉える）と、言語による条件付け（計器・動作の組にまたがって汎化するため）、そして高密度アフォーダンス予測のためのDiTスタイルのデコーダを組み合わせます。
論文では、最初の「組織アフォーダンス」ベンチマークを導入します。103件の胆嚢摘出術プロシージャから、6つのツール・アクション・ペアと4つのインスツルメントをカバーする15,638本のビデオクリップを収集し、アノテーションしました。
実験では、視覚言語モデルのベースラインよりも高密度予測の精度が大幅に優れていることが報告されています（Molmo-VLMでは60.2 pxに対し20.6 pxのASSD）。これは、この高密度の空間推論タスクでは、汎用の基盤モデルよりもタスク特化アーキテクチャが有利であることを示唆します。
インスツルメントが安全に相互作用すべき箇所を明示的に特定することで、AffordTissueは外科手術の自動化における予測可能性を高め、政策（方針）ガイダンスや、予測された領域から動作が逸脱した際の早期セーフ停止を可能にすることが期待されます。

Black Hat Asia

AI Business

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

日経XTECH

エヌビディア、「脱・GPU一本足」へ推論特化チップ「Groq 3 LPU」発表

日経XTECH

Mistralが8億3000万ドルを調達、9finがユニコーン到達、そして新たなTech.euサミット登壇者が発表

Tech.eu

ChatGPTは月額20ドル。代替を2.99ドルで作った。

Dev.to

AffordTissue: ツール動作に特化した組織インタラクションのための高密度アフォーダンス予測

要点

関連記事

Black Hat Asia

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

エヌビディア、「脱・GPU一本足」へ推論特化チップ「Groq 3 LPU」発表

Mistralが8億3000万ドルを調達、9finがユニコーン到達、そして新たなTech.euサミット登壇者が発表

ChatGPTは月額20ドル。代替を2.99ドルで作った。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

エヌビディア、「脱・GPU一本足」へ 推論特化チップ「Groq 3 LPU」発表

Mistralが8億3000万ドルを調達、9finがユニコーン到達、そして新たなTech.euサミット登壇者が発表

ChatGPTは月額20ドル。代替を2.99ドルで作った。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

エヌビディア、「脱・GPU一本足」へ推論特化チップ「Groq 3 LPU」発表