ComfyUIは、ノードベースのワークフローによって拡散モデルからの画像・動画・音声出力をクリエイターが制御できるよう支援するスタートアップで、評価額5億ドルで3,000万ドルの資金調達ラウンドを実施しました。
このラウンドはCraft Venturesが主導し、Pace Capital、Chemistry、TruArrowなど他の投資家が参加しました。
ComfyUIは、拡散モデルが導入されて間もない2023年にオープンソースプロジェクトとして始まりました。当時、MidjourneyやOpenAIのDALL-Eのようなモデルはほとんどまともに機能しておらず、手に余分な指を追加するなど、重大なミスを頻繁に起こしていました。
これらの制約に対処するため、プロジェクトの創設者たちは、生成プロセスのあらゆるステップに対して細かな制御をクリエイターに提供するモジュール式のフレームワークを開発しました。
このツールは、クリエイティブ分野のプロフェッショナルの間で非常に大きな支持を集めたため、やがて正式なスタートアップへと発展しました。2024年後半、ComfyUIはChemistry Ventures、Cursor Capital、そしてVercelの創業者Guillermo Rauchを含む投資家から、シリーズAで1,900万ドルを調達しました。
最新の拡散モデルは、手に6桁目の情報を付け加すようなことからは長い道のりを経てきましたが、ComfyUIが提供するきめ細かな精度の必要性は、むしろ増しているだけです。
「MidjourneyやChatGPTのような、典型的なプロンプトベースの解決策を考えると、何かを頼むと、それ[が]60%〜80%のところまでしか到達しないんです」と、ComfyUIの共同創業者兼CEOであるYoland YanはTechCrunchに語りました。「でも残りの20%を変えるには、このスロットマシンを試す必要がある。」
Yanは(左に写っている人物)、モデルに小さな変更を指示すると、すでに完璧だった部分を上書きしてしまうなど、まったく別の出力につながり得るため、そのプロセスはカジノで遊ぶのに似ていると比較しました。
ComfyUIのノードベースのインターフェースにより、クリエイターは生成プロセスの特定の構成要素同士をつなげることができ、最終出力の品質を完全にコントロールできます。
「[基盤モデルの]プロンプト欄の中では、そのメッセージを簡単に伝えることはできません」とYanは述べました。
ComfyUIがユーザー数400万人超であると主張していることから、クリエイター側も同意しているようです。
このツールは、映像効果、アニメーション、広告、さらには工業デザインに至るまで、クリエイティブのプロフェッショナルによって使われています。
同社は、この提供内容がテクニカルアーティストやその他のクリエイターにとって、取引上の非常に必要な道具になっており、スタジオの求人掲示板で「ComfyUIのアーティストまたはエンジニア」が職種名として掲載されているのを見るのも珍しくないとしています。
動画や画像の基盤モデルは引き続き改善しているものの、Yanはそれらがまだ完璧ではなく、ComfyUIのようなツールの需要は高止まりしたままだろうと主張しています。
「AIの“手抜き生成物(slop)”がいたるところに出回る世界では、最終的に、人間をループに入れる(human-in-the-loop)アプローチのComfy版が、注目を集める面で大半を勝ち取ることになるでしょう」と彼は言いました。
ComfyUIの競合には、Weavyがあります。Weavyは昨年、Figmaに買収されたスタートアップです。




