ボットなしのAIノートテイカーが、ほぼローカルな環境で現実的に動作できるかどうか、考えていました。
現在は会議には Bluedot を使っています。静かに記録し、通話後に文字起こしと要約を生成しますが、呼び出しにボットを追加することはありません。うまくいきますが、クラウドワークフローであることは明らかです。
私が気になっているのは、同様のものをローカルで再現するのがどれくらい近いのかということです。理論的にはパイプラインは単純そうです:ローカルの文字起こし、要約のためのLLM、そしてアクション項目のための構造化抽出かもしれません。
しかし会議はすぐに混乱しがちです。クロストーク、前回の通話からの文脈、途中で決定を変更する人々。ここで物事が崩れるように見えます。
ここでオープンモデルを用いたローカルのボットフリーAIノートテイカーワークフローを試した人はいますか?
[リンク] [コメント]