AI Navigate

Claude Code、Whisper、CalDAVを使って自動化されたコールからタスクへのパイプラインを構築した

Dev.to / 2026/3/13

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • Cursor + Claude Code、Whisper、CalDAVを使い、セットアップ後は手作業ゼロで作業コールを整理されたタスクへ自動変換する自動化パイプラインを構築しました。
  • アーキテクチャは Krisp で録音された音声を取得・ダウンロードし、CalDAV を介して Yandex Calendar で意味のある [YYYY-MM-DD] タイトルにファイル名を変更、ローカルで Whisper で文字起こし、LLM でアクションアイテムを抽出し、Obsidian と YouTrack の間で同期します。
  • cron によって毎日23:00に実行され、1日3〜5件のコールを処理して、日々のオーバーヘッドを数時間削減します。
  • 重要な注意点は Krisp の Arc-prefix ファイル名が検索を難しくするため、カレンダーべースのリネームは下流のステップには不可欠で、著者はロシア語の転写品質と速度のバランスを取るため Whisper の medium を選択しました。

私は自分の自動化をコードするプロダクトマネージャーです。3週間前、Cursor + Claude Code を手に入れ、未加工の音声からプロジェクト管理ツールの整理されたタスクへと処理するパイプラインを構築しました。セットアップ後は手作業ゼロ。

以下がアーキテクチャ、意思決定、そして注意点です。

問題

各作業コールの後、私は 30-40 分を費やしていました:

  • 重要な瞬間の振り返り
  • メモの作成
  • トラッカーにタスクを作成
  • それらを適切なプロジェクトに割り当てる

1日あたり3-5回のコールを掛けると、それは2-3時間の純粋なオーバーヘッドです。毎日です。

アーキテクチャ

Krisp (audio recording)
    │
    ▼
Download script (Krisp API)
    │
    ▼
CalDAV → Yandex Calendar → File rename
    │
    ▼
Whisper medium (local) → Transcription
    │
    ▼
LLM → Action item extraction
    │
    ▼
┌───┴───────────────────────┐
▼                           ▼
Obsidian (inbox)  ◄─────►  YouTrack (tasks)
                  bidirectional
                  sync

毎日 午後11時 に cron で実行され、朝には結果が整います。

ステップ1:Krisp での録音

Krisp は全ての通話でバックグラウンドで動作します。特に派手なことはなく、ただ録音します。

厄介な点: Krisp は Arc — Meeting — 2026-02-20 のようなファイル名を付けます。私は Arc ブラウザを使っているので、すべてのファイルは Arc. で始まります。50 個もあれば検索は大変です。

ステップ2:Krisp からのダウンロード

スクリプトが Krisp から音声ファイルを取得します。副次的な利点として、Advanced の機能を使わなくても、Claude が転写と要約を処理します。

ステップ3:カレンダー基準のリネーム(CalDAV)

これが他のすべてを機能させるステップです。意味のあるファイル名がなければ、残りのパイプラインは盲目に動きます。

すべての作業コールは Yandex Calendar(私たちの企業プラットフォーム)に保存されています。スクリプトは:

  1. Krisp の録音 ID からタイムスタンプを抽出します。Krisp は UUIDv7 を使用します — 最初の12桁の16進文字はUnix時間をミリ秒でエンコードします。その場で信頼できる日付と時刻のソースになります。
  2. CalDAV を通じて Yandex Calendar を照会し、対応するイベントを見つけます。
  3. ファイル名を [YYYY-MM-DD] [カレンダーからの会議名] に変更します。

すべての録音には、実際の会議に結びついた検索可能で意味のある名前が付きます。簡単ですが重要です。

ステップ4:ローカル Whisper 文字起こし

Whisper medium モデルをローカルで実行します。なぜ medium なのか:

  • ロシア語には十分な精度がある
  • 比較的高速
  • Krisp の組み込みロシア語転写よりはるかに優れている(正直なところ、あまり良くありません)

出力は全文を含む Markdown ファイルとして保存されます。

ステップ5:アクションアイテム抽出

LLM が文字起こしを処理し、次を抽出します:

  • 会議で議論された具体的なタスク
  • 担当者(言及された場合)
  • タスクが属するプロジェクト

アクションアイテムの構造化リスト、トラッカー用に準備完了。

ステップ6:Obsidian + YouTrack 同期

アクションアイテムは私の Obsidian 受信箱に落ちます。Obsidian は Cursor と同じ作業スペースに接続されているため、すべてが同期されます。

Obsidian から YouTrack へタスクを送る:

  • 各アクションアイテムは対応するプロジェクトのサブタスクになります
  • Obsidian で完了をマークすると YouTrack でも完了として閉じられます
  • Obsidian でコメントすると YouTrack にも複製されます
  • 双方向: いずれかのシステムでの変更はもう一方へ伝播します

日次実行

すべて cron によって午後11時に実行されます:

  1. Krisp から新しい録音をダウンロード
  2. カレンダー照合を使ってファイル名を変更
  3. Whisper で文字起こし
  4. アクションアイテムを抽出
  5. 受信箱と YouTrack を同期(新規 → 作成、完了 → クローズ)

朝には、昨日のコールが処理・整理されています。私は受信箱を開いて、すぐに作業を開始します。

What I’d Do Differently

リネームのステップから始める。 初めは Krisp の元の名前でファイルを処理してみました。Arc — Meeting だけではプロジェクトの文脈を把握できません。カレンダー照合を最初に作るべきでした。

日から PDF の OCR を行う。 私は月次リサーチパイプラインも作りました(PDF ダイジェスト → 分析)。OCR なしの PDF からテキストへの変換はひどいものでした。OCR を追加することが転換点となり、すぐに実装すべきでした。

Beyond Calls: Monthly Research Pipeline

別件として、モバイルゲームとゲーミフィケーションの市場調査用の自動月次リサーチシステムを構築しました:

  • Telegram チャンネル + 内部チャットからの PDF ダイジェスト → OCR → Markdown
  • 私が書いた 4-document 手法論を用いたLLM分析(リサーチ指示、プロセス、地域別の検証済みソース登録、集約ルール)
  • 地域別に検証されたソース(中国専用のカバレッジを含む。公的データが乏しいため別のソース検証が必要)
  • 毎月1日の自動生成

同じ原則: 方法論を明確に定義し、実行を自動化し、出力をレビューする。

結果

指標
通話後の作業1回あたり 30-40 分0 分
月次リサーチ2-3 日分自動生成
バックログのタスク数週間詰まる時間単位
全体のルーティン通常約5倍の削減

What’s Next

  • プリセール用プレゼン資料ドラフトを自動生成(会社パターンを Claude に学習させる)
  • 月次リサーチレポートからの短いプレゼンテーション
  • AIエージェントを始めたい人のための入門コース、どこから始めればよいか分からない人向け

同様の個人用自動化パイプラインを作成したことがある方は、あなたのアーキテクチャはどうですか? 何が機能し、何が壊れますか? ノートを交換してみたいです。