デスクトップスクリーンショットツールにAIによる自動レダクションを組み込むまでの道のり

Dev.to / 2026/4/8

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • この記事では、snpit.app という Windows/macOS 用のデスクトップ向けスクリーンショット美化ツールを紹介し、メールアドレス、電話番号、IP、シリアルキーなど一般的な機密情報をワンクリックで自動レダクションできるようにします。
  • 自動レダクションは、ローカルで OCR(Tesseract.js)を実行し、さらに正規表現によるマッチングを行ったうえで、検出された機密テキストを黒いバーで覆うことで実現します。
  • ダーク背景でのOCR精度を高めるために、マルチパスでスキャン(元画像、その反転、ハイコントラストのしきい値処理)を行い、結果を統合・重複排除します。
  • 自社独自やプロプライエタリな機密形式向けには、ユーザーが見つけたい内容を平易な英語で説明すると、システムがレビュー可能な正規表現パターンを生成するAI支援のワークフローを備えています。
  • さらに、エラー特定、要約、代替テキスト生成などの用途に対応した自己ホスト型のAI Visionチャットを搭載し、スクリーンショットがログに記録されないようにローカル/自己ホストでの処理を重視しています。

スクリーンショットはいたるところにあります――ドキュメント、バグレポート、Slack、ツイート。そして半分の確率で、メールアドレス、
IPアドレス、またはAPIキーがそのまま露出しています。

私は https://snpit.app を作りました。WindowsおよびmacOS向けのスクリーンショット美化ツールです。これは、まず
スクリーンショットをきれいにするためのツールとして始まりました(グラデーション背景、注釈、エクスポート)。しかし、人々がずっと
求めているのは自動レダクトです。

仕組み

  1. 画面上の任意の領域をキャプチャ
  2. AIレダクトボタンをクリック
  3. OCRが画像をスキャンし、正規表現パターンで機密データを照合
  4. 黒いバーで一致箇所をすべて覆う

組み込みのパターンが、メールアドレス、電話番号、IP、シリアルキーを処理します。

ダーク背景の問題

Tesseract(OCRエンジン)は、明るい背景上の暗い文字を読むのが得意です。ですが、暗い
背景に白い文字は?――それだと見落としてしまいます。

そこで私はマルチパススキャンを追加しました。すべての画像は3回処理されます:

  • オリジナル――通常のテキストをキャッチ
  • 反転――すべてのピクセルを反転し、白(暗背景)を黒(明るい背景)に変える
  • 高コントラストのしきい値――128で純粋な白と黒に変換

結果は統合され、重複が取り除かれます。これが、クレジットカードのスクリーンショットが実際に機能するようにした要因です。

カスタム正規表現 + AI生成

組み込みのパターンは一般的なものをカバーしています。ですが、社内のチケットID、
独自のAPIキーの形式、またはプロプライエタリなコードはどうでしょう?

ユーザーに正規表現を書いてもらう代わりに(誰もやりたくないです)、AIボタンを追加しました。
探したい内容を普通の英語で説明します:

▎「AWSアクセスキー」

AIが正規表現パターンを生成します。確認、テスト、再利用のための保存、または1回だけ実行もできます。

AIビジョン

さらに、スクリーンショットを読み取る内蔵AIチャットもあります。次のように聞けます:

  • 「表示されているエラーは何?」
  • 「このスクリーンショットのテキストを要約して」
  • 「この画像のaltテキストを生成して」

セルフホスト型モデルで動作し、応答をストリーミングし、会話の文脈を保持します。

構成

  • デスクトップアプリ:Electron + React + Fabric.js
  • OCR:Tesseract.js v7(ローカルで動作、クラウドなし)
  • AI:プライベートモデル――ログは記録されません。
  • バックエンド:Laravel 12 + Stripe + Cloudflare R2
  • Webサイト:https://snpit.app

すべてがローカルで動作します。クラウドへ明示的に公開しない限り、スクリーンショットは決してあなたのマシンから出ません。

試してみる

無料でダウンロード、コア機能は無料で利用できます:https://snpit.app/download

機密データを含むスクリーンショットを扱っているなら、レダクション
精度について本当にフィードバックが欲しいです。特にエッジケース――変わったフォント、低コントラスト、珍しい形式。