更新(4月7日、午後10時30分(PT)): 同社はアプリストアの掲載情報を更新し、Androidアプリへの言及を削除しました。しかし同時に、iOSのキーボードは近日中に提供されるとも付け加えています。
Googleは月曜日、オフライン優先の口述(ディクテーション)アプリである「Google AI Edge Eloquent」を、人気のWispr Flow、SuperWhisper、Willowなどに対抗する形で、iOS向けに静かにリリースしました。
アプリは無料でダウンロードでき、Gemmaベースの自動音声認識(ASR)モデルをダウンロードすれば、スマホでの口述を開始できます。アプリ内ではリアルタイムの文字起こしを確認でき、いったん一時停止すると、アプリが「um」や「ah」のようなフィラー(つなぎ)語を自動的に除去して、テキストを磨き上げます。
文字起こしの下には、「要点」「フォーマル」「短め」「長め」といったオプションが用意されており、テキストを変換できます。

クラウドモードをオフにして、ローカルのみの処理を使うこともできます。 (クラウドモードがオンの場合、アプリはテキストのクリーンアップにクラウドベースのGeminiモデルを使用します。)また、Google AI Edge Eloquentは、必要に応じてGmailアカウントから特定のキーワード、名前、専門用語などを取り込めます。さらに、独自の単語をリストに追加することも可能です。
アプリは文字起こしセッションの履歴を表示し、そこからすべて検索できるようにもしています。直近のセッションで入力した単語、1分あたりの単語数(WPM)、および話された単語の総数も表示できます。
同社のApp Storeの説明には、「Google AI Edge Eloquentは、自然な話し言葉と、プロがすぐに使える文章とのギャップを埋めるために設計された、先進的な口述アプリです。発話のつまずきやフィラー語をそのまま書き起こす一般的なディクテーションソフトとは異なり、EloquentはAIを使って意図した意味を捉えます。「えー」「あのー」といった言い淀みや、文中での自己修正を自動的に取り除き、きれいで正確な文章を出力します」と記載されています。

現時点ではこのアプリはiOSでのみ利用可能ですが、App Storeの説明にはAndroid版への言及があります。 (詳細についてGoogleに問い合わせており、回答があれば本記事を更新します。)
説明によると、Eloquentは「シームレスなAndroid連携」を提供し、ユーザーが既定のキーボードとして設定すれば、あらゆるテキストフィールドでシステム全体にアクセスできるとのことです。さらに、アプリは浮かぶボタン機能も使えるようになり、Wispr FlowがAndroidで使っているものと同様に、どこからでも文字起こしに簡単にアクセスできるようになります。
AI搭載の文字起こしアプリは、音声から文字へのモデルが向上するにつれて、ユーザーの間で人気を集めています。この実験的なアプリでは、Googleがトレンドに参入しています。このテストが成功すれば、Androidでも文字起こし機能がより良くなるのを目にできるかもしれません。



