皆さん、こんにちは、
しばらくの間、気になっていることの一つは、LLMの回答が自信を持っているように聞こえても、間違っていることがあるという点です。
それに対処するために、もともと自分用に小さなスクリプトを書きました。同じプロンプトを複数のLLMに送信し、次に別のモデルを用いて回答を統合して最終的な答えを作る、というものです。このワークフローは意外にも有用だと感じました。特に、結果に自信を持ちたいとき、1つのモデルをあまり早く信頼しすぎるのを避けたいときに役立ちました。
最近、そのワークフローを小さなiOSアプリに変換し、無料で公開しました。
いくつかのお知らせです:
複数の主流LLMプロバイダーをサポートしています。自分のAPIキーで設定できます。
目的はあくまで“モデル比較”そのものではなく、幻覚を減らし、回答を照合しやすくすることです。
アプリ自体は軽量で、現在1MB未満です。
入力を私のバックエンドを経由せず、設定済みのLLMプロバイダーへ直接送るように設計されています。
もし気になる方がいれば、App Store で teramoby を検索すると簡単に見つかるはずです。
このようなマルチモデルワークフローが実際に実用的かどうか、特にフィードバックをいただけると嬉しいです。




