LLM組み込みのローカル漫画翻訳ツール:Rust製でllama.cpp連携

Reddit r/LocalLLaMA / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 新しいオープンソースの漫画翻訳ツール「Koharu」は、物体検出、ビジュアルLLMベースOCR、レイアウト解析、微調整済みインペイントモデルを組み合わせたパイプラインで、漫画(および他の画像)を翻訳して再構成できます。
  • Rustアプリとして作られており、llama.cppを統合しており、Gemma 4系やQwen3.5系に対応し、無修正版やファインチューニング済みモデルも含まれています。
  • OpenAPI互換のAPIを提供しているため、LM StudioやOpenRouterなどのツールから利用できます。
  • ワークフローは基本的にワンクリックで実行でき、さらに生成結果を校正・編集(フォント、サイズ、色の変更など)できるため、ミニPhotoshopのように扱える設計です。
  • 著者はこのパイプラインが高性能かつ使いやすいと主張しており、GitHubでコードを公開しています。
LLMを内蔵したローカル漫画翻訳者。Rustでllama.cppの統合により実装

こんにちは、LocalLLaMAさん、

数週間前に投稿を作成しましたが、今回はこのプロジェクトがより信頼性高くなり、使いやすくなりました。

これは漫画を翻訳できるだけでなく、任意の画像を翻訳するためにも使える翻訳ツールです。物体検出、視覚LLMベースのOCR、レイアウト解析、そして微調整されたインペインティングモデルの組み合わせを使用しています。漫画翻訳のための、最も高性能で使いやすいパイプラインだと思います。

LLM部分については、このアプリケーションに llama.cpp を統合しました。Gemma 4ファミリーとQwen3.5ファミリーをサポートしており、さらに無修正(uncensored)および微調整済みモデルも含まれています。またOpenAPI互換のAPIに対応しているので、LM StudioやOpenRouterなどを使えます。

デモ動画を見るとワークフローがかなり分かります。基本的にはボタンをクリックするだけで、パイプラインを実行してくれます。さらに、フォント、サイズ、色などを変更しながら、結果の校正や編集もできます。ミニPhotoshopエディタです。

興味がある方のために言うと、これは完全にオープンソースです:https://github.com/mayocream/koharu

によって投稿されました /u/mayocream39
[リンク] [コメント]