PixelClaw:画像編集向けのLLMエージェント

Reddit r/artificial / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • PixelClawは、画像操作に特化した無料・オープンソースのLLMエージェントで、会話・計画・ツール活用を1つのワークフローにまとめています。
  • 複数のLLMバックエンドに対応し、推論にはそれらを利用しつつ、gpt-imageによるAI支援の画像生成/編集機能を備えています。
  • background removal(rembg)、ピクセル化(pyxelate)などの実用的な編集機能に加え、独自アルゴリズムによるポスタリゼーションやデフリンジングも提供します。
  • speech-to-text(Whisper)と、Kokoro+HALOプロジェクトによるテキスト読み上げにより、マルチモーダルな入出力も可能です。
  • RaylibベースのUIも用意され、ファイルのドラッグ&ドロップなどの機能や、デモ動画、GitHubリポジトリでの提供も行われています。
PixelClaw: an LLM agent for image manipulation

私は画像処理に特化したLLMエージェントを作っています。これは次のものを組み合わせています:

  • 会話、計画、ツールの使用のためのLLM(さまざまなLLMに対応)
  • gpt-imageによる画像生成/AIベースの編集
  • rembgによる背景の除去(いくつかの専用モデルがあります)
  • pyxelateによるピクセル化
  • 独自アルゴリズムによるポスタリゼーションと色ずれ(フリンジング)の除去
  • 音声認識(Whisper)と音声合成(Kokoro plus HALO
  • Raylibに基づく使いやすいUI(ファイルのドラッグ&ドロップを含む)

PixelClawはhttps://github.com/JoeStrout/PixelClaw/で無料かつオープンソースです。こちらでも追加のデモ動画を見つけられます。ページにいる間に、もし面白いと思ったら、上部の⭐️をクリックしてください。そうすると関心度の目安になります。

投稿者 /u/JoeStrout
[リンク] [コメント]