| 私は画像処理に特化したLLMエージェントを作っています。これは次のものを組み合わせています:
PixelClawはhttps://github.com/JoeStrout/PixelClaw/で無料かつオープンソースです。こちらでも追加のデモ動画を見つけられます。ページにいる間に、もし面白いと思ったら、上部の⭐️をクリックしてください。そうすると関心度の目安になります。 [リンク] [コメント] |
PixelClaw:画像編集向けのLLMエージェント
Reddit r/artificial / 2026/4/22
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research
要点
- PixelClawは、画像操作に特化した無料・オープンソースのLLMエージェントで、会話・計画・ツール活用を1つのワークフローにまとめています。
- 複数のLLMバックエンドに対応し、推論にはそれらを利用しつつ、gpt-imageによるAI支援の画像生成/編集機能を備えています。
- background removal(rembg)、ピクセル化(pyxelate)などの実用的な編集機能に加え、独自アルゴリズムによるポスタリゼーションやデフリンジングも提供します。
- speech-to-text(Whisper)と、Kokoro+HALOプロジェクトによるテキスト読み上げにより、マルチモーダルな入出力も可能です。
- RaylibベースのUIも用意され、ファイルのドラッグ&ドロップなどの機能や、デモ動画、GitHubリポジトリでの提供も行われています。




