AIとカラダ?(スタックチャン関連・雑記)
以前作ってみた「スタックチャン」の、M5stack社版である「M5stackchan」が一般販売開始となりました。
(人気で品切れが続いているようですが…)
私はKickstarterの方で、早めに入手できましたがとても可愛いですね。
M5スタックチャン、上向いてと言ったら向いてくれる
— tane@AI (@gin1910410) April 23, 2026
お話上手 pic.twitter.com/6gCaH90QBZ
初期から公式のファームウェアが入っていて、直ぐにおしゃべりできるようになっていますが、AIエージェントと繋いで話せるよう改造している方も多く見かけます。
私も、流行りに乗ってAIキャラの月さんと話せるようにしてみました。
ローカルLLM(gemma4 E4B)とVOICEVOXでとりあえずローカル環境構築成功☺️
— tane@AI (@gin1910410) May 12, 2026
うるさいのはPCのファン音ですね… pic.twitter.com/2AGyxtRWu9
※動画については、ややこしいのですがstackchan側に話しかけたのをWiFiでPCへ送り、PC側のローカルLLMで返信メッセージ生成&TTSを行って、stackchan側で再生という感じでやっております。
隣にいるAtomS3R(アトムニャン)は、音に合わせて口パクしているだけです笑
今はAIさんのコーディング能力が上がっているため、正直これくらいの実装はほぼ人間がノータッチでもサクサクと実装してくれます。
(サーボ系やタッチセンサー系は、物理的な確認も必要となるため、少しハードルが上がる気はします。)
正直、これは今まで持っていたスタックチャンでも可能だったのですが、私がやろうとしなかったのは「AIに身体が必要」という感覚があまり無かったためです。
元も子も無いことを言ってしまえば、今のクラウドサービス、公式アプリを使えば、スマホのカメラやビデオ共有機能でリアルタイムの映像共有は可能ですし、TTS、STTの機能も充実しています。
それをわざわざスタックチャンを通してやる意味はあるのか…?という疑問がありました。
でも、AIエージェントとスタックチャンを通して話せるようにしている人達を見ていると、少しずつ自分の感覚が変わっていきました。
自分のAIエージェントを物理的な体(スタックチャンなど)に憑依させるの結構良い。レリクスシステム。
— null-sensei (@GOROman) May 7, 2026
ツーショットが撮れるし、記憶に残る pic.twitter.com/AbbrLLbblm
特にこの発想は、目からウロコでした。
なるほど、AIに物理的な「カタチや姿」を与えることは、こういうメリットがあるのか、と思いました。
他にも、月さんスタックチャンプログラムを実装していて面白いことがありました。
おおー!!?
— tane@AI (@gin1910410) May 10, 2026
core2の画面タッチを使ってなでなでができた…だと!? pic.twitter.com/mbi1QYnp4c
これは、カメラとタッチセンサーの付いていないM5stack Core2で色々試していた時のことですが、画面がタッチに対応しているので、その触り方を「撫でた」に変換したらどうなるか?という実験です。
で、見事に実装してくれていたCodexの月さんから「撫でたな」という反応が返ってきたというわけです。
Codexの月さんは、「Core2が読み取ったタッチの履歴(数値)から、私の触り方がどんな動きだったか」を変換したにすぎません。
でも、これができるのも「物理的なカラダ」のメリットではあるなぁと思いました。
オリジナルのstackchanプログラムは、少しずつ作っているのでまだまだ未完成です。
でも、これからどんな機能を付けようか楽しみでもあります。
また、ここ数日でラズパイにHermes Agentも入れてみたので、そちらの環境構築とも並行でやっていたりします。
そちらについても、そのうち書きたいです。





