広告

[P] 低リソース言語向けに言語モデルをスクラッチから学習し、GPUなしでAndroid端末上に完全にオンデバイスで動作するようにした(デモ)

Reddit r/MachineLearning / 2026/3/31

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • このプロジェクトBULaMUは、低リソース言語ルガンダ(Luganda)向けに、少ない計算で済む小型の言語モデルをスクラッチから学習します。パラメータ規模は20M、47M、110Mです。
  • 著者は、これらのモデルがGPUなしでもAndroidのスマートフォン上で完全にオフライン動作できると報告しており、オンデバイス推論の制約に対処できていることを示しています。
  • 付随するAndroidアプリE.A.S.T.(Expanding Access to Systems of Learning and Intelligence)により、モデルを端末上で直接操作できます。
  • この取り組みは、低リソース言語の話者や、低電力・低コストなデバイスのユーザーに対してAIのアクセシビリティを高めることを目的として位置づけられています。
  • リソースはGitHub(EASTアプリ)、Hugging Face(BULaMUデータセット/モデル)、およびZenodoにリンクされたモデルのホワイトペーパーで共有されています。

こんにちは、皆さん!私は、現在取り組んでいるプロジェクト「BULaMU(ビュラム)」について近況を共有したいと思います。BULaMUは、低リソース言語であるルガンダ語向けに、(20M、47M、110Mの)パラメータ数を持つ言語モデル群で、すべてを最初から(スクラッチで)学習させています。これらのモデルは小さく、計算効率が高いため、GPUやインターネット接続を必要とせずに、スマートフォン上でオフライン実行できます。私は最近、端末上で直接モデルとやり取りできるAndroidアプリ「E.A.S.T.(Expanding Access to Systems of Learning and Intelligence:学習と知能のシステムへのアクセスを拡張する)」を作りました。これは私のGitHubページで公開しています。これは、低リソース言語の話者や、低電力・低コストのデバイスを使う人々に対して、人工知能をより利用しやすくするという、より大きな取り組みの一部です。

デモ: https://x.com/mwebazarick/status/2038384599320170760?s=46

GitHub: https://github.com/mwebazarick/EAST

Huggingface: https://huggingface.co/datasets/mwebazarick/BULaMU

モデル・ホワイトペーパー: https://zenodo.org/records/17271688

/u/AgencyInside407 から提出されました
[リンク] [コメント]

広告