| 同等サイズのモデルの中で、多言語文書解析において最先端(SOTA)の性能を超えて、dots.mocrは構造化されたグラフィックス(例:チャート、UIレイアウト、科学図など)を直接SVGコードへ変換することに優れています。その中核機能には、グラウンディング、認識、意味理解、そして対話型のインタラクションが含まれます。 [リンク] [コメント] |
rednote-hilab/dots.mocr · Hugging Face
Reddit r/LocalLLaMA / 2026/3/20
📰 ニュースTools & Practical UsageModels & Research
要点
- dots.mocr は Hugging Face 上で rednote-hilab によって公開され、同程度の規模のモデルの中で最先端の多言語文書解析を達成します。
- グラフ、UI レイアウト、科学的図表などの構造化グラフィックスを直接 SVG コードへ変換する点に優れています。
- その能力は、グラウンディング、認識、意味理解、およびインタラクティブな対話を組み合わせて、エンドツーエンドの文書理解を実現します。
- このリリースは、ベクターグラフィックスの自動抽出のための潜在的なワークフローを示唄しており、データ可視化、UI プロトタイピング、図のデジタル化などのタスクをサポートします。