広告

IBM、Granite 4.0 3B Visionをリリース:企業グレードの文書データ抽出のための新たなビジョン・言語モデル

MarkTechPost / 2026/4/2

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • IBMは、企業グレードの文書データ抽出を目的としたビジョン・言語モデル(VLM)であるGranite 4.0 3B Visionのリリースを発表した。
  • このモデルは、単一のモノリシックなマルチモーダルシステムではなく、専用のアダプタとして設計されており、高精細な視覚推論の提供を目指している。
  • Granite 4.0 Visionは、Granite 4.0 Micro言語バックボーンを基盤に構築され、文書理解と、基盤となる言語モデルの企業向けの文脈を組み合わせている。
  • 今回の発表では、本リリースを、生産環境における文書からの構造化情報抽出により焦点を当てたアプローチとして位置づけている。
  • アダプタベースの設計は、大規模なマルチモーダル・アーキテクチャにスケールアップすることなく、文書抽出を改善していくためのモジュール化された道筋を示唆している。

IBMは、企業レベルの文書データ抽出のために特別に設計された、視覚と言語のモデル(VLM)「Granite 4.0 3B Vision」の提供開始を発表しました。より大規模なマルチモーダルモデルのモノリシックなアプローチから一歩踏み出し、4.0 Visionのリリースは、Granite 4.0 Microの言語バックボーンに高精細な視覚推論をもたらすことを目的とした、専用のアダプタとして構成されています。このリリースは[…]

この記事IBM Releases Granite 4.0 3B Vision: A New Vision Language Model for Enterprise Grade Document Data Extractionは、MarkTechPostに最初に掲載されました。

広告