Webスクレイパー:マルチモーダル大規模言語モデルを活用したインデックスとコンテンツ構造のWebスクレイピング
arXiv cs.AI / 2026/4/1
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- Webscraperは、静的なHTMLパースが脆く、サイトごとの手作業による個別カスタマイズが必要になりがちな、動的でインタラクティブなサイトを対象とするWebスクレイピングのためのフレームワークとして紹介される。
- このフレームワークはマルチモーダル大規模言語モデル(MLLM)を用い、自律的にWebインターフェースをナビゲートし、専門ツールを呼び出して、構造化データを抽出する。
- Webscraperは、「インデックスとコンテンツ」アーキテクチャを持つWebサイト向けに調整された専用ツールと、構造化された5段階のプロンプト手順を適用する。
- 6つのニュースサイトでの実験では、Webscraperの完全なセットアップにより、ベースラインのエージェント(AnthropicのComputer Use)より抽出精度が向上し、このアプローチはeコマースプラットフォームにも一般化できることが示される。




