
ByteDance Seedは、7Bモデルが、トレーニング中に見たどんなデータよりも4倍長い、長く画像が多いドキュメントに関しても、はるかに大きなモデルよりも確実に質問に答えられることを示しています。ページを文字起こしするのではなく、このモデルは、自分自身で質問に答え、適切な該当箇所を見つけることで学習します。
この記事 ByteDanceの調査では、LMMに質問をする方が、長文ドキュメントのトレーニングのために文字起こしさせるよりも効果が高いことが判明 はThe Decoder に最初に掲載されました。



