| 画像のような複雑な表に対してうまく動く、オープンソースのライブラリやモデルはありますか。中国のモデルやライブラリの使用は職場で制限されているため、他の選択肢を提案してほしいです。また、コンピュータビジョンの手法でそれを実現できますか? [リンク] [コメント] |
画像から正確に表を抽出するための最良の方法
Reddit r/LocalLLaMA / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage
要点
- Redditのユーザーが、画像から複雑な表を正確に抽出できるオープンソースのライブラリやモデルを求めている。なお、職場の都合で中国製のモデル/ライブラリは使用制限がある。
- そのため代替手段を探しており、中国のリソースに依存せず、コンピュータビジョンの手法で信頼できる表抽出が可能かどうかを検討している。
- 難しいレイアウトに対する実用的なOCR/表構造の理解に焦点があり、複雑な書式やセルに対応できるツールが必要だという前提がある。
- このやり取りは、新しい製品のリリースや研究結果というよりも、推奨を求める内容として位置づけられている。