Multi-Head Attention based interaction-aware architecture for Bangla Handwritten Character Recognition: Introducing a Primary Dataset
arXiv cs.CV / 4/14/2026
📰 NewsSignals & Early TrendsModels & Research
Key Points
- 新たに、手書きバングラ文字の認識向けに78クラス・各約650サンプルのバランス型「Primary Dataset」を構築し、年齢や職業層、右利き/左利きなどの多様性も含めたと報告している。
- 提案手法として、EfficientNetB3、Vision Transformer、Conformerを並列統合し、マルチヘッドのクロスアテンション融合で特徴の相互作用を高める「interaction-aware hybrid deep learning architecture」を提示している。
- 内製データセットで98.84%の精度、外部ベンチマークCHBCRで96.49%を達成し、クラス不均衡やクラス間の視覚類似性に対して良好な汎化が示された。
- Grad-CAMによる可視化で、識別に寄与する領域を解釈可能にした点も含めている。
- データセットとソースコードはHugging Faceで公開されており、研究・再利用を促進する内容となっている。
Related Articles

Black Hat Asia
AI Business
Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
Don't forget, there is more than forgetting: new metrics for Continual Learning
Dev.to
Microsoft MAI-Image-2-Efficient Review 2026: The AI Image Model Built for Production Scale
Dev.to

MCPNest - I built an MCP server marketplace in 7 days.
Dev.to