TAG:OCR

 OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

腾讯混元开源全新OCR模型HunyuanOCR,仅10亿参数却斩获多项SOTA成绩。该模型采用端到端设计,在复杂文档解析、多场景文字检测识别中表现卓越,支持14种小语种翻译并荣获ICDAR2025冠军。轻量化架构便于部署,已应用于卡证处理、视频创作等场景,用户可通过GitHub和Hugging Face快速体验。

爱力方 2025-11-25 17:51
19
0

Grab自研语言模型的战略哲学:从通用工具到专用解决方案的转向

Grab自研语言模型的战略哲学:从通用工具到专用解决方案的转向

Grab公司分享了自研视觉大型语言模型的开发经历,旨在解决现有模型在东南亚语言识别中的不足。该模型基于Qwen2-VL2B架构,通过微调和高质量数据训练,显著提升了印尼、泰语等非拉丁字母文档的文本提取准确率,在身份证、驾照等合规处理中表现优异,超越了传统OCR工具。

爱力方 2025-11-04 16:27
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/