百度千帆Qianfan-OCR模型发布：4B参数实现文档智能解析，多项评测成绩领先-平板电脑-智能日报

百度千帆近日宣布推出全新端到端文档智能模型Qianfan-OCR，该模型采用统一的视觉语言架构，以40亿参数规模实现了文档解析、版面分析、文字识别与语义理解的一体化融合。在多项权威评测中，该模型展现出显著优势，标志着文档智能技术从多阶段流程向统一模型架构的跨越式发展。

在核心基准测试中，Qianfan-OCR表现尤为亮眼。在OmniDocBench v1.5评测中以93.12分位居端到端模型榜首，OCRBench评测成绩显著超越同规模通用视觉语言模型和专用OCR模型。在关键信息提取（KIE）领域，该模型在多个公开榜单总分上力压Google Gemini 3-Pro等国际商用模型，展现出强大的技术竞争力。

针对图表理解等复杂场景，Qianfan-OCR在ChartQA、ChartBench等6项国际权威评测中斩获5项最佳成绩。其独特的结构理解与多模态推理能力，能够精准解析包含复杂表格、混合图表的文档内容，在金融报表、科研论文等场景中具有显著应用价值。

传统OCR系统普遍采用"检测-识别-大模型"三段式架构，这种串联处理方式容易导致误差累积，且在文本分块提取过程中会破坏原始文档的空间结构与视觉上下文。例如复杂表格的行列关系、图表的坐标对应等关键信息，在传统流程中往往出现理解偏差。

Qianfan-OCR通过底层架构创新，构建了端到端的视觉语言模型。该模型直接从文档图像生成结构化输出，完整保留视觉信息与空间关系，实现从像素到语义的直接映射。这种技术路径不仅提升了处理效率，更在结构理解与推理任务中达到更高精度，有效解决了传统方案的固有缺陷。

目前，Qianfan-OCR已在百度千帆平台全面开放，同时通过HuggingFace开源模型权重。开发者与企业用户可自由调用该模型，应用于金融、医疗、教育等领域的文档智能化处理，推动行业数字化转型进程。

武汉大学科研新突破：世界最小芯片原子钟问世，精度超高打破垄断

快科技3月19日消息，武汉大学科研团队在量子精密测量领域取得重大突破，成功研制出世界体积最小的芯片原子钟。其体积仅2.3立方厘米，大小接近指甲盖，计时精度达到3万多年误差不超过1秒，为国家关键领域筑牢高精度…

2026-03-19

预算300-5000元怎么选开放式耳机？虹觅、韶音、华为三款实测对比来帮你

经过多轮实测对比，我精选出了三款在这个价位段里表现均衡、音质在线、佩戴舒服、综合性价比很高的机型，分别是：虹觅 Ultra、韶音OpenAir和华为FreeARC。韶音OpenAir：采用18mmx11…

2026-03-19

新世界发展尖沙咀汉口道商住项目动工打造多元物业组合满足都市需求

2026-03-19

黄天鹅事件引热议：功能蛋溢价背后，是供应链升级还是概念泡沫？

2026-03-19

时隔四年或再迎红色款！iPhone 18 Pro系列秋季发布有望添新色

2026-03-19

苹果iOS 26.4 RC版更新：修复输入漏洞，iPhone 17等设备打字体验优化升级

IT之家 3 月 19 日消息，科技媒体 Appleinsider 今天（3 月 18 日）发布博文，报道称在 iOS 26.4 RC候选版本更新中，苹果修复了遗留输入问题，从而提升打字准确率。 IT之家此…

2026-03-19

Nothing CEO裴宇展望：AI智能体引领手机交互变革传统应用或成幕后“资源库”

裴宇进一步介绍了所谓的“AI 优先设备”，相应产品号称可以高度理解用户行为与偏好，用户无需反复验证 AI输出的真实性，能够真正建立信任这些设备，从而无限提高产品交互效率。在 AI 优先的系统中，这一系列操…

2026-03-19

小米发布MiMo-V2-Pro旗舰模型：总参数量超1T 1M上下文助力Agent场景

据介绍，该模型专为现实世界中高强度的Agent工作场景而打造，总参数量突破1T（激活参数42B），较前代MiMo-V2-Flash扩大约3倍。 MiMo-V2-Pro模型现已正式开放API服务，支持1M上下…

2026-03-19