什么是通用场景文字识别

什么是通用场景文字识别 文字识别

  通用场景文字识别


  覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核、快递面单识别等场景


  通用场景文字识别的产品都有


  1、通用文字识别


  基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务


  2、办公文档识别


  可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容


  3、网络图片文字识别


  针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果


  4、数字识别


  识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景


  5、手写文字识别


  支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上


  6、表格文字识别


  对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回


  7、二维码识别


  对二维码、条形码中对应的文字内容进行识别,返回存储的文字信息


  百度通用文字场景识别特色优势


  1、准确率高


  针对图片模糊、倾斜、翻转等情况进行专项优化,鲁棒性强,多项ICDAR指标居世界第一,总体识别准确率高达99%


  2、服务稳定


  依托百度云技术实力,提供高可靠性、弹性可伸缩、高并发承载的云端服务,服务可用性高达99.99%


  3、支持多语种识别


  通用文字识别支持对中、英、法、俄、西、葡、德、意、日、韩等20个语种的识别,并支持中、英、日、韩4个语种的类型检测


热搜词

PC文章内容尾部广告