当前位置 > 首页 > 国际新闻 > 正文

云从科技提出Pixel-Anchor框架 取得OCR文字识别突破
  • 发布时间:2020-01-12
  • www.sykntwztd.com
  • 近年来,云利用科学技术中的自然场景光学字符识别技术,在ICDAR数据集上取得了许多最佳结果。尤其对于东亚语言部分,该文本检测框架的性能尤为突出,在几个子测试集中(包括中文)获得了第一名。ICDAR是当前光学字符识别技术领域中世界上最具影响力的数据集,被誉为光学字符识别领域的奥斯卡。

    Cloud在科学技术提出的像素锚框架(FMeasure,检测率和准确度的权重,详见图1-表3)的两个具有挑战性的自然场景文本检测测试集ICDAR2015和ICDAR2017 MLT中获得了迄今为止最好的结果。该框架在满足生产环境实时性要求的基础上,实现了较高的检测精度。研究结果可进一步应用于计算机视觉和人工智能技术。与此同时,阿里巴巴、南京大学、南京理工大学、尚堂科技和师旷科技也在榜单上显示出良好的成绩,表明中国继续引领世界光学字符识别研究。

    OCR(光学字符识别)是指分析和识别输入图像以获得图像中文本信息的过程。它有广泛的应用场景。然而,自然场景中的光学字符识别技术不需要为特殊场景定制,并且可以识别任何场景图片中的字符。

    与传统的高质量文档图像光学字符识别相比,自然场景光学字符识别突破了对输入图像质量和场景的限制,可以应用于更广泛的领域,受到学术界和工业界的极大关注。

    然而,与传统的光学字符识别相比,各种商品中的文本检测和识别,自然场景光学字符识别中的景物或自然场景图片面临着复杂的背景干扰、文本模糊和退化、光照不可预测、字体多样性、垂直文本、倾斜文本等诸多挑战。

    计算机视觉基础技术

    广阔的应用前景

    光学字符识别(OCR)是计算机视觉领域的经典问题,长期以来一直受到学术界和工业界的不断关注。在工业领域,谷歌、微软和亚马逊等大型互联网公司,以及从云科技等人工智能初创企业,多年来一直致力于光学字符识别技术。随着技术的不断成熟,光符识别也开始应用于互联网和其他行业。其应用范围也从文档识别扩展到车牌识别、图像广告过滤、场景理解、商品识别、街景定位、票据识别等广泛领域。

    据悉,目前,像素锚框架已经在云技术的认证票据识别系统和图片广告过滤系统上线。它每天处理近千万张图片,并自动反馈可疑的非法图片,准确率超过96%。同时,文档处理以及图像和文本审查的风险发现时间从“小时”减少到了“秒”。数据显示,2018年,云科技积累了25亿份证书数据,屏蔽了400万次恶意促销,有效提高了业务流程效率,净化了营销环境。

    除了光学字符识别之外,在云技术中还建立了核心技术的闭环,包括人体姿态、交叉镜跟踪、车辆构造、语音识别和其他智能感知。例如,安全大数据系统和智能业务运营平台应用“交叉镜像跟踪(ReID)”技术来跟踪没有人脸的目标。“逃犯杀手”张学友的一些成就涉及到“交叉镜跟踪”技术。此外,云技术还将智能传感技术引入沉浸式大数据风控制系统、人工智能物联网应用等场景。

    这篇文章是网站管理员的家庭用户提交的。未经网站管理员同意,严禁复制。例如,如果大多数用户在稿件中发现虚假报告,欢迎读者反馈、纠正和报告问题(反馈入口)。

    免责声明:这篇文章是对用户的贡献。网站管理员之家发表这篇文章只是为了传递信息。这并不意味着网站管理员的房子同意它的观点,不对内容的真实性负责,只是供用户参考,

    日期归档

    福石信息网 版权所有© www.sykntwztd.com 技术支持:福石信息网 | 网站地图