1/0
为古文断句、“像素级”检测PS篡改痕迹 这届AI实在太“卷”了
东方网2022-09-01 11:30:03

东方网记者程琦9月1日报道:“克曰穆朕文且師華父悤譲氒心宁静于猷淑哲氒”要怎么断句?世界人工智能大会期间,一篇镌刻在西周青铜鼎面的钟鼎文难倒了不少参观者,最先“解题”成功的是合合信息推出的智能文字识别AI(人工智能)系统。在无人工干预的状态下,钟鼎文从内凹状态被拉平,并被转译成简体字,原本连在一起的文字经过“AI断句”功能自动处理后被正确区分开来。现场观众评价:这届AI实在太“卷”,竟然能读懂古文。

今年是世界人工智能大会举办的第五年,“科技风向标、产业加速器”是这场全球AI领域的行业盛会对参展技术与产品的期许。针对图像处理及内容识别中,文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等全球性难题,合合信息重点展示了智能文字识别技术的创新成果及产业应用示范,用科技探索产研融合新方向。

AI“读懂钟鼎文:向智能文字识别应用的山顶冲锋

合合信息智能文字识别技术主要由以“弯曲矫正”为代表的智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理(NLP)三大核心模块组成。智能图像处理技术可对曲面、阴影、摩尔纹等复杂场景下的文档图像进行精准的矫正处理,为接下来的文字信息提取、识别创造了良好的条件;复杂场景文字识别技术主要利用手写印刷混排识别,抗强干扰识别,扭曲文字识别等一系列深度学习技术进行文字提取及识别,并结合领先的NLP技术,对识别出的结果进行语义理解。

智能文字识别-钟鼎文识别现场体验效果图

本次展示的钟鼎文识别项目,是继去年的甲骨文识别之后,合合信息向古文字识别发起的又一次冲锋。大会现场还可使用公司旗下产品“扫描全能王APP”,用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。

技术人员介绍:“选择钟鼎文、古籍等素材来识别,是因为与常规文本相比,鼎面的文字形小细密,竖排的格式也与正常的文本不同。从载体上看,青铜鼎面存在弯曲、反光、凹凸不平的状况,古籍表面也可能有模糊、框线等因素的干扰,整体识别难度极大。这些问题的解决不仅对文物保护和文化传承意义重大,也有助于技术在各行业的应用向纵深拓展。”

PS篡改检测:像素级起底修改痕迹

“PS篡改检测”功能是智能文字识别技术的另一大亮点。从个人证件、票据到各类商业材料,诈骗团伙经常会使用PS过的材料来进行伪装行骗,受害者不计其数。该技术主要采用神经网络捕捉图像在篡改过程中留下的细微痕迹,基于百万级的数据学习图像被篡改后统计特征的变化,不仅可以判断图片是否被篡改,还能定位修改区域,以热力图形式展示图片的PS区域篡改置信度,检测准确率远超传统技术方法和人眼判断。

“PS篡改检测”是智能图像处理技术优势的集中体现,这种直接针对图像特征信息的篡改检测方法在行业中属于创新应用,覆盖身份证、护照等多种证照识别,适用于保险、银行、证券、政务等多种场景。

作者:程琦
选稿:夏阳
知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781