机器竟然学会了读唇术,而且读得比人类还好?

放大字体  缩小字体 2017-09-24 19:48:16 来源:新浪科技作者:王子文浏览次数:7795  

机器不只会下围棋识人脸,还会读唇术?

在各行业大数据井喷的今天,有大量的视频等非结构化数据只保存了图像,但并没有录入声音。然而,其中有许多声音信息其实是非常关键的,特别是在公共安全领域的关键节点。遇到这种情况,我们就要依靠读取唇语来进行识别了。


以往唇语识别这事儿只能依靠人工,也就是唇语识别专家。然而随着AI人工智能技术的发展,如今机器也学会了读唇术,而且做得比人类还好。

3月29日,在重庆举办的亚洲大数据可视分析峰会上,海云数据发布了与重庆市公安科研所共同研发的唇语识别技术成果。据透露,目前海云数据的中文唇语识别技术准确率已达到70%,处于国内中文唇语识别的领先水平。

唇语识别,AI完胜人类

关于人工智能能否替代人类的争论,可以说一直持续不休。目前人工智能在图像识别、语音识别、生物识别、深度学习、自然语言理解等许多领域的应用,已经做得比人工更加出色。不过人类的感知、学习、理解、认知等综合能力,依然是当前的机器人无法超越的。

唇语识别指的是只靠观看说话者说话时的嘴唇动作,破译解读出说话者所说的内容。具体到读唇术这个领域的话,AI人工智能几乎完胜人类号几条街。

2016年,谷歌的人工智能公司DeepMind与牛津大学合作,研发了一个具有读唇语功能的人工智能系统。在让AI系统学习了5000个小时的BBC新闻节目后,AI系统秒杀了唇读专家。唇读专家的准确率只有12.4%,然而AI系统的准确率却高达46.8%。

国内领先的中文读唇技术什么样?

与语音识别依靠声音和自然语言识别不同,唇语识别是一项集机器视觉与自然语言处理于一体的技术。

通过机器视觉技术,唇语识别系统从图像中连续识别出被分析对象连续的口型变化特征,通过分析其嘴唇上众多识别位点的运动变化,随即将这些特征输入到唇语识别模型中,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。因而对于越学越聪明的AI来说,学习库数据量越大,数据质量越高,训练的准确度越高,判断就越准确。

为了不断提升识别的准确率,海云数据的唇语识别系统经历了1万小时的新闻类节目训练,最终形成了国内领先的中文唇语识别模型。

借助唇语识别技术,公安人员可以通过锁定视频中犯罪嫌疑人的语言记录,获得侦破案件的关键信息。不仅如此,未来在日常生活、社会公益、体育赛事裁定等各个领域,唇语识别都有着极为广阔的应用空间。譬如,未来聋哑人也许可以通过唇语识别设备,来“看懂”别人说话的内容。

如何搭好AI这趟车?找准切入点很关键

未来5-10年,人工智能将改变互联网和世界的面貌,已经成为业界的共识。根据全球知名研究机构Gartner的一项调研,参与调研的国内外企业中,70%的企业在近12个月之内有要实施人工智能的计划。

在人工智能一片火热的同时,国内企业介入人工智能的领域也比较扎堆,人脸识别、语音识别、无人驾驶是几个大热的方向。相对而言,唇语识别属于相对比较冷门的领域。

对此,海云数据创始人兼CEO冯一村认为,AI要解决行业具体应用和具体需求,而海云数据的核心竞争力在于可视分析领域。可视分析是一种全新的数据分析方式和数据分析的思维能力,其底层技术正是计算机视觉技术。海云数据希望用人工智能将大数据重新赋能,唇语识别则是最好的切入点。

目前,海云科技已在北京、重庆、硅谷、上海建立了自己的基地,其中重庆作为公司总部,在重庆成为国家大数据综合试验区的政策背景下,海云数据将从国家到地区政策层面获得充足的发展支撑。

据悉,海云数据此前已经在公共安全、交通、军工、智慧城市等行业和领域都已经有着丰厚的积累。相信随着唇语识别系统的应用,海云数据也将为这些行业带来更多定制化的解决方案。

AI人工智能技术的发展,正在让机器变得越来越聪明。可以预见的是,同人脸识别、语音交互一样,唇语识别这项AI黑科技,将来也会给我们的工作和生活带来更多妙不可言的新体验。


“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!