AI进入无障碍时代:手语识别翻译的应用意味着什么?_ag体育平台

By admin in 科技 on 2020年10月26日

ag体育

ag体育:我坚信,在人们的印象中,AI是属于“多数”的技术范畴。所谓多数,第一种是指涉及数据量大,容易积累,局限于AI严重依赖海量数据的特点;第二,意味着在场景中广泛使用且容易获得的复用成本,仅限于AI研发的高门槛。

目前人脸识别,语音交互等。这种经常出现在我们身边的东西,只符合这些特点。但是,这并不意味着属于“少数”的AI是一片空白。

现在,我们不妨把重点放在那些需要促进“少数和多数”区别的技术发展上,例如,针对听力受损者的手语识别就是一个典型的例子。为什么AI很难背出你我都不懂的手语?手语是听障人士特有的一种交流方式,它利用手势来衡量动作,并根据手势的变化来模拟图像或音节来包含一定的含义或词语。

然而,这种交流方式虽然可以让聋人相互交流,也可以让解释手语的普通人相互交流,但仍然不能满足聋人与公众交流的市场需求。之后,就意味着在一些社会公共空间,比如政务场景或者服务场景中,听障人士可能会遇到一些不便。而AI恰恰成了解决方案。

在一些软件中,我们已经应用了AI的手势识别能力,似乎在照片启动的时候使用了一些AR特效。这种对手势的猎取不能结合手势的语义对应来构建手语的翻译和分解吗?这个逻辑是准确的,从逻辑上的准确到不切实际的应用,但是还有很长的路要走。首先,手语的交流有一定的特殊性,不容易开始狩猎。我们告诉大家,“手势”的不道德性并不意味着精确。

除此之外,手语中的一些单词彼此非常相似,手语通常以句子为单位,单词之间有显著的差距。以前手势识别用前置摄像头打猎基本不现实。

所以很多技术和团队都想出了增加外设的解决方案。比如中国科技大学和微软公司都有出售基于Kinect的手语翻译系统,加州大学也多次出售手语识别手套。

但是这些外设要么便携性差,要么价格便宜,一起开发相当困难。同时,手语交流在一定程度上也是全国性和区域性的,模式的普遍性也没有什么困难。手语有两个概念:“语法手语”和“自然手语”。

语法手语不仅仅是规范的普通话,自然手语就像方言一样,在国家、地方甚至城市之间都有很大的差异。这也导致手语数据的收集和标记不会是一项高成本和繁重的工作。比如亚马逊,已经多次明确表示,改造Alex这个智能音箱,可以让它翻译一些非常简单的信号。但是由于缺乏大规模的训练数据集,这个函数无法识别出有一些非常简单的美国手语,停留在实验室阶段。

解决手语问题没有什么秘方,AI行业也很难探索平等权利,但是科技企业和学术界在手语AI方面取得了很大的成就。比如腾讯优图实验室销售的“优图AI手语翻译器”和爱人齐一销售的AI手语主播,在手语AI的应用上取得了很大的进步。手语AI的突破可以分为两条路线,一是手语AI技术的进步,二是场景中应用的突破。

在手语AI技术本身,可以分为两种解决问题的途径:识别模型和数据集。在数据集上,我们可以像优图一样,通过社会机构和听障人士的了解,创建自己的手语识别数据集,根据手语交流的地方差异,扩大交流习惯和速度的多样性。

至于识别模型,业界有全新的算法,如通过2D卷积神经网络和三维卷积神经网络从手势中提取静态和动态信息,通过综合处理提高视频识别效果,从而完全脱离其他传感器的束缚。同时,针对手语传达的整句话的简化,在视频帧的结尾再次加入词级信息挖掘,对特征提取器明确提出的信息进行验证,进一步确认手势和词语的边界,不仅提高了识别准确率,也提高了自然手语中区域交流的概括能力。

在此基础上,还可以在算法模型中引入语境理解能力,以面对更简单的手语识别翻译的市场需求。但是,虽然技术有待提高,但不允许应用到场景结尾。比如手语识别可能依赖强大的计算能力,短时间内难以便携和消费。

ag体育平台

但是几乎通过与政府的合作,手语识别可以转移到一些公共服务场景中。或者像热爱自己的精彩艺术一样,从手语分解方面来说,某种程度上也可以帮助听障人士。只是我们找不到而已,但是如果结合技术的话,我们可以发现手语AI的变化并不是因为某个基础科学有了不可思议的突破,而是因为更多的企业和学者一直投入了多年的研发和数据积累,让所有的人类都可以活在过去手语语料库匮乏的困境中,算法有很大的递归性。换句话说,企业和学者在与“多数人”AI技术完全匹配的“少数人”AI技术上投入了精力和财力。

对于AI行业来说,这无疑是一种平等权利的精神。从以人为本到科技为善:为什么要更积极地引领科技洋流?腾讯优途在手语AI的推出,只是AI行业中一股有势头的洋流趋势。前几天,在福州召开的数字中国峰会上,马首先提到“科技是好的”这一概念,并明确表示“我们坚信科技需要造福人类;人类要讲求科技,防欺诈,杜绝恶用;科学技术应该希望解决问题本身的发展所带来的社会问题。

”无独有偶,回到斯坦福后,李菲菲着手成立了HAI研究所(斯坦福人工智能研究所),并于今年开始担任所长。HAI的研究目标是推动AI技术造福人类,预测AI对人类生活的影响。技术巨头和学院派旗帜都把目光转向了同一个方向,因为人们已经开始逐渐发现AI、5G、工业数字化等技术力量的强大势头,已经到了被迫领先甚至约束的地步。

如上所述,科技企业对这一波技术发展起到了相当大的推动作用,从自然中寻求利润是企业的本能和天性。所以企业不会第一时间投入到满足大多数人、场景应用广泛、研发成本相对较低的技术上。这种不道德可以理解,但是AI等新技术带来的效率提升太明显了。

它是否会打破甚至边缘化那些仍然无法终结新技术的领域和群体,这是许多人正在思考的问题。
比如随着英、中、日、法、俄等主流语言的机器翻译能力大大加强,那些语料库不足的小语种会不会因为技术赋权而被进一步边缘化?某种程度上,当公共事务更多地被语音交互、图像识别等AI技术取代时,听障、视障群体在提供服务时会遇到更多的困难?类似的情况只发生过一次:2018年底,联合国发布了一份关于英国政府数字成就的报告。结果显示,自2010年以来,英国无家可归者的人数减少了60%,确保有120万人在等待住房,对用于救济穷人的食品银行的需求增加了近四倍。——因为很多穷人不知道如何在网上申请扶贫补贴,连家人都没有办法上网,最后也不能。

很多时候,即使是无害的技术,也可能经常有不可预知的南北。我们应该更加积极地领导科学技术的进步。最后,我们不妨想一想这样一组数字:根据北京市听力协会2017年的估计数据,我国听力受损人数约为7200万人。

世界卫生组织最近发布的全球数据显示,全世界共有约4.66亿人患有听力残疾。你看,这个世界上所谓的“多数”和“少数”本来就是一个相对的概念,没有什么独特的黑白之分。特别是对于AI这种善于模仿人类能力的技术来说,它的缺失可以拆掉阻碍各群体间交流的空气墙,而不是让这种趋势越来越糟糕。

我们的目标是用技术建立一个更美好的世界,既然我们不能丢下任何人,我们也不应该丢下任何人。幸运的是,从听障人士手语识别的翻译中,我们已经可以看到这种趋势。南北——中擅长计算的大脑,不仅是AI的唯一模拟对象,也是人类的热心肠。

我们坚信,在学术界和巨头的引导下,未来不会再有企业关注无障碍AI技术的发展,大大超越各种壁垒。恋人绝望,却有回响。

AI虽然很绝望,但也有回响。。

本文来源:ag体育-www.masbsdy.com

Comments are closed.

网站地图xml地图
Copyright @ 2010-2020 ag体育|官方平台 版权所有