华为诺亚方舟实验室田奇:学术界和工业界具有互补性,人才培养是核心【ag体育平台】

By admin in 科技 on 2020年11月22日

官方平台

12月6日至8日,为期三天的“2019年世界创新者年会”在北京成功举行。在中国企业联合会的指导下,这次会议由Yiou EqualOcean和将工业和信息技术成果转化为联盟领导。本次会议的主题是“科创4.0:资源共享全球化新未来”,来自美国、英国、印度、新加坡、印尼、尼日利亚、巴基斯坦、日本、以色列等十多个国家或地区的6000名创新者总结了2019年世界科技发展状况,本次论坛邀请了华为诺亚方舟实验室首席视觉科学家田琦教授、宇信科技创始人兼首席执行官朱铭捷博士、文安智能创始人兼首席执行官陶海教授、华为科技创始人兼首席执行官柴金祥教授误解创投董事总经理、眉山数据创始人兼CEO博士、塔吉之星创始人兼首席科学家陈教授、小鹏汽车股份有限公司首席科学家郭延东博士共同探索和分享了企业家作为科学家在创业道路上的收益和理解,探索了科技与商业化的融合机遇,促进了产学研领域的协调发展。

其中,华为诺亚方舟实验室计算的首席视觉科学家田琦带来的主题是“科学企业家,双重身份下我眼中的创新者是什么?”演讲的核心点是,学术界和工业界是互补的,学术界对工业界的价值是不断为工业界输送人才,为工业界提供主导方向。同时,对性能的学术奉献为工业应用奠定了坚实的基础。工业界对学术界的价值是系统科学人才的转移。学术界和工业界的侧重点不同。

学术界更注重方法的理论化、普适性、探索未来和启发式知识水平。但行业更注重方法的商业价值和适用性。人才不应该是创造力的核心,人才培养是第二唯一的中心。

以下是国史:的演讲。各位嘉宾,早上好。

非常感谢组委会邀请我。我今天报告的题目是“双重身份下我眼中的创造力是什么?”我来自华为诺亚方舟计算视觉实验室。这是我的报告目录。

第一部分是我的学术和工业背景以及对诺亚周放实验室的说明;第二部分是“前沿创意研究与商业落地之间的AI使能差距”,用三个例子说明;最后,从学术和产业的角度,什么是创意?刚才我也解释了,我2002年毕业于伊利诺伊州厄巴纳-香槟,2012年重新加入德克萨斯大学。我做了17年老师,从助理教授到副教授,再到教授。2008年至2009年,利用事假在微软亚洲研究院工作一年多,兼任研究院院长;2010-2015年未受清华大学张华老师邀请,回到清华大学神经病学与认识中心任客座教授;2011-2014年在NECChina担任顾问;2016年命名为IEEE2017年教育部江学者。

这是我在学术界的经历。2018年夏天,我趁着学术休假,重新加入华为的诺亚方舟计算视觉实验室。今年9月,我接手了在美国的终身教职,现在全职重新加入华为,所以现在在业内。

当然你也看到了,我大部分时间都是在学术领域,工业领域的时间也远比过去多,这里不能说一些个人的浅薄,我就抛砖引玉吧。我在诺亚方舟计算机视觉实验室工作。诺亚方舟目前拥有:嵌入式计算视觉、自然语言处理、搜索、推荐、决策推理小说、机器学习、建模等几组。

反对产品部门,反对企业智能,反对网络智能,反对终端功能,珍惜终端智能手机照片的大屏幕,一些信息服务,比如无人驾驶,对我们来说也是微传感传感器集成。华为的AI启用了缺口。通过与世界各地25所大学的合作,许多研究人员重新加入了这一合作。
诺亚方舟的愿景是让AI启用差距和世界级制作打造顶级AI大学,从而帮助公司打造AI战略转型。

我们在欧洲、伦敦、巴黎、莫斯科、多伦多、加拿大和蒙特雷都有办事处。国内深圳、上海、北京、福州、香港都有研究同事参与。我们来解释一下我们的前沿创意研究和业务落地的差距,找到所谓的AI使能差距。

我来说几个例子:首先,学术界和工业界的侧重点不同,大家都告诉学术界要更加注重方法的理论化、普适性、未来探索性和启发性理解。而行业更注重商业价值,所以更注重方法的适用性,针对某个具体问题,提升用户体验,带来实用价值。因此,学术界和工业界的优化目标是不同的。

只有在华为,我们才能利用华为的大计算能力和大数据平台,应用到我们对抗国内AI芯片的前沿可视化研究中。我们的视觉研究分为六个方向:底层视觉、语义、三维视觉解释、数据分解、视觉计算和视觉多模态融合是我们讨论的基本研究方向。

场景中的应用还包括自动驾驶、农作物丰富的城市、终端视觉等。不存在AI使能的差距,因为前沿研究和应用到场景的优化目标是不同的。我来说说AI使能的差距,以及业内如何用五谷丰登市自动驾驶目标检测、行人站识别、航站楼识别中的轻量级网络设计来处理。

首先以自动驾驶检测为例。左边是学术界研究的目标检测。

它的数据标注的工整准确,但是工业领域的场景比较简单,有很多嘈杂的标签。比如右边的Car标有bus,左边的某个bus错标了Car。有两种方法可以处理有噪声的数据。

一种是需要对有噪声的数据进行处理,从设计惯性算法,对响应度下降的标签进行自动分类,然后进行修正或丢弃;另一个是设计半监督和无监督的方法,这样我们的模型可以更好地推广到这个弱标记或未标记的样本。就目前学术界广泛使用的目标检测来说,类别之间的分类比较清晰,图像也比较清晰,一般有比较好的光照条件,精度可能是唯一的。

但在行业自动驾驶中,我们采集的数据类别可能分布不均匀,即阅卷成本较低,想象层较多,因此灯光、交通锥等目标阅卷样本较少。同时,应用于场景分类的不同语义有时难以确定,因此有必要对标签进行分组。

比如在载人三轮中,先标记人,再标记三轮,最后形成一个群体标签。在采集数据时,要采集一些图像数据不明确,光照条件不好的图像。如暗光和误报,以更好地训练我们的算法,提高系统的性能。在评估标准方面,我们主要关注一些明确的应用,例如检测一些关键障碍以制定我们的产出、库存和评估标准。

学术界最常用的目标检测模型,但考虑到数据分布的不平衡和任务之间的依赖性,我们的解决方案是设计一些计算量小的网络模块,采用多目标多分支设计来解决目标检测问题。在第二个例子中,我以五谷丰登市启用站的识别为例。左图是学术界对步行站的识别,其场景比较简单,就是城市或者大海。

行人站识别旁边的两个图像数据集是两个多场景多时间段的数据集,是我们这几年做的工作。然而,工业使能站的识别对于城市群来说是一个大规模的简单场景,因此其条件很难被约束和简化为理想条件。

然后以这两集多场景多时间跨度数据为例,包括4101个行人,15个摄像头,行人约12万平方米,采集室内外场景。行人的假设需要很好的分析,准确性是唯一的评价指标。

在实际的工业场景中,我们要面对数十万个这样的行人id,数千甚至数万个这样的摄像头,数十亿甚至更多行人的数万幅智能图像,针对校园、社区、街道等各种场景。我们园区也有项目,经常会出现不允许检测或者误差非常严重的情况,所以不仅仅是精度,还有模型的大小和速度。这是行人识别中非常常见的一种识别模型,基于人体、部件等。这是我们2018年的工作,主要是说一张图片作为一个整体分为多个模块,这样就需要区分不同的id,从而提高系统的区分能力。

在工业场景中使用这种方法是很危险的,因为工业数据量特别大,不同id之间没有非常相似甚至完全相同的模块。如果相似模块几乎分离,特征提取会受到破坏,导致系统性能急剧下降。

此外,如果将真实的训练系统部署到新的场景,该系统的性能不会快速上升。解决问题的一个办法就是在场景中移动,所以在2018年,我们华为的同学明确提出了一个扩大数据差距的方法。该算法明确提出后,当然提高了系统性能,但如果应用到实际工业场景中,分解后的图像质量还是比较差的。同时引入了大量噪声,在一定程度上提高了系统性能,但其天花板效应仍然比较低,无法满足工业界的排斥。

我们的解决方案解决了如何在新场景中探索和部署新系统的问题。在过去,它专注于在摄像机之间做标记,因为不同的摄像机捕捉到了人,并且部署了更多的标志。但是我们的解决方案将跨摄像头的标记改为单摄像头单摄像头的训练模式,我们只标记行人在一个摄像头下做数据。

因为在一个摄像头下,行人检测会高速自动化,大大增加了数据标记的成本和时间。最后,以华为终端视觉的轻量级神经网络为例,学术界的轻量级网络在保持精度的同时,重点关注如何增加计算量或增加模型参数和模型大小。但是在行业内,需要考虑一些真实硬件的指标,比如能耗、速度、内存等,很难使用理论指标。然后是自学习计算机的网络,比如计算量和模型参数的方法,虽然计算量和模型参数减少了,但实际速度还是乐观的。

ag体育

现在业内一些轻量级的计算专注于谷歌和V2等深度差异化的模式,导致消费和引流混合的运营商,开始在A3搜索NASS技术的网络结构。但是,没有问题。

我们应该充分利用特征之间的融合,并与特定的硬件兼容。2018年高剂量水平模型的共同思路是穿越地下隧道。穿越地下隧道之间的信息可以更好的应用,但是穿越运营商对硬件建设不友好。

这种算子在内存和存量上没有间断,不会降低硬件运算的效率。今年我们明确提出要用廉价的线性变换来交换条件更好的特征,因为廉价的线性变换换来的是与硬件的友好关系,所以市场对计算资源的需求可以更好的超过这个目标。最后,我主要从学术界和工业界的角度来看什么是创意。学术界和工业界似乎是互补的,学术界对工业界的价值就是不断为工业界输送人才,获得工业界的主导方向。

同时,对性能的学术奉献为工业应用奠定了坚实的基础。
工业界对学术界的一个价值就是系统学术界的人才转移。

人才流动是一个长期的现象,在实践中给学术界带来了新的方向。最后,学术界的系统整合获得全球布局。所以学术界和工业界应该处于一种有序互利的状态。

领域里的双重身份不多,我就分享一下从学术界到工业界的人的思路。颜水成,新加坡国立大学终身教授,原360AI分校。现在他是易图科技的首席技术官。

他指出,学术研究成功的关键在于技术。此外,必须提取问题的解决方案。

学术界的步伐可以放慢一点,一个输入必须要几个月甚至半年,但只要行业能解决问题,就是好的人工智能。香港中文大学的唐晓鸥也是上唐科技的创始人。

官方平台

他说中国的人工智能要做好三件事。第一,一定要下定决心,打好基础;第二,要有创意,实现新东方;第三,要实现东升,实现工业化。香港中文大学的贾布比是亚腾有图的杰出科学家,他的观点是“技术要上天,工业要落地”。大家更熟悉的李是斯坦福大学教授,前谷歌云人工智能首席科学家。

她指出,从科学到技术再到产品,就像一场4100的接力赛,每个篮子都有其特殊的功能。学术界应该是4100第一,工业实验室第二,工业与投资第三第四。最后,我获得了纽约大学的图灵奖,现在我也是脸书的科学家。学术界和工业界的双重联盟是什么?它可以为学术界和工业界做出贡献,不仅推动了云识别、图像识别、文本解释和语言翻译的技术变革,也带来了解释智能的基础科学进步。

这是业内其他双重身份的人的洞察。在我看来,创造力的核心要素是什么?我指出,人才不应该是创造力的核心,人才培养只是第二个唯一的中心。从视觉算法、计算能力和从三大要素计算的数据来看,学术界用精确的算法设计更好,但工业界在计算能力和数据上有更大的优势。

大计算能力和大数据为行业带来更多的创意可能性。人工智能行业对人才的市场需求是丰富的,工业技术对学术界人才的吸引力主要体现在计算能力、平台、数据、机会、合作、介入、成功、落地。

长期以来,行业内的人才竞争一直很激烈,中美两国都可以看到人才的竞争。工业界有哪些必备的人才?主要有几点。第一是专注于自己的领域,有创作天赋;第二种是在很多领域有悟性,有合作能力的人才;第三种是需要把技术落地,不知道如何产生五种人工智能的人才。

比如从客户的程度、劳动、社会来说,车站需要什么?人工智能在车站应用到现场可以做什么?技术和产品驱动,了解产品的市场需求,了解用户体验,充分发挥算法、数据和计算能力。行业也需要寻找新的商业方向。一些舵手将商业场景和商业模式整合在一起,并清晰地应用到(例如,自动驾驶、智能家居、丰收城市等产品)中,以带来平稳的商业价值。

最后,AI的应用要以人为本,要找到理想的、经济的人才。在功能完善的基础上,要考虑人们的精神文化市场需求,比如陪伴老人和孩子的陪伴机器人。

学术界一定要有什么样的人才?第一,做基础研究。从源头改变,目光短浅,注重技术创意。

问题要来自行业,结果要上行业,要付诸实践。比如学术界和工业界的人才培养方式的区别就是我得到了一个新的算法,同时
就行业而言,主要是寻找合适的方法解决问题。

但共同点是需要理论基础扎实、工程能力强、协作性和创造性好的AI人才。所以要利用这种双重身份连接学术界和工业界,获得培养AI人才最差的方式。

对于华为来说,我们的目标是利用跨境身份的优势,将学术界的高水平研究与行业的高质量产品实践相结合,找到创新的人才培养模式,帮助我们建设一个向下穿透天空、向上穿透根源的全站R&D。我们的人才培养战略是率先与大学探索培养学生的科学方法,与大学学者进行学术交流和内部交流。

在工程能力培养方面,定期邀请专家进行员工培训,同时AI课程以白皮书的形式分享,我们的员工在外面温暖的房间里接受培训。最后,利用公司强大的数据资源和计算平台支持,我们经常传播企业文化,就像今天的活动一样。

最后,对高校人工智能人才的培养提出了一些建议。既要培养较高的专业素质,又要有较强的工程能力;课程的AI变化很快,需要重点关注课程内容的及时修订;开设跨学科专业,希望本科生甚至高中生能尽早了解前沿;人工智能方面,希望学生参与编程课程的自学,与行业合作,希望学生参与工程训练;最后,希望同学们有创意,出彩蛋还有AI创业。

以上,我公开发表了一些关于创意的粗浅想法。谢谢你。|ag体育。

本文来源:ag体育-www.masbsdy.com

Comments are closed.

网站地图xml地图
Copyright @ 2010-2020 ag体育|官方平台 版权所有