脑瘤

注册

 

发新话题 回复该主题

万字报告2019年人工智能发展趋势全解析 [复制链接]

1#
北京中科白瘕风医院是三甲吗 https://yiyuan.99.com.cn/bjzkbdfyy/

编者按:关心AI的人一定希望了解这个行业的最新发展趋势,最近行业分析机构CBInsights最近发布了年AI趋势报告正好能满足这个需求。这份84页的报告识别了25种AI趋势,运用CBInsights的NExTT分析框架,从行业采用度和市场优势两个维度对其进行归类,可以为不同参与角色提供决策参考。

其关键发现是对电子商务搜索词的上下文理解正在摆脱“试验”阶段,不过距离广泛采用还有很长一段路要走;深度学习是当前绝大部分AI应用的引擎。不过因为胶囊网络,这种技术可能需要改进一下了;先进医疗保健与生物测定领域的研究人员正在开始利用神经网络研究和测定此前难以量化的非典型风险因素;能访问大型标签化的数据是训练AI算法的必需,而逼真的仿造数据也许能解决这一瓶颈。

为了方便各位了解,36氪对这25种趋势进行摘要编译介绍。

必需

开源框架

AI的进入门槛变得空前的低,这要感谢开源软件。

以年Google开源TensorFlow机器学习库为开端,现在AI(尤其是深度学习)的开源框架已经形成百花齐放的局面,其中有Facebook的PyTorch、特利尔学习算法研究所(MILA)的Theano、Keras、MicrosoftCognitiveToolkit以及ApacheMXNet等等。

开源AI框架是双赢的局面:一方面令人人都能用上AI;反过来,贡献者社区也为加速Google等公司的AI研究提供了帮助。

知名AI专家YoshuaBengio表示:

支持深度学习研究的软件生态体系发展得很快,现在已经达到了一种健康的状态:开源软件成为规范;各种框架出现,满足了从探索新颖想法到生产部署的各种需求。而且不同的软件堆栈也在刺激的竞争氛围下得到了有力的行业玩家的支持。

边缘AI

对实时决策的需求正在将AI推向靠近边缘的地方。

在智能手机、汽车甚至可穿戴设备等边缘设备上运行AI算法,而不是跟中心云平台或服务器通信,使得边缘设备具备了在本地处理信息的能力,并且可以更快速地对情况做出响应。

Nvidia、高通、苹果及若干初创企业均在开发用于边缘的AI专用芯片。

边缘AI对消费者电子、电信、医疗影像等主流行业均有应用意义。比方说监控摄像头的人脸识别、华为、苹果等智能手机的人脸与对象识别、TeslaAI芯片的即时驾驶决策、婴儿监视器、无人机、机器人视觉能力(无互联网连接)等。

在年各大公司的财报会上,提到边缘计算的次数已经明显增多。

不过尽管边缘AI具有减少延时的优势,但也存在局限。那就是存储和处理能力受到限制。预计会有更多混合模式出现,使得智能边缘设备能够相互沟通以及与中心服务器通信。

脸部识别

从手机解锁到登机手续,人脸识别正在进入主流。

人脸识别在中国的媒体热度从年开始就不断升温。

中国对人脸识别技术的需求也与之同步。在这方面中国已经冒出了商汤科技、Face++、CloudWalk等独角兽。

美国这方面的的专利申请也呈现相似的趋势。

人脸识别的早期商业应用正在安保、零售及消费者电子领域出现,并且迅速成为生物特征识别的主流形式。

尽管人脸识别应用日益广泛,但这种技术并不是没有瑕疵。曾有报道称Amazon将一位国会议员认成了犯罪份子。华尔街日报记者用一张校长照片作为面具就轻易骗过了西雅图一所学校的智能摄像头。

医疗影像与诊断

美国FDA正在给AI即医疗设备开绿灯。

年4月,FDA批准了无需专家补充意见进行筛查糖尿病视网膜病变病人的AI软件。该软件叫做IDx-DR,其识别率达到了87.4%,对没有此病的识别率也达到了89.5%。

此外,FDA批准了初创企业Via.ai的CT扫描与潜在中风症状通知软件VizLVO,以及初创企业Arterys的OncologyAI软件包,后者可以识别肺部与肝脏损伤。

监管的放松给商业化开辟了新的道路。自年以来,共有80家AI影像与诊断公司完成了项融资交易。

初创企业Healthy.io的第一款产品Dip.io利用率了传统的尿液分析试纸来监控若干尿路感染:用户用智能手机拍摄试纸照片,计算机视觉算法就能根据不同的光照情况和相机品质对结果进行校正。产品可检测感染及怀孕相关的并发症。已在欧洲、以色列商用的Dip.io也已获得FDA放行。

预测性维护

AI工业物联网可为从制造商到设备保险商的既有者节省数百万美元的意外故障损失。

预测性维护利用传感器及智能摄像头不断采集机器数据(如温度、压力等)。生成的实时数据的规模以及格式的多样使得机器学习成为工业物联网不可或缺的组件。假以时日,算法就能够提前预测故障。

工业传感器成本的下降,机器学习算法的进展,以及边缘计算的推进,这些均使得预测性维护的应用变得更加广泛。

从下图可以看出,对领域的投资正在逐年递增。

其中活跃的投资者包括GEVentures、西门子、SAP等。甚至微软等大公司也对自己的云与边缘分析解决方案进行扩展,提供预测性维护能力。

电子商务搜索

对搜索词的上下文理解已经走出“试验”阶段,但是大规模采用仍有很长一段路要走。

自年以来,Amazon已经申请了35项与“搜索结果”有关的美国专利。其中包括利用卷积神经网络“确定一组图像与查询图像类似的物品”,利用机器学习分析图像的视觉特征,并基于此建立搜索查询等。

eBay则利用机器学习来分析卖家的产品描述,然后借此寻找同类产品。

但是很多买家都是使用自然语言来进行查询,这对电子商务搜索构成了挑战。新兴初创企业于是开始为零售商提供搜索技术。

图像搜索初创企业ViSenze的客户包括Uniqlo、Myntra、乐天等。它可以让进店客户拍摄喜欢的东西的照片,然后上传,在网上找到同样的产品。

获得阿里投资的以色列初创企业Twiggle正在基于电子商务搜索引擎开发语义API,对买家的特定搜索做出响应。

试验

胶囊网络

深度学习是当今绝大部分AI应用的引擎。但由于胶囊网络,这种技术现在可能需要改进一下了。

胶囊网络(CapsNet)是深度学习先驱GeoffreyHinton-18年时提出的概念,旨在克服当前图像识别方法(主要是卷积神经网络CNN)的缺陷。

这种缺陷主要有2个。一是难以识别精确空间关系。比方说右图中尽管嘴巴的相对位置发生了改变,CNN仍会将其识别成人脸。

二是无法从新的视角去理解对象。比方说下图中胶囊网络在识别1、2行为同一玩具的不同视角中表现要比CNN出色得多。CNN则需要更大的训练数据集才能认出每个方向的对象。已经有黑客通过引入少量噪音就能让CNN把目标误认成其他对象。

尽管目前对胶囊网络的研究仍处在初期阶段,但有可能对目前最先进的图像识别方法构成挑战。

下一代修复术

非常早期的研究正在出现,通过生物、物理、机器学习的结合来解决修复术最困难的问题之一:灵敏性。

从年开始,DARPA就投入了数百万美元跟约翰霍普金斯大学合作先进修复术计划来帮助受伤的老兵。但是这个问题解决起来并不容易。

比方说让截肢者活动假肢的手指,对自发运动背后的大脑和肌肉信号进行解析,然后再转换为自动控制均需要跨学科的知识。

最近,研究人员已经开始利用机器学习对植入人体的传感器的信号进行解码,然后将之翻译为移动假肢设备的指令。

约翰霍普金斯大学的应用物理实验室一个进行中的项目就是利用“神经解码算法通过”神经接口来控制假肢的。

去年6月,德国及帝国理工学院的研究人员利用机器学习解码截肢者残肢的信号,并让计算机来控制机械臂。

另一个思路是利用中介解决方案,比如利用肌电信号来激活摄像头,然后再用计算机视觉算法估计抓手类型以及面前物体的大小。

临床试验登记

临床试验的最大瓶颈在于登记合适的病人库。苹果有可能可以解决这个问题。

互操作性——也就是跨机构和软件系统分享信息的能力——是医疗保健的最大问题之一,尽管有了病历数字化的努力。

临床试验在这方面问题尤其严重,将合适的试验与适当的病人进行匹配是很耗时且充满挑战的过程。而光美国目前就有项临床研究正在招募病人。

理想的AI解决方案是由人工智能软件析取病人病历的相关信息,将之与进行中的试验进行对比,然后给出匹配的研究建议。

在病人与医疗保健计划匹配方面,苹果等技术巨头已经取得了一定的成功。

从年开始,苹果就推出了2个开源框架——ResearchKit与CareKit——来帮助临床试验招募病人,并且远程监控病人的健康状况。这些框架使得研究人员和开发者得以创建医疗app来监控人们的日常生活,化解了登记的地理障碍。苹果还在跟热门的电子病历供应商合作解决互操作性问题。

年6月,苹果面向开发者推出了HealthRecordsAPI。用户现在可以选择向第三方应用和医疗研究人员分享数据,为疾病管理与生活方式监控打开新的机会。

生成对抗网络(GAN)

两个互相比聪明的神经网络正在变得非常擅长创作出逼真的图像。

你能认出下面哪些图像是假的吗?

答案是全都是。这些全都是GAN创造出来的。

生成对抗网络是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。该方法由Google研究人员IanGoodfellow于年提出。生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间(latentspace)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

扩充GAN式的大规模项目的主要挑战是计算能力。Google研究人员在创建“BigGAN”用了块TPU来创建像素的图像,一次试验的电耗大概就要到千瓦时之间。这已经相当于普通美国家庭半年的电耗。

而且GAN要想扩充,AI硬件也的并行扩充。

除了有趣的试验以外,GAN也有其他严肃的用途,比如假冒政治视频和色情作品的换脸等。随着GAN研究的扩大,这种技术势必会对新闻、媒体、艺术及网络安全构成挑战。GAN已经改变了我们训练AI算法的方式。

联邦学习

这种新方法旨在用敏感用户数据训练AI的同时保护隐私。

我们跟智能设备的日常互动可以产生丰富的数据,这些数据用于训练AI算法的话可以极大地改善其表现,比如可以更加精确地预测你接下来要输入的字是什么。但是这些用户数据也会涉及到个人隐私问题。

Google于是提出了联邦学习的方案,旨在利用这一丰富数据集的同时保护敏感数据。简而言之,你的数据依然留在你的手机里,不会发送或存储到云服务器上。而是由云服务器将最新版的算法(算法的“全局状态”)发往随机选择的用户设备上。

你的手机做出改进然后基于本地化的数据对模型进行更新。之后只有这种更新(以及来自其他用户的更新)会回传给云服务器以改善该“全局状态”,然后再不断重复这一过程。

把单个更新聚合起来的做法其实并不新鲜,其他算法早就这样做了。联邦学习的不同在于它考虑了数据集的两个重要特征:

Non-IID:其他分布式算法均假设数据是独立同分布(Independentandidenticallydistributed,IID)的,但其实每一部手机生成的数据都是独特的,因为不同的人使用习惯不同,联邦学习考虑到了这种不同。不平衡:某些用户使用app更加活跃,自然也会产生更多的数据。因此每一部手机的训练数据量也不一样。Firefox自称是在重要软件项目中首个实现联邦学习的用例之一。当用户在浏览器输入URL时,Firefox会利用联邦学习进行URL推荐排名。

AI初创企业OWKIN则利用联邦学习来保护敏感的病人数据。其方案可以让不同的癌症治疗中心在病人数据不离开本地的情况下进行协作。

先进医疗保健生物测定

研究人员正在开始利用神经网络来研究和测定此前难以量化的非典型风险因素。

Google的研究人员利用视网膜图像训练神经网络,然后再用该神经网络去寻找心血管风险因素。其研究发现,通过视网膜不仅可以识别年龄、性别、抽烟习惯等风险因素,还可以对这些因素量化到一定的精确程度。

类似地,梅奥诊所也跟以色列初创企业BeyondVerbal合作,通过分析声音的声学特征来寻找冠心病人独特的声音特性。研究发现,当受试者描述一段情感经历时,有两个声音特性跟冠心病存在强关联。

初创企业Cardiogram最近的研究发现,利用深度学习,糖尿病引起的心率变异性改变可通过现成的可穿戴心率传感器检测出来。其检测精确率可达85%。

AI寻找模式的能力将会继续为新的诊断方法和识别此前未知的风险因素开辟新的道路。

自动索赔处理

保险公司和初创企业正开始用AI计算车主的“风险评分”,对事故场景图片进行分析,并监控司机行为。

蚂蚁金服在“事故处理系统”中利用了深度学习算法来进行图片处理。过去需要理算员现场处理的事情现在可以由先进图像处理承担了。车主只需上传车辆照片给蚂蚁金服,神经网络就会分析图片,自动进行损失评估。

蚂蚁金服还建立了司机的风险档案来影响车险的定价模型。他们引入了所谓的“车险分”,基于信用记录、消费习惯、驾驶习惯等利用机器学习计算车主的风险评分。

初创企业Nexar鼓励司机把自己的智能手机当成行车记录仪使用,并且将记录上传给Nexarapp。车主的好处是可以有车险的折扣。

拿到视频的app会利用计算机视觉算法监控路况、司机行为以及事故。App还提供了“事故重现”功能,并与保险客户合作处理索赔。

初创企业Tractable可以让保险公司将受损车辆图片及车损估价上传到其索赔管理平台。“AIReview”功能就可以将这些资料与库中的几千图片对比,然后进行相应的定价调整。

防伪/打假

假货越来越难以识别,而在线购物又让卖假货变得空前的便利。为此,品牌商正在开始利用AI来打假。

拼多多在18年Q3财报会上提了11次“假货”,称“打击假货和不诚信商家非常困难。”

品牌正在两条战线上对抗假货的冲击:

在线上,需要识别并让侵权商品下架。在线下,需要识别宰客的假货(如高级手包)。阿里巴巴正在利用深度学习持续扫描自家平台以发现IP侵权的情况。它利用了图像识别来确认图片的特征,再加上语义识别,从而监控上架商品图片中是否有品牌名称或者口号。

造假者会利用跟品牌十分类似的关键字和图片来销售假货。而且他们就像牛皮藓一样,一旦假货下架之后,他们又会换一组关键词重新发布同样的假货。

初创企业RedPoints正在利用机器学习扫描网站潜在的侵权情况,并且找出造假者使用的关键字选择模式。

线下打假就更加棘手了,而且需要更大的人力。

卖家卖或者典当二手奢侈品手包时,验证过程通常需要鉴定专家亲自检查手包的工艺、材料及缝线模式。

但是一些A货已经逼真到肉眼无法辨别的地步。

初创企业Entrupy跟鉴定专家合作建立真品、赝品数据库来训练算法已有2年时间。他们利用一种可以连接智能手机的便携式显微镜让用户拍照上传物件图片,算法再分析是否具备真品独有的微观特征。不过这种办法也有局限性。因为大多数按照标准规定制造的产品都有类似的特征(造假者也运用了这些工艺)。而且像芯片、纳米材料这样的东西并不适用。

Cypheme采用的是另一种办法。基于人工智能的防伪溯源技术,通过使用特种纸张作为媒介制作标签,并可进行产品溯源。公司宣称这种标签使用了独家技术,是无法仿造的。而且即便标签是原件,如果不在数据库中有记录,产品也会被识别为假货。

免收银零售

进店、拿货、出门,这几乎给人感觉就是入店行窃。AI可以让过去被视为盗窃的事情及免收银零售变得更加常见。

AmazonGo就彻底取消了收银流程,让顾客进店取货即走。但是Amazon并没有详细介绍过未来的运营和商业计划,只是说实现利用了传感器、摄像头、计算机视觉及深度学习算法但否认使用了人脸识别技术。

像StandardCognition和AiFi这样的初创企业则抓住了机会,将AmazonGo的方案普及到零售商。免收银商店的一大挑战是如何向适当的顾客收取正确的费用。

迄今为止AmazonGo是唯一成功的商业案例,但是这个案例有很多因素是受控的。只有Prime会员才能进店。其他人要想效仿,必须先建立起自己的会员制。

AiFi的方案是如果下载其app就可以拿货走人,不愿意下载的可以单独开辟收银台。但是商店的基础设施应如何支持这两种方案尚不清楚。

另一大问题是销售点存货损耗问题,比如算错钱或者偷盗。依图与东芝的智能收银摄像头是其中一些解决方案。但是防偷盗问题与运营范围和规模相关。AmazonGo只有到平方英尺,但使用的摄像头就达到了数百个。几乎把每一寸地方都覆盖到了。但传统的超市一般都有平方英尺或以上,需要解决摄像头如何布局才能高效的问题。

此外,由于商品种类繁多,如何才能识别哪位购物者取走了哪件商品呢?这些需要重量传感器、摄像头以及计算机视觉算法足够强大。

StandardCognition跟日本最大的CPG批发商百陆达合作,宣称要在年东京奥运会前改造家店铺。AiFi据报道已有20个零售商客户。

近期而言,这项技术的发展要取决于部署成本及存货损失成本,以及零售商能否承担这些成本和风险。

后端办公自动化

AI正在对事务性工作进行自动化,但是数据的不同属性和格式会对这项工作构成挑战。

不同的行业和应用都有其独特的挑战。

比方说临床试验里面很多试验都是手写记录然后数字化的。但是这种格式往往难以搜索,而手写的临床记录又会对自然语言处理构成独特挑战。车险索赔自动处理中评估损伤和追溯事故根源时也会遇到麻烦。

不过不同的板块都在开始不同程度地采用基于机器学习的工作流解决方案。

机器人流程自动化(RoboticProcessAutomation,RPA)泛指任何重复性的后端事务性工作的自动化,最近是炒作的主题之一。但就像AI一样,这个词涉及内容也是包罗万象,从数据录入到合规性检查、交易处理、客户培训不等。

很多ML解决方案已经开始将图像识别与语言处理整合到一起。

比如WorkFusion就把了解客户与反洗钱这样的后端运营工作自动化了。

独角兽UiPath的服务已拥有多家企业客户,包括DHL、NASA、HP等。

AutomationAnywhere是另一家独角兽。该公司有一个案例是跟一家全球银行合作,用机器学习进行自动化人力资源管理。“IQ机器人”会从多个国家多种语言提交的表格中提取信息、清洗数据,然后自动录入到人力资源管理系统内。

不过RPA在很多行业尚处在起步阶段,有的在叠加预测性分析曾之前还得闲解决数字化的问题。

语言翻译

语言翻译的NLP既是挑战也是有待发掘的市场机遇。大公司正在挑战极限。

机器翻译在后端办公自动化存在着巨大商机,在跨国组织、客户支持、新闻媒体等领域均有应用机会。

百度的耳机翻译器跟GooglePixelbuds类似,据称能完成40种语言的实时互译。

有的初创企业比如Unbabel则引入了人参与到记忆翻译系统当中,目标是用反馈回环来训练算法改进。

1年前,YoshuaBengio提出了用神经网络架构来取代传统统计法的翻译方案,后来Google就升级了GoogleTranslateTool的算法。Google原先采用的是基于短语的机器翻译(PBMT),其新的工具采用了神经机器翻译(GNMT)方案,并且提出了解决训练模型时遇到的时间和计算资源问题的解决方案。

不过最近的突破却是来自Facebook的。据称其突破在于过去的方法只有在资源丰富的语种互译时比较有效,但对少数语种的翻译就比较有局限性。Facebook提出了一种可学习93种语言的联合多语言句子表征架构。该架构仅使用一个编码器,且可在不做任何修改的情况下实现跨语言迁移。

随着大公司不断投入资源到改进翻译框架之中,翻译效率和语言能力也将得到改善,预计机器翻译将会在更多行业得到采用。

合成训练数据

训练AI算法离不开大规模的标签数据集。而逼真的仿造数据有望解决这个瓶颈问题。

AI算法的表现取决于获得的数据,但是为不同应用获取数据并给数据打上标签却是耗时耗钱的活儿,甚至没有可行性(不妨设想无人车需要的危险情况数据)。

合成数据集可以解决这个问题。

年3月,英伟达推出了NVIDIA推出DRIVEConstellation仿真系统,称可以在虚拟现实环境中测试自动驾驶汽车安全行驶数十亿英里。

比方说设想无人车行驶过程中遇到雷暴。英伟达的解决方案会模拟这种情况下车载传感器(摄像头或LiDAR)会生成什么样的数据。合成的传感器数据再提供给计算机进行决策,就好像自己真的在开车一样,然后把命令回传给虚拟汽车。

一个有趣的新兴趋势是利用AI本身帮助生成更“逼真”的合成图像来训练AI。比方说英伟达就用GAN来生成假的脑瘤MRI图像。

GAN可用来“增强”现实世界数据,意味着AI可以用混合现实世界和模拟数据来进行训练,从而形成更大规模更多样化的数据集。

机器人是另一个极大受益于高精度合成数据的领域之一。

类似AI.Reverie这样的早期阶段初创企业正在开发仿真平台为不同行业和场景生成数据集。

随着技术的发展以及合成数据能够更精确地模拟现实场景,预计这会成为无法获取大规模数据集的小公司的催化剂。

威胁

强化学习

从训练算法击败棋类游戏的世界冠军,到教AI耍杂技,研究人员正在用强化学习挑战极限。但对大规模数据集的需求目前限制了实际应用。

强化学习因为DeepMind的AlphaGo而引起了媒体的大量

分享 转发
TOP
发新话题 回复该主题