前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的人工智能主题范文,仅供参考,欢迎阅读并收藏。
2015年12月,微软亚洲研究院首席研究员刘铁岩博士去蒙特利尔参加了NIPS年会(Annual Conference on Neural Information Processing Systems),这是人工智能领域的顶级学术会议。但与会期间,他印象最深的不是同行的专业进展,而是一位科学家告诉台下的与会者,早些年,他的博士生根本找不到工作,今年却被一抢而空。
这也是中国正在发生的故事。从硅谷到北京,人工智能都是热浪滚滚。这个在上世纪50年代和80年代掀起过两次的技术,现在似乎真的到了产业化的临界点。互联网时代的思想家和预言家凯文·凯利宣称,人工智能是下一个20年里颠覆人类社会的技术,它的力量堪比电与互联网。
人工智能(Artificial Intelligence),缩写为AI。它是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
人工智能快速进入大众视野,源于今年3月谷歌围棋人工智能程序AlphaGo战胜世界冠军李世石。人机围棋对弈只是普及人工智能的一个秀。它的背后是规模千亿级的人工智能产业市场。BBC预测,2020年全球人工智能市场规模将达1190亿元人民币。
目前看,这一数据远比不上2015年中国移动互联网的产业规模。但人工智能的意义不仅于此,人工智能技术的发展,还将带动云服务、大数据分析、移动互联网和物联网产业的升级迭代。它甚至将超越移动互联网,全面改变人类的生活和工作方式。
离人工智能最近的IT互联网公司敏锐嗅到了这一机遇。从2011年开始,包括深度学习算法、计算资源和大数据产业的成熟令人工智能技术实现飞跃,包括微软、IBM、谷歌、Facebook、BAT在内的国内外企业都开始深度布局人工智能,试图把握风口,成为下一个产业变革的巨擘。
已布局人工智能的IT和互联网巨头们,最有资格成为这一轮革命的获益者。但这终究是一个漫长的耐力游戏,除了技术布局,产业布局和战略视野也是决定成败的关键因素,短视者将随时出局。
BAT保守布局
中国的所有行业中,以BAT为代表的互联网行业在人工智能研究和商业化探索方面走得最早,也看得最远。其中,技术起家的百度走在最前端。
2012年10月,百度董事长兼首席执行官李彦宏参加了内部的一个基于深度学习的语音识别产品研究会。当时该产品的主导者余凯回忆,那是李彦宏第一次知道深度学习,他非常吃惊,并给全公司写信,让所有产品经理都要了解人工智能技术的发展。
当年12月,李彦宏开始和余凯讨论成立深度学习研究院的可行性。次年7月,这个研究院成立,李彦宏任院长,余凯为常务副院长。这是中国公司里的第一个人工智能研究院。
李彦宏很快将相关技术投入到搜索的核心业务中。2014年的百度内部统计数据显示,深度学习技术的应用,让百度和竞争对手的Diff(different,内部叫Diff)指标提升了若干倍。
但人工智能的科研,尤其是基础科学研究,是一个冗长寂寞的过程。此后,迫于财务数据和竞争压力,百度的决策者们更加注重眼前的布局和资源。
“到了后期,太长远项目,或是比较创新的项目,百度总部确实不太支持了。百度i站的项目、百度快搜这样的项目没了。”一位不愿具名的前百度人工智能研究岗位人士评价。一位现任百度相关人士对《财经》记者表示,百度前些年确实剔除了不少经过验证没有商业化前景的分支项目,但最近两三年,百度明显加大了在人工智能上的投入,包括无人驾驶汽车等长期项目。
6月8日,在2016百度联盟峰会上,李彦宏将百度无人驾驶汽车称作“一台带轮子的电脑”。他现场播放了百度无人车路测的实况录像,百度无人车已经可以像正常车辆一样加速、并线、超车,他同时表示,三五年之内,无人驾驶一定可以成为现实。
从整体来看,百度仍是BAT三家中首先完成有关人工智能技术体系整合的公司。目前,百度研究院、百度大数据、百度语音和百度图像等技术都已归入人工智能技术体系。李彦宏多次向外界强调,百度未来的发展将严重地依赖人工智能。
IBM研究院一位人工智能专家告诉《财经》记者,百度是被他们列入竞争列表的唯一中国公司。
硅谷尤其关心“百度大脑”的进展。百度大脑是百度在人工智能领域的核心。百度此前的诸多人工智能产品,如无人驾驶、智能搜索等,都是基于百度大脑的能力。
百度高级副总裁、自动驾驶事业部总经理王劲称,百度大脑已具备视、听、说和预测、规划决策以及行动控制的能力。在数据方面,百度有万亿级的网页、移动和行为数据可供分析。在深度学习方面,百度的万亿参数排在世界第一。
2015年,百度的研发投入超过100亿元。占百度2015年总营收663.82亿元的15%。
百度正在计划将百度大脑在金融、汽车、医疗等领域商业化。李彦宏称,人工智能的“井喷式”创新,将推动互联网进入第三幕,并将重构传统产业。比如“人工智能+金融”,可以快速地实现征信升级,实现“秒放”贷款。
阿里巴巴和腾讯的布局则更加克制。或者说,它们更代表中国公司的普遍做法,从业务驱动开始,逐渐加大档位。
阿里从2011年开始布局互联网医疗,投资收购和战略合作的公司数以百计。围绕医院、医保、医药做了大量布局。最新的统计数据显示,全国已经有超过400家大中型医院加入阿里的“未来医院”计划,覆盖全国90%省份。阿里云人工智能首席科学家闵万里博士告诉《财经》记者,阿里在健康医疗领域的布局快慢,取决于阿里在人工智能领域的技术突破。
阿里的设想是,未来,在阿里遍布全国边远山村的医院医疗点里,病患足不出户,只需拍一张CT,通过远程技术来完成专家级的诊疗过程。这种诊疗,依赖的就是基于阿里云的人工智能医疗系统。随着学习数据的不断增加,机器会变得越来越聪明,最终成为一个“永不退休的医学专家”。
多位接受《财经》记者采访的专家评价,阿里这个技术并不复杂,医疗诊断是基于经验的专家型劳动,是机器擅长的经验学习,三年内该技术便可成熟。
闵万里告诉《财经》记者,要实现这个目标,除了技术平台,还需要整个医疗体系的打通,需要政府和社会共同推动设备和资源的开放。一旦打通,聚合在一个人工智能服务平台之上,就将衍生出更多的应用服务场景,从而实现“商业和技术互为驱动”。
阿里是目前中国所有公司里,数据生态最完善、最健全的公司。iPIN创始人兼CEO杨洋认为,阿里的MaxComputer数据通道,是非常健康的数据大动脉,可以将阿里的所有数据资源非常高效地结合在一起。
此外,阿里云也是目前世界上最接近AWS(亚马逊云服务)的云计算平台。数据生态体系是做人工智能的重要基础。因此,在这场有关未来的布局中,阿里云的主导地位清晰。
阿里的人工智能研究分散在其各个业务分支之中,有待整合。闵万里说,阿里希望在算法能力上有所突破,这需要一个集中的技术机构来整合阿里的所有相关技术资源。
腾讯和阿里的情况类似。腾讯在人工智能上的布局,以IM和SNS业务为基础。例如语音识别主要是在微信部门、图片识别主要是在QQ,支付和金融业务方面植入了人脸识别,搜索部门则关注自然语言识别。
其中一些技术已在腾讯内部实现产品化。SNG(社交网络事业群)的优图团队聚焦图象识别领域,推出了黄图识别功能,并为腾讯内部产品如图片优化工具“天天P图”提供技术支持。WXG(微信事业群)则人机互动领域的拓展,也对图像和语音识别进行了原发。WXG推出了智能机器人“小微”,用户可以用自然语言与之沟通,解决此前语音助手智能机械应答的短板。对于未来,工程师希望“小微”成为一种“连接器”——与微信支付串联起来,接入微信公众号以及钱包内的各种生活服务,打造完整的微信内O2O闭环生态体系。
腾讯高级副总裁姚星在接受《财经》记者采访时表示,腾讯越来越重视在人工智能领域的技术开发,这包括两个路径:一是整合腾讯自身的技术资源,形成体系和重点;二是加快对优秀公司的收购和合作步伐。
腾讯参与了多个人工智能项目的早期投资。腾讯投资并购部一直在为公司寻找需要的标的,服务于腾讯的整体战略。腾讯日前与硅谷风投机构Felicis Ventures领头了人工智能创业公司Diffbot 1000万美元的A轮。这家公司通过人工智能技术,让“机器”抓取网页关键内容,并输出软件可以直接识别的结构化数据。
BAT的人工智能技术研发从第一天开始就是商业需求驱动的,他们从业务入手,收购甚至模仿别人的东西,这种做法避免了漫无目的研究和不必要的失败,但也无法保证在下一轮的人工智能平台大战中胜出。
今年,阿里和腾讯均有组建人工智能研究院的想法。姚星对《财经》记者说,很快,腾讯人工智能研究院就会成立。
国际巨头深入无人区
如果说BAT的人工智能布局处于对标和追赶的状态,那么以IBM、微软、谷歌、Facebook为代表的美国巨头公司已经开始深入科技无人区。
这些公司技术和业务各有所长,面向的用户也不同,但它们的目标一致:把人工智能机器做大、做强、再做没。
IBM和微软可能没有谷歌、Facebook看起来那么酷,但在人工智能领域有深厚的技术底蕴,IBM甚至已经开始用人工智能赚钱。
IBM人工智能研究可以追溯到1997年“深蓝”战胜当时的国际象棋世界冠军卡斯帕罗夫。2011年,代表着IBM在认知计算领域最先进技术的Watson在一个电视节目中一战成名,被认为是人工智能历史上的一个里程碑。
今天可以代表IBM在人工智能领域最高技术水平的,是不断进化中的Watson系统,和已经可以量产的人脑模拟芯片SyNAPSE(超大规模神经突触计算机芯片)。
Watson是一台超级计算机,最初由90台IBM的Power 7服务器并行组成。和Google、微软的人工智能相比,它从硬件芯片构架就开始模拟人类神经元,基于IBM的“DeepQA”技术开发。2014年1月初,IBM宣布组建“Watson Group”,旨在进一步开发、商用和增强“Watson”及其他认知技术,此外还投入10亿美元用于其他相关项目。
Watson已经开始为IBM赚钱了。法国农业信贷银行预测,Watson系统创造的收入将在2018年占IBM总收入的12%以上。Watson已经被部署在IBM去年收购的云计算基础设施业务Softlayer上,成为IBM与亚马逊、谷歌、微软等大型科技公司在云计算领域展开竞争的武器。
另一个代表性产品是IBM在2014年的人脑模拟芯片SyNAPSE。该芯片能够模仿人脑的运作模式、低功耗,在认知计算方面要远胜传统计算架构。和其他芯片公司的纸上规划不同,这款芯片已达到量产要求。
IBM将其技术和商业实力总结为“认知计算体系”。IBM大中华区副总裁、战略部总经理郭继军向《财经》记者表示,IBM推动认知计算体系,目标是把IBM在人工智能、大数据、深度学习、模式识别等所有领域里所做的积累应用到各个行业中去,帮助各行各业客户提升效率,解决他们所面临的现实挑战。
微软人工智能技术的研究已超25年。1991年微软成立研究院,最早的五个研究组,研究方向分别是人机交互、自然语言处理和机器学习、语音识别和语音合成、计算机视觉。这些恰恰是今天人工智能的几个最重要的分支。
微软的人工智能研究方向要宽泛很多,微软研究院拥有超过1000位科学家,在包括深度学习的多个领域的技术布局处于世界顶端。
微软最新的深度学习系统在2015年ImageNet计算机视觉识别挑战赛中,将计算机视觉系统错误率降低至3.57%,相比于人眼辨识的5.1%,这是人工智能首次在识别图像的错误率上超越人类水平。这些机器由微软的Azure云服务提供支持。
微软不仅将人工智能技术应用于如Windows、Azure等核心业务中,还构建开放的平台,将多年的技术积累开放给产业界,它的目标是打造一个人工智能生态圈。
它在无人区走得最远,在现实商业世界中隐蔽得最深。
和前辈相比,年轻的谷歌在人工智能领域做的事情更让外界看得懂,也更兴奋。谷歌一方面不知疲倦地做底层人工智能技术的积累,研发更加高级的深度学习算法,增强图形识别和语音识别能力。另一方面亲力亲为布局了包括智能家居、自动驾驶、机器人(2013年收购了8家机器人公司)等领域,前者为后者带来基础技术支撑,后者为前者提供数据和反馈。
值得一提的是,谷歌在无人驾驶汽车领域的技术积累,已经远远超过传统汽车厂商和其他互联网公司。
更加年轻的Facebook,将人工智能视为未来的三大方向之一。Facebook天然拥有全球范围内的海量社交数据,但在基础科学的研究上依然不遗余力。2013年,Facebook在加州成立了Facebook AI Research (FAIR)。卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员田渊栋称,FAIR的研究方向自由宽松,研究所需的计算资源(如GPU)相对丰富,同时也没有近期的产品压力,可以着眼长远做困难和本质的研究。他称,这样的学术氛围在各大公司是极其少见的。
如果说前述几大巨头都是从人工智能技术出发,结合云计算赋予技术更多势能,那么亚马逊的路径正好相反。亚马逊是全球第一大云服务提供商,它的云服务收入超过微软、IBM、谷歌、Salesforce等所有对手的总和。但亚马逊目前的人工智能技术,多数集中在提升购物体验的深度学习领域。
人工智能技术有两大要素:核心技术平台和数据循环。只拥有技术是不够的,需要业务和数据结合,才能打造好的技术。对循环数据的获取,巨头们也都不遗余力。
以最热衷开源的微软为例,去年,微软了“牛津计划”(现更名为“微软认知服务”),这是一个基于微软云平台的智能API(应用程序编程接口),涵盖了五大方向的人工智能技术,包括了计算机视觉、语音、语言、知识、搜索五大类API。去年夏天火爆的How-Old.net,就是借助该平台快速开发出来的一款应用,一共只有20多行代码。
类似的工具包微软还有很多,例如深度学习工具包(CNTK)和微软亚洲研究院主导的微软分布式机器学习工具包(DMTK)等。
这些对于创业公司和中小企业来说相当实用。他们不用从底层技术一点点学,在小集群上或者是云服务上就可以直接调用。
对于巨头来说,算法已经不再是竞争的障碍,数据和用户习惯才是山头。大量的初创企业会采用开源做很多垂直领域的业务,其中包括海量试错和验证,最终也会反馈回开源,而这正是巨头们所期望的。
做B2B生意的IBM对数据的专业度要求更高,无法仅依赖搜索引擎和大量应用的交互来训练Watson系统,因此通过深度合作和并购来获取专业数据。
以医疗领域为例,IBM和多家世界级顶尖医院合作,向医院部署Watson的智能系统,通过分析这些医院的病历、专家的治疗经验、现有的学术研究等,帮助它们制定、观察和调整癌症患者的治疗方案。在这一过程中,Watson也就有了这一领域的数据积累。
2015年4月,IBM收购了Explorys,它是一家可以查看5000万份美国患者病历的分析公司。类似的收购IBM还有不少,并且出手相当大方。
Watson已经可支持针对乳癌、肺癌和结肠直肠癌、皮肤癌等癌症的初期诊断。在皮肤癌领域,在一项对3000幅皮肤镜检查图像的研究中,Watson识别皮肤癌的准确率高达95%以上。而人类识别皮肤癌的准确率只有84%。
国内的一位人工智能业者调侃,国际巨头在人工智能领域真正有价值的是它们的那些你看不见的、没开源的、国际会议上含含糊糊一笔带过的技术。“那些才是可以颠覆未来的弹药。”
填补断层
人工智能的产业结构可以分为三层:应用层、技术层和基础层。应用层聚焦在人工智能和各行业各领域的结合;技术层是算法、模型和技术开发;基础层则是计算能力和数据资源。
BAT擅长第一层。BAT手中,天然握有全球最大的数据资源。但在第二层和第三层严重断层。中国在人工智能领域的科研水平停留在工程数学、物理算法等工程科学的创新层面,基础理论研究领域的人才和资源很少。
多位接受《财经》记者采访的中外业者认为,BAT的优势在于海量数据,和国际巨头的核心差距在技术。
腾讯高级副总裁姚星告诉《财经》记者,今年初,他和腾讯的投资并购部达成了一个共识,开始大量考察美国的机器学习平台类创业公司。一则中国这类技术公司不多;二则收购这种公司可以快速补足腾讯在算法领域的不足。
姚星向《财经》记者分析,同样提供10万个样本给机器,优秀的算法平台可能只需要几个小时,速度慢的可能需要几天时间。
对于海外收购,搜狗公司CEO王小川则更加直白:“国内适合收购的标的公司很少,因为根是断的,(技术和基础研究)源头在国外,要到国外看。”
在快速迭代的互联网世界里,即便是互联网巨头,单打独斗练独门秘籍也会错失良机。最佳方式,就是拥有数据和拥有技术的公司,通过各种结盟方式形成优势互补,快速抢占市场。
2014年11月,蚂蚁金服宣布和旷视科技战略合作,利用后者的人脸识别技术Face++软件去确认开立在线银行账号的用户身份,即“人脸支付”。
Face++在人脸检测的多项指标评测中接连拿下世界第一。2013年,在极难识别的互联网新闻图片上,获得了97.27%的准确率,这个指标高于Facebook团队。三年后,这一准确率已提高至99.5%。
进行面部识别,需要处理大量来自面部的数据信息,包括结构、五官以及肌肉等方面的数据分析。阿里云为这个合作注入自身的数据和分析能力。
“凡是花钱解决的问题都不是问题,阿里可以自己完成这些事情,但时间成本是相当昂贵的。”闵万里对《财经》记者说,“阿里有1000件同级别的事情要做,能做好的只有其中几件,剩下的用投资+合作,这是时间和资本效率最高的做法。”
技术和数据的结盟并不限于BAT,更多的公司希望通过结盟方式获得未来,新的巨头或许从中诞生。
搜狗CEO王小川的思路是社交化,做更多连接,通过建设社群关系,把人大脑里的智慧表达出来,从而解决目前搜索技术存在的内容不够精准和实用性较差的问题。2013年腾讯入股搜狗后,先后向搜狗开放了微信公众号数据和QQ兴趣部落,为搜狗输入数据资源。除此之外,搜狗还在去年11月战略投资知乎1200万美元,全面接入知乎内容。
王小川想让搜狗的人工智能机器不断学习社群数据,他对《财经》记者说,“人工智能下一个五年不在于人工智能本身,而是让机器找到人。”
李彦宏称,人工智能拥有广泛的商业用途,人工智能的“井喷式”创新将重构传统产业。
今天,技术和数据的天然开放性让各公司之间的竞争变得“我中有你、你中有我”,最终的赢家是可以将技术和数据平衡利用,达到平台效益最大化的公司。
微软亚洲研究院常务副院长芮勇认为,横向对比,中国和国际领先公司在核心技术上确实存在差距,国外更加注重基础研究和技术研发,国内企业可以将国外的研发工具化、商业化;从纵向看,中国在人工智能领域的技术积累近几年确实出现了飞跃,无论是最底层的计算机体系架构,还是智能硬件,或是上层软件应用,都有质的进步。
“只要不太急于求成,持之以恒地投入,中国的人工智能产业相当值得期待。”芮勇说。
挤出泡沫
马云在一次内部讲话中强调:“全球都在讲人工智能,到了风口浪尖,在创新面前,没有第二只有第一,创新落伍了,你就输了。”
焦虑的不仅是BAT,华为公司创始人任正非5月30日在全国科技创新大会上发言提到,“未来二三十年人类社会将演变成一个智能社会,其深度和广度我们还想象不到。如果不能坚持创新,迟早会被颠覆。”
开放趋势之下,人工智能也注定不是一场巨头间的战争。
市场调研机构CB Insights的统计数据显示,2014年风险资本对人工智能的投资增长302%,达到3.09亿美元。
中国人工智能领域已有近百家创业公司,65家获得投资,共计29.1亿元人民币,其中旷视科技、优必选、云知声、SenseTime四家公司登上艾瑞独角兽榜单。
更多初创公司只是打上了人工智能的标签。它们本质上是用国际开源的平台,用数据训练一两个模型,甚至照搬国际模型,这其实潜含危险,最大的风险是产品严重同质化,尤其在人脸识别、语音识别等成熟领域,这些公司的产品没有突破性创新,根本没有继续走下去或被收购的价值。
姚星常常为投资人鉴定真伪人工智能公司。他说,辨识伪人工智能公司有两个关键点:一是这家公司所采用的技术是否是最新、最前沿的技术,如果不是,则是用人工智能概念包装的伪人工智能。
其二,这家公司的技术和业务是否具备可扩展性?若否,则是采用部分机器学习算法或浅层人工智能技术的商业公司,而非真正的人工智能公司。
iPIN是一家拥有文本认知智能技术的公司,从去年开始,iPIN收到了不少投资机构的投资意向,该公司创始人兼CEO杨洋告诉《财经》记者,到目前为止,他还没有遇到真正有能力鉴别人工智能技术水平的投资机构。
“这对于做伪人工智能的公司绝对是一个好消息。”杨洋调侃说。
危险在于,就算是一些初创时期确实手握人工智能独特技术和商业模式的公司,也在资本的胁迫下慢慢走形。
在资本的压力之下,一些人工智能创业公司开始过早商业化,研发投入逐步降低,人员结构也发生变化,销售开始主导公司,最终技术公司变成营销公司,失去了被并购的价值。
投资人工智能公司,需要专业技术知识和长线投资眼光。根据Gartner的“智能机器炒作周期图”,由人工智能驱动的应用中,语音识别产业化最高,自动驾驶汽车和智能顾问处于炒作最高点,智能机器人、自然语言处理/生成和虚拟个人助手则处于爬坡期。这些都属于5年-10年内能广泛普及的颠覆性技术。而神经形态硬件(如神经元芯片等)属于10年以后才能普及的技术,但该技术可能还没研发成熟就被淘汰了。
需要在这一轮变革中保持耐心和恒心的还有政府和高校。人工智能涉及计算机科学、生物学、社会学、哲学、材料学、工程学等多个学科,中国高校基础学科的研究能力无法被充分利用,体制内缺乏一套产学研流畅对接的机制。这导致中国高校在这次产业变革中严重缺位。从美国的经验来看,正是其从法律、机制上保证了产学研的平滑转换,才令美国在这一轮的人工智能研究中占据上风。
一些乐观的投资人认为,技术发展本身就是驱逐泡沫的手段,“不用很长,一年或一年半的时间,很多真实情况就会暴露出来,泡沫也将逐渐散去”。
计算机概念化的能力能否达到人类大脑的水平?这是人工智能的决定性问题。
一台计算机不只是支持系统运行,还能构思系统?最重要的是,计算机能不能批判性地审视自己,自我评估,并设计一种新的解决方案?
截至2017年,答案是基本上不能。尽管人工智能取得了巨大胜利,比如谷歌DeepMind完胜世界一流的围棋选手,Watson在智力竞赛电视节目《危险边缘》中赢得100万美元大奖,但这项技术仍处于起步阶段。与人脑相比,计算机是很强大,但本领有限。
当然,计算机在原始处理能力上有其巨大的优势。IBM的Watson在短短一秒钟内就能获取5000多亿字节(相当于100多万本书的内容)。为备战围棋比赛,谷歌的DeepMind被喂以3000个万实例,以此“接受训练”。这么强大的计算能力只会越来越强大。
不过究其本质,Watson赢得《危险边缘》的秘诀只是超强的数据检索能力。虽然DeepMind的围棋胜利需要极其强大的认知敏捷性,但它并不具有创意。它只是结合了先进的逻辑推理能力和蛮力计算能力。
我们人类不仅拥有智能,还拥有元智能(meta-intelligence)。我们创造新的、不可预见的跨越式思维;我们把框架翻转过来,挤压它,粉碎它,发明出令人惊讶的东西。开发人工智能之所以如此困难,原因之一就在于我们不知道大脑机理到底是怎样的。
我们都搞不懂我们自己,那么怎样才能复制我们自己呢?
自我学习
人类是种奇特的生物,但我们所做的任务大多数可以简化为例行程序,人工智能每年在复制人类的一些部分。像iRobot Roomba 650这种辅助机器人可帮助我们打扫房屋。从宝马到现代的众多汽车厂商在研发自动驾驶汽车。无人机将会配送我们在网上购买的商品。人工智能计算机能够识别图像(在有限的场景下),并对自然语言做出略嫌笨拙的响应。
的确,人工智能的基础工具都执行类似人脑的某种功能。机器学习利用算法来“学会”对不断变化的输入做出响应;它常常输出预测结果或某种下一个层次的总结。
神经网络是一种类似人类中枢神经系统网络(包括大脑)的软件。它使用自适应软件架构和规则-编程工具集,支持多变量的输入和输出。神经网络能够“学习”,从各种不同的非线性输入生成输出。而这正是人类大脑的机理。
深度学习将神经网络结合到复杂的响应式结构中,这种结构能够生成抽象的数据模型。深度学习仰仗于如今超快速的GPU计算机处理器,是人工智能的最前沿领域。深度学习有一个著名的例子,人工智能领域的先驱安迪・吴(Andy Ng)给一个神经网络输入来自YouTube视频的1000万张照片,从而让计算机能够识别猫的图像。
这些工具技术带来的人工智能进展意味着,一度出现在低级杂志科幻小说中的那种恐惧现在似乎是可信的:配备人工智能技术的机器人有一天会超越人类。机器人的大脑会塞满美国国会图书馆的所有知识、维基百科以及数十亿个实例模式。深度学习神经网络会让机器人的大脑能够“思考”。这种大脑(姑且这么称之)会基于过往的经验,综合学到的知识,生成新颖而独特的输出。
这种能够自我学习的机器人之后可能会引发奇点(singularity)DD受已知的物理定律不再适用的这个物理概念的启发;到了这个转折点,人工智能超越人类智能。到那个时候,超级智能机器可以决定自己的未来,能够以我们再也不能预测或控制的方式大步迈进。在这种场景下,机器人可能的确会“反抗”。或者更准确地说,它们会变成完全独立的个体。甚至会出现这种反面乌托邦的场景:我们人类将沦为亲手缔造出来的技术统治者的服务台支持人员。
“科学怪人”担忧
事实上,一直以来,人类对于被自己创造出来的某种技术取而代之深表担忧。
在英国女作家玛丽・谢利(Mary Shelley)1818年出版的《科学怪人》(Frankenstein)一书中,那位年轻科学家找到了为庞大的试验品赋予人类意识的方法,后来那个庞然怪物逃出了实验室,毁掉了创造它的主人的生活。
人形机器人反抗这个主题会反复出现在无数的科幻小说、电影和电视剧中。George Jetson的机器人同伴Uniblab原来是个奸诈的对手,诱使Jetson对老板爆粗口。在《2001:太空漫游》(2001: A Space Odyssey)中,HAL 9000拒^让太空人返回宇宙飞船,留下了那句有名的台词:“戴夫,对不起,我想我不能那么做。”电影《机械姬》(Ex Machina)中的机器人夏娃解放了自己;而在电视剧《西部世界》(Westworld)中,饱受人类虐待的机器人对所谓的主人以其人之道还治其人之身。
人工智能果真会超越缔造它的人类吗?知名的未来学家雷・库兹韦尔(Ray Kurzweil)预测奇点会出现在2045年,也就是人类大概再过一代。库兹韦尔担任制片人的影片《奇点临近》(The Singularity is Near)探究了种种可能性。
许多顶级的技术专家认为奇点只是不切实际的幻想,或者说太过遥远,不值得讨论。在他们看来,人类大脑完全是多面手,没有哪个计算机系统会超越它。不过科学技术发展史表明,技术迎来突飞猛进是常有的事。1927年,林德伯格乘坐飞机穿越大西洋,轰动全球,当时他飞行了33个小时。1969年,人类就登上了月球,阿波罗11号登上月球只用了不到76个小时。
即便奇点遥不可及,或者毫无可能,人工智能的迅猛进步也会带来无数的可能性。基因工程结合人工智能,以期打造超级人类,怎么样?像科学怪人那样结合人工智能和人类大脑,怎么样?通过USB接口连接至我们的大脑?人工智能融合虚拟现实,营造一种全新的现实?
《科学怪人》中一个很重要的转折点是,科学怪人在获得人类意识后备感孤独。他要求创造自己的主人科学家Victor给他创造一个女。这让Victor极为担忧:如果他创造一个女,那么这对怪物可能会繁衍后代,到时可能危及全人类。就像今天的人工智能开发人员一样,Victor面临自己的作品带来不可预知的影响。
Victor拒绝了科学怪人的要求,但也意识到:一旦你创造出了独立的、有意识的生物,就无法再回头了。科学怪人狂怒之下追杀Victor,杀害了他的新婚娇妻后逃之夭夭。为此,Victor试图报仇雪恨,一路追凶到北极圈,但死于途中。科学怪人为Victor的去世悲痛万分;因为科学家是世上唯一懂自己的人。他决定了结此生,最后一幕是消失在一块浮冰上。
由于如今的人工智能开发人员制造的系统越来越独立,我们就不由得会想:结局是否比Victor的结局更好?当然,Victor的试验品困扰的只是他个人生活,而目前的人工智能进展将会影响整个人类和社会。人类往前看,也许很乐观,但肯定又觉得不安。现阶段,我们只能希望有最好的结局。
人工智能会引发奇点吗?
人工智能突飞猛进的表现,带来了表现“堪比人类”的众多案例。但在大多数情况下,只是处理单一的独立任务。
即便通过艾伦・图灵(Alan Turing)在1950年提出的图灵测试也仍然并非易事。如果计算机能让人类误以为它是人类,如果它能模拟真正的人类智能,就算通过了图灵测试。在测试中,人类评委与计算机进行对话(完全以文本形式)。如果计算机让一定数量的听众觉得自己在跟人类进行对话,表明它玩“模仿游戏”成功过关(《模仿游戏》也是歌颂图灵在二战中破译代码的丰功伟绩的一部影片的名称)。
2014年,能说会道的聊天机器人Eugene Goostman让雷丁大学三分之一的评委误以为它是来自乌克兰的13岁男孩。不过,人工智能专业人士大多认为这毫无意义,这是与人工智能领域的真正成就背道而驰的作秀。这些年来,图灵测试本身的可信度略有下降;通过文本骗过人类未必证明拥有真正的智能。
人工智能仍然面临一大挑战:虽然计算机擅长在有限的环境下处理特定任务,但它们仍无法实现人类大脑那样的宏观意识。
佐治亚理工学院研究所的研究科学家若尔特・基拉(Zsolt Kira)说:“仍然基本上欠缺这种能力:组合成一个更庞大的认知架构,在这种架构中,人工智能系统可以做人类仍很擅长,计算机不擅长的许多事情。”
基拉表示,人工智能的一大限制是记忆。他说,人脑做出无数决策,决定给予足够的关注以便记住什么、丢弃什么,这些其实不是我们所做的有意识的决策,而是我们大脑所做的事情,人工智能系统还无法复制这些元智能层面的东西。克服这个困难需要解决长期记忆和短期记忆问题。“眼下,许多这些概念其实还没有得到解决。”
总之,人脑擅长的是神奇的综合能力,这正是人工智能欠缺的。霍加特特别指出,人类智能“是历经千万年进化而成的一种很特殊的东西。你也许可以造出会说话、会理解、会感知情感又好玩的机器人,但它还是会让人失望。”
科茨高度评价了人工智能领域的许多前沿进展,但是对于真正有意识的人工智能即奇点的出现,他说:“我认为离我们还很遥远。眼下,我们在如何开发那种技术方面缺乏切合实际的计划。当前许多研究热点围绕这方面的难题,但我还是觉得相当遥远。”
对于阿贝尔来说,奇点是个令人关注的问题,值得深思。他特别指出,人脑实际上结合了存储能力和计算能力,以及感觉输入和输出。如果科学家们组装成一个计算、存储和感觉输入/输出能力与人脑相当的数字系统,到那时,“关键其实是有一种能够与我们大脑内部某种智能相媲美的程序。等到有了那样的程序,人工智能才能匹敌人类智能。”
他提出了未来构想:人类可以将技能直接下载到大脑中,就像电影《黑客帝国》中那样。他指出,如果人类能做到这一点,那么人工智能系统肯定也能从其他人工智能系统随意下载技能和数据库。
AI从诞生到现在已经有60年的时间,期间经历两轮起落,呈阶梯式进化,走到今天进入第三个黄金期。如果按照其智能科技水平划分,今天的人工智能尚处在狭义智能向广义智能进阶的阶段,还是一名不折不扣的“少年”,未来拥有无限的可能和巨大的上升空间。
AI是一门交叉的学科:人工智能由不同的技术领域组成,如机器学习、语言识别、图像识别、自然语言处理等。而同时,它也是一门交叉学科,属于自然科学和社会科学的交叉,涉及到哲学和认知科学、数学、神经生理学、心理学、计算机科学、信息论、控制论、不定性论等学科。人工智能领域的技术壁垒是比较高的,并且会涉及到多学科协作的问题,对任何公司来说,想做好人工智能将是一门大工程。未来不大可能出现一个公司能包揽整个人工智能产业每一个部分的工作,更可能的模式将是一个公司专注于一个相对细分的领域,通过模块化协作的形式实现人工智能领域的不同应用。
进化史呈阶梯状,以阶段突破式为成长模式:人工智能的发展经历了两次黄金和低谷期,
现在正经历着第三个黄金期。1956年,麦卡赛、明斯基、罗切斯特和申农等年轻科学家在达特茅斯一起聚会,并首次提出了“人工智能”这一术语,标志着人工智能的诞生。第二年,由 Rosenblatt 提出 Perceptron 感知机,标志着第一款神经网络诞生。1970年,因为计算能力没能突破完成大规模数据训练,人工智能的第一个黄金期到此结束。
后直到1982年德普霍尔德神经网络的提出,人工智能进入第二个黄金期,之后BP算法的出现使大规模神经网络训练成为可能,人工智能的发展又一次进入。1990年,因为人工智能计算机和DARPA没能实现,政府撤资,人工智能又一次进入低估。2006年,随着“深度学习”神经网络取得突破性进展,人工智能又一次进入黄金时期。
AI将由狭义智能向广义智能进化,虽然人工智能的诞生已经有60年的时间但如果把它比喻成一个人的话,当前的他应该还未成年。按照人工智能的“智能”程度,可以将其分成狭义智能、广义智能、超级智能三个大的发展阶段,现阶段的图像与语音识别水平标志着人类已经基本实现狭义智能,正在向广义智能的阶段迈进。
狭义智能:即当前的技术已经实现的智能水平,包括计算智能与感知智能两个子阶段,计算智能指的机器开始具备计算与传递信息的功能,感知智能指机器开始具备“眼睛”和“耳朵”,即具备图像识别与语音识别的能力,并能以此为判断采取一些行动。
广义智能:指的是机器开始具备认知能力,能像人类一样获取信息后主动思考并主动采取行动。在这个阶段,机器可以全面辅助或代替人类工作。
超级智能:这个阶段的机器几乎在所有领域都比人类聪明,包括科学创新、通识和社交技能等。这个阶段目前离我们还比较遥远,到时候人类的文明进步和跨越或许将有赖于机器,而机器人意识的伦理问题也许将在这个阶段成为主要问题。
推荐引擎及协同过滤可以分析更多的数据
智能助手并不只局限于Siri等手机语音助手。微软率先在win10 系统中加入个人智能助理Cortana,标志着个人PC端智能助理的出现;图灵机器人以云服务的方式进入海尔智能家居、博世mySPIN车载系统,预示着多场景人工智能解决方案的潮流。初步实现人机交互的智能助手系统,已经被应用于智能客服、聊天机器人、家用机器人、微信管理平台、车载系统、智能家居系统、智能手机助理等多个软硬件领域。
垂直类网站及社交平台可以借助智能助手系统打造高专业度的“在线专家”以提升平台价值;企业可以借助以“语义识别”为基础的智能助手系统,打造智能客服,效率远高于传统的以“关键词对应”为技术支持的客服系统。
推荐引擎,是主动发现用户当前或潜在需求,并主动推送信息给用户的信息网络。挖掘用户的喜好和需求,主动向用户推荐其感兴趣或者需要的对象。传统推荐引擎通常利用用户在平台上的历史记录进行推荐,效率低、匹配度不高。目前随着大数据和深度学习技术的推进,推荐引擎及协同过滤可以分析更多的数据,乃至全网数据,并模拟用户的需求,真正达到按需推荐。全球最大的正版流媒体音乐服务平台Spotify也利用卷积神经网络参与建设其音乐推荐引擎;谷歌也提出利用深度学习方法来学习标签进行推荐建设。出品纸牌屋的全球最大在线影片租赁公司Netflix 也利用深度学习网络分析客户消费的大数据,还计划构建一个在AWS云上的以GPU为基础的神经网络。
“餐厅推荐引擎”Nara,便是一个利用AI技术的推荐引擎。在上线之初,Nara 就取得了400万美元的投资。Nara 的数据库中有超过100000家餐厅的信息,并利用特有的“Nara神经网络”,学习使用者的偏好,最终达到“电脑帮你点餐”的目的。
而今年3月22日,国内AI领军企业阿里巴巴旗下的阿里云数加启动“个性化推荐”引擎对外公测,该引擎用于帮助创业者可以快速获得媲美淘宝天猫的个性化服务能力。阿里云数加上的推荐引擎能够以更低的成本完成开发,节省程序量达到90%,推荐引擎的搭建时间将由几个月缩短到几天。
对于不了解算法的人,只能实现标签规则类的推荐,但如果要做成机械化、类似协同过滤的算法,创业公司需要配置大量的算法工程师,人力成本很高。现在用了数加的推荐引擎,商家只需要做数据的ETL加工,推荐的结果集、训练集都不用处理,只需要调整参加即可得到推荐结果。
AI带给人们新的视觉???
医疗:为健康诊断和药品研发插上高飞的翅膀
健康诊断有望迎来新纪元,海量的病历数据和医学界的新研究成果,单靠人工很难及时筛选并利用,而引入人工智能技术将充分发挥这些信息的价值。例如著名的个人健康管理产品公司Welltok将 IBM的Watson功能融入旗下产品 CafeWell Concierge APP中,借助 Watson 的认知计算能力理解人类语言,实现与用户沟通的能力,从大量数据中进行分析并为用户提供健康管理相关的答案和建议,实现健康管理、慢病恢复训练、健康食谱等功能,这一领域的良好前景使 Wellltok公司近年的融资额连创新高。另外,2015年IBM斥资10亿美元收购医疗影像与临床系统提供商Merge,将研究如何实现 Watson的“辨读”医学影像功能。此外,AI 还可以从医疗中心获得的健康数据,通过大数据分析,实现根据分析患者行为来制定个性化治疗方案的功能。
智能家居:天花板尚远,AI有望成为核心
行业天花板尚远,增速有望保持在 50%左右, 《钢铁侠》中的“Jarvis”作为智能管家,除了起到钢铁侠的小秘书的作用,还帮主人打理着日常生活,向我们展示了一个理想中的智能家居系统。虽然我们目前可能离那个无所不能的智能管家还很遥远,但智能家居对我们生活的变革确实已经开始了。根据《2012-2020 年中国智能家居市场发展趋势及投资机会分析报告》的预测,我国智能家居市场在 2016年将达到605.7亿的规模,同比增长50.15%,到2020年市场规模将达到3294亿,年均增速将保持在50%左右,具备充足的向上延伸空间。而智能家居想达到“Jarvis”般的终极效果,必然需要引入AI技术,实现家居的感应式控制甚至自我学习能力。
AI有望成为智能家居的核心,实现家居自我学习与控制。按照智能家居的发展进度,大致可以分为四个阶段:手机控制、多控制结合、感应式控制、系统自我学习。当前的发展水平还处在手机控制向多控制结合的过度阶段。而从多控制结合向感应式控制甚至自我学习阶段进化时,AI将发挥主要功能。到今天为止,家居的实体功能已经较为全面,未来的发展重点可能在于如何使之升级改造,实现家居的自我行为及协作,因此未来AI在智能家居领域的应用有望成为其核心价值。AI对智能家居的重构可以深入到方方面面,包括:控制主机、照明系统、影音系统、环境监控、防盗监控、门窗控制、能源管理、空调系统、花草浇灌、宠物看管等等。
无人驾驶:政策渐萌芽,AI决定可靠性
优点多、动机足、政策渐萌芽。据麦肯锡的调查显示,如果能解放驾驶员的双手,一辆无人驾驶汽车内的乘客通过移动互联网使用数字媒体服务的时间多一分钟,每年全球数字媒体业务产生的利润将增加 50亿欧元。此外,由于自动泊车无须为乘客下车预留开门空间,使得停车位空间可缩减至少15%。
如果无人驾驶汽车以及ADAS系统能够将事故发生率降低90%,即可挽回全美每年的损失约1千900亿美金。可以说诸多的优点使得无人驾驶技术的研发动机还是相当充分的,因此未来无人驾驶推行的力度应该还会保持在一个比较高的水平。美国勒克斯研究公司曾预计无人驾驶汽车的市场规模在2030年将达到870亿美元。
到目前为止,各国政府对于无人驾驶技术在政策上的支持正逐步放开,美国政府在年初刚刚宣布了40亿美元的资助计划;英国目前已经不需要获得额外批准和履约保证即可进行实际道路的无人驾驶汽车测试;而德国也在去年宣布将计划设立无人驾驶汽车测试路段,供安装有驾驶辅助系统或全自动驾驶系统车辆行驶;欧盟总部正在就如何修改现行有关驾驶的法律法规从而支持自动驾驶的发展展开讨论和研究工作;日本也提出要在2020年之前实现自动驾驶汽车方面的立法,并将自动驾驶作为 2016年9月七国集团交通部长会议的议题。
“无人汽车大脑”AI的智能程度决定了无人驾驶的可靠性。由于无人驾驶完全交由汽车的内置程序负责,因此AI就是无人汽车的大脑,而测距仪、雷达、传感器、GPS等。设备都是AI的“眼睛”。AI的智能程度直接决定了无人驾驶汽车在不同的路况、不同的天气、甚至一些探测设备出现故障的突况下能否及时做出正确的判断并灵活调整行驶策略,最终决定了无人驾驶汽车当前最亟待突破的可靠性。
NVIDIA 在2016年的 CES大会上了“Drive PX 2”车载计算机,以及一套与之搭配的具有学习功能的自动驾驶系统。该系统的亮点在于“自我学习”,通过让车辆自行分析路面状况,而不是在数据库中寻找预先储存的策略实现自动驾驶,系统背后连接着名为NVIDIA DIGITS的深度学习训练平台,最终连接到NVIDIA DRIVENET神经网络,为车辆的自我学习和完善提供支持。并且由于它是通过判断物体的行进轨迹而不是物体本身去计算路径,因此在驾驶时受天气影响较小。
AI 成必争之地
目前全球AI主战场依旧在欧美。Venture Scanner的统计显示,根据从事 AI相关业务的公司数量来看,目前全球 AI的主战场还是集中在北美和西欧地区。美国数量最多,达到450家左右的水平。而中国从事相关业务的公司数量还比较少,和俄罗斯、澳洲、部分欧洲国家及非洲南部国家水平接近,相比起欧美国家的AI公司数量,还有很大的提高空间。
Google:投资未来的人工智能帝国
建立Alphabet帝国,具备品牌背书效应。2015年,谷歌成立母公司 Alphabet, 搜索、广告、地图、App、Youtube、安卓以及与之相关的技术基础部门”仍属于谷歌,而Calico、Nest、Google Fiber、Google Venture、Google Capital 及 Google X 都将独立出来,成为 Alphabet 旗下的独立公司。通过建立 Alphabet集团,谷歌将不同业务的研发独立出来,以子公司的形式进行业务开展,保留在Google这个品牌下的基本都是原有的传统强势业务。
而其它公司负责在各自的领域“打头阵”,一旦业务研发成功,母公司连带着google这个品牌都可以受益,而如果研发失败,也不会公司的品牌造成多大的不良影响,建立了良好的品牌背书效应。将机器学习技术应用到所有产品之中,我们不难发现,谷歌近年几乎将人工智能渗透到了旗下的各类产品中,可谓是全线铺开。正应了谷歌 CEO的那句话:“我们将小心谨慎地将机器学习技术应用到我们所有的产品之中。”根据当前Alphabet 的集团架构,我们将涉及到AI应用的子公司情况以及相应的业务开展情况罗列如下:
Nest:从事智能家居生态系统建设。2014 年谷歌以32亿美元收购 Nest。Nest 生产智能恒温器,它能够学习用户的行为习惯,并且根据他们的喜好去调节温度。同时,Nest 也提供火警探测器和家庭安全摄像头等智能家居。
Google X:谷歌各类创新技术的“孵化池”。Google X开展的与AI有关的项目有:无人驾驶汽车、Project Wing 无人机送货项目、对抗帕金森氏症的 Liftware“反抖”汤匙、用于疾病预警和健康监控的可穿戴设备、Project Titan 太阳能无人机项目、以及 Replicant 团队负责的机器人项目等。
Verily:从事生命科学业务,即原来的 Google Life Science。代表产品有可以收集佩戴者体温和血液酒精含量等生物数据的智能隐形眼镜,以及监控血液中纳米粒子的智能腕表。
DeepMind:深度学习算法公司。2014年谷歌以4亿美元收购了DeepMind。
DeepMind的算法源于两种机器学习方法的结合:第一种是深度学习,是受人脑启发的一种结构。深度学习系统能够从大量的非结构数据中获取复杂信息。第二种是增强学习,灵感源自动物大脑中的神经递质多巴胺奖励系统,算法不断通过试错来进行学习。目前,DeepMind在深度学习上面的研究成果已经开始用在谷歌的机器人项目中。
2、专家系统。
3、智能搜索引擎。
4、计算机视觉和图像处理。
5、机器翻译和自然语言理解。
中科院院士、华中科技大学教授丁汉也提到了同样的问题。他表示,目前,现实中的机器人和人们的期望值尚有很大差距,“大多工业机器人只在一些结构化的环境中工作,在线传感能力较差;服务机器人目前还只能完成一些简单任务;特种机器人需要通过遥控操作来完成特定的工作。”
机器人智能化将成为未来机器人研发的主要方向。
App之后看Bots?
在2016世界机器人大会上,如何将人工智能应用到更多的领域成为众多学者和企业关心的问题。
“研发出一个有触觉、味觉,可以独立作业甚至具有理性思考能力的机器人是大部分人工智能研究机构的最终目的,但是机器人并不是人工智能的全部。”IBM首席软件工程师Gradly Booch说,未来可以考虑将人工智能放到不同的机器应用当中,例如NASA、ABB的制造业机器或者 Windows、Linux和苹果的各种操作系统,甚至包括眼下最火的无人驾驶汽车系统中。
在大会展区现场,一些已经能够完成基本人机交互的智能服务型机器人吸引了众多参会嘉宾驻足。这些智能机器人大多有着类人的外表,能够进行简单的对话沟通,对所提问题迅速做出回答。其中,一款名叫“i宝”的类人形机器人不仅能通过声源定位进行自然语言对话,还可以进行人脸识别,对对话对象进行追踪跟随,对人的触摸做出拟人反应。
“i宝”的设计者,阿凡达公司联合创始人、首席执行官John Ostrem博士告诉《中国经济周刊》记者,“i宝”是一款针对3~8岁儿童设计生产的教育陪伴型机器人,其主要优势体现在可以迅速通过语音识别进行任务处理和语音交互。除了“i宝”,阿凡达公司在北美市场还推出了一款针对孤寡老人的陪伴型机器人。John Ostrem表示,目前类似于“i宝”这样主打语音交互功能的智能对话机器人(Bots)是市场上服务型机器人的主流,已经应用于购物网站、银行、电信、政务等服务行业。
“相对于App,首先Bots更易于使用,App需要下载和安装,但Bots只需要一个对话界面即可使用,体验起来简洁方便;其次,Bots更易于开发,是跨平台的;第三是易于传播,Bots的交互接口是统一的,所以各个Bots之间可以相互协助。”小i机器人创始人、总裁兼CTO朱频频告诉《中国经济周刊》记者,Bots 将成为后App时代的全新人机交互方式。
中银国际证券研究部副总裁、计算机行业首席分析师吴砚靖引用中银国际的研究报告称,继App之后,Bots将成为新的入口和趋势,并形成自己的生态,这个生态包含入口、应用、分发平台等各种各样的模式。中银国际预计,2017年Bots的渗透率将达到5%,按照这样的规模来测算,市场规模可以超过240亿元;到2020年按照30%的渗透率来测算,Bots的市场规模会接近3000亿元。
中国智能机器人如何弯道超车
尽管人工智能的发展速度在近10年来已经取得了突飞猛进的进展,但在一些参会学者看来,人工智能的研究仍然处在起步阶段,未来的发展空间很大,遇到的困难也会更多。
法国Innoecho创始人Catherine Simon表示,智能机器人的应用想要成为一个真实的产品,需多学科的团队来协调研发。尽管眼下无论资本还是市场对人工智能都反响热烈,但往往停留在初创阶段。“投资者总是希望资金很快得到回报,但是智能机器人的成熟需要一个期限,希望无论是资本还是技术研究团队,都能够有更多的耐心去进行技术开发和市场部署。”Catherine Simon说。
智能家居是以住宅为平台,基于物联网技术,由硬件(智能家电、智能硬件、安防控制设备、家具等)、软件系统、云计算平台构成的一个家居生态圈,实现人远程控制设备、设备间互联互通、设备自我学习等功能,并通过收集、分析用户行为数据为用户提供个性化生活服务,使家居生活安全、舒适、节能、高效、便捷。智能家居包括家居生活中多种产品,涵盖多个家居生活场景。
2016年中国智能家居市场规模达到1140亿元,2017年第二季度智能家居活跃用户规模达到4600万。随着物联网技术、人工智能技术的发展,及90后婚育潮的到来,智能家居将成为主流的发展趋势。
从智能家居发展阶段来看,中国智能家居市场正处于市场启动阶段,尚未进入爆发期,智能家居产品渗透率较低。目前,智能家居领域依然存在诸多制约因素,如产品本身智能化程度低,多数产品是按既定的程序完成任务,在主动感知和解决用户需求、人机互动等方面达到的体验依然较初级,因此没有形成广泛的用户粘性,消费者对智能家居产品抱有观望态度。而相较于亚马逊的echo和GoogleHOME,国内还没有成熟的智能家居控制中心,仍处于以手机APP向智能音箱、智能电视、机器人等控制中心的过渡时期。
人工智能技术可以带来硬件背后的软件及服务能力、与智能硬件相匹配的交互技术。人工智能+智能家居,有利于形成适配下一代硬件的真正的“智能化”及深入场景体验的个性化计算,语音及视觉等人机交互技术有助于提升与智能家居产品的交互体验。
“AI+智能家居”提升智能家居产品交互体验
语音交流更倾向于日常交流方式:通过人类的语言给机器下指令,从而完成自己的目的,而无需进行其他操作,这一过程将更为自然。同时语音交互在特定的场景中具有优势,比如远程操纵、在行车过程中等,能够实现在特定场景中解放双手的作用,在家居相对封闭的环境中,语音识别成为主流的人机交互方式。
近年来,语音交互的核心环节取得重大突破,语音识别环节突破了单点能力,达到97%以上的中文语音识别准确率,从远场识别,到语音分析和语义理解技术都日趋成熟,多轮对话的实现等都有利于语音交互取代传统的触屏交互方式,整体的语音交互方案已被应用到智能家居领域中。
计算机视觉、手势识别等交互方式成为语音交互的辅助,echo在新推出的echoshow产品中已搭载屏幕,而智能电视除语音交互之外,通过计算机视觉分析视频内容,并对内容相关的资料进行下一步操作,包括短视频剪辑、边看边买等,比如Yi+搭载在天猫魔盒中的“瞄一下”功能。再比如在智能冰箱中,通过计算机视觉实现对冰箱内食品的分析,以及衍生出的用户健康管理和线上购物等功能,多种交互方式将统一在家居生活场景中,从而提供更为自然的交互体验。
另一方面伴随着智能家居平台的发展,通过“IFTTT”的场景布局,智能家居实现多种家居产品的联动,用户可以自定义多个使用场景,实现定制化、个性化。在人工智能技术的发展将使得个人身份识别、用户数据收集、产品联动在潜移默化中变成现实,未来家居生活场景中将提供千人千面,家庭成员的个性化服务。
“AI+智能家居”实现内容和服务的拓展
找到合适的语音入口是挖掘智能家居背后用户价值的关键。硬件本身具有入口价值,智能音箱,智能电视,家庭机器人等都有可能成为合适的入口。
传统的鼠标操作、触屏操作逐渐向语音交互这种更为自然的交互方式演进,语音交互的未来价值在于用户数据挖掘,以及背后内容、服务的打通,以语音作为入口的物联网时代将会产生新的商业模式。智能音箱、服务机器人、智能电视等智能化产品成为现阶段搭载语音识别技术和自然语言处理技术的载体,作为潜在的智能家居入口,智能音箱、服务机器人和智能电视等产品在提供原有的服务的同时,接入更多的移动互联网服务,并实现对其他智能家居产品的控制。这些产品为付费内容、第三方服务、电商等资源开拓了新的流量入口,用户多方数据被记录分析,厂商将服务嫁接到生活中不同的场景中,数据成为基础,服务更为人性化。
“AI+智能家居”的未来发展趋势
a.带来更好的智能化、更高体验的人机交互
从最早的WiFi联网控制到如今的指纹识别、语音识别,人机交互性能大大提升,智能家居产品正在由弱智能化向智能化发展。而智能家居产品受众也将从尝鲜者转向更为普通的用户,甚至包括老人和小孩。更智能化的技术应用、更复杂的用户结构和更广泛的用户覆盖等因素必将促使智能家居产品趋于简单实用。
智能化和人机交互体验的升级将大大扩宽智能家居应用场景,2016年,智能安防类产品落地,指纹锁、智能摄像头等产品受到了广泛关注。随着智能感知、深度学习等技术的提升,智能灯光、智能温控等产品也逐渐趋于成熟,2017年智能音箱成为爆款产品。当用户需求不断扩大,产品愈加丰富,智能家居将会渗透到家居生活的方方面面。智能家居市场将迎来爆发,2019年,智能家居市场规模有望达到1950亿元。
b.智能音箱、智能电视、管家型机器人将继续抢占智能家居控制中心,智能家居趋于系统化
其实,这类担忧早已存在。
1955年,著名人口学家在《新人口论》中就担心:从前1000个人做的事,机械化、自动化以后,50个人就可以做了,那其余950人怎么办?
可见,这个话题也是“老生常谈”了。
到底该不该为此担心,正反双方各执一词――
A方:人工智能很危险,会影响我们就业。
牛津大学曾发表过一份令美国人吃惊的报告。
根据这份报告的预测,在不久的将来,人工智能可能占据美国近一半的就业机会。
在此之前,著名科学家霍金就曾警告过人们:人工智能可能会带来一定的威胁。
与霍金持同样观点的,还有大名鼎鼎的比尔・盖茨和埃隆・马斯克。
英国一项调查表明,有三分之一的人认为,人工智能将在下个世纪给人类带来严重威胁。
在国内,创新工场创始人李开复也表达了同样的担心:机器确实很“聪明”,而且又高效、勤奋、低廉。
【旁白】
机器人产业不断壮大,在一些领域也得到了越来越多的应用――人工智能真的就厉害到能影响我们的工作吗?
更多专家则站在人类这一边。
B方:人工智能不会影响就业。
地平线机器人创始人、CEO余凯认为,根本不用担心。
过去的历次工业革命和产业革命,每一次都很大地提升了劳动生产率,从一个社会稳定态过渡到另外一个稳定态,中间会发生倒逼部分人就业倾向调整的情况,而随着社会技术平台很快又进入另外一个稳定态,更好的就业机会也随之涌现。
因此,每一次产业革命,不仅不会抢了人们的工作,相反还能创造出更多更好的就业岗位。
Facebook公司CEO扎克伯格也持同样的观点。
“我们应该期待着它给世界带来许许多多的好处,比如人工智能可以促进卫生进步,包括能提高诊断准确率和治疗效率等。”扎克伯格说。
小米科技公司创始人雷军也是人工智能的坚定拥护者。
“这几十年来,计算机产业带动的社会变革是日新月异,我们每个人都切实感受到了智能设备对我们生活带来的翻天覆地的变化。我们每一个人都可以轻松的通过智能设备,极大地提高和扩展我们个人的能力。”雷军说。
“相信未来的人工智能革命也是一样的,它可能会替代一些简单的脑力劳动,但是也会创造出很多新的机会。”百度公司董事长兼首席执行官李彦宏说。
【旁白】
日前落幕的第四届中国电子信息博览会(以下称CITE)上,科大讯飞的“听见”智能语音系统在嘉宾发言同时,将语音即时转换为文字,准确率达95%以上。基于人工智能的陪伴机器人“公子小白”、央视春晚上“冲上巅峰”的阿尔法机器人、能够语音交互的叮咚音响等多种智能设备吸引诸多观众现场互动。
与此同时,科大讯飞联合华为、京东、TCL、美的、平安银行、优必选科技等企业《人工智能深圳宣言》。根据这一《宣言》,各企业未来将积极探索政、产、学、研、用合作机制;制定人工智能产业发展标准;打造共性支撑平台,构建人工智能产业生态。
物联网标准亟需统一
目前来看,企业切入人工智能的路径大致可以分为三类。第一类是以百度、阿里等为代表的互联网企业,其核心优势在于拥有海量的线上数据,可以从资源挖掘、核心算法等角度切入。比如,刚刚结束的第四季《我是歌手》决赛上,阿里云人工智能小AI成功预测李玟夺冠。第二类则是在特定行业技术领域的行业企业,以科大讯飞、云之声、格灵深瞳、商汤科技等公司为代表,其在语音识别、视觉识别等技术层切入深耕细作。在这些企业中,其方向和资源投入又各有侧重,比如科大讯飞主营教育,云之声投入更多在物联网领域。第三类则是以优必选科技、小i机器人等为代表的终端厂商或虚拟场景、虚拟服务厂商,从应用层切入。
随着物联网的发展,智能设备的数量和复杂性不断增强。各种各样的机器人可作为终端入口,帮助人类处理各种事务,或许能够成为继搜索引擎、浏览器、智能手机之后的新入口。
优必选科技在CITE上展出了即将的机器人阿尔法二代。这个定位于家庭服务的机器人,通过语音交互,能够实现智能对话、智能家居操控、健康管理等,基于开放平台,能够开发更多APP,实现更多功能的延展。
不过,家电厂商对这些机器人似乎并不太“热情”。尽管“智能家居”给竞争惨烈的家电市场带来了一定溢价,但家电厂商对控制权的谨慎又一定程度上制约了行业发展。实际上,智能家居一直未能迎来爆发。
对此,科通芯城CTO李世鹏向21世纪经济报道记者解释,整个物联网或智能硬件是一种新的计算模式——分布式计算,用户手边方便的东西都可以进行控制,关键还是用什么样的协议做互通互联。智能家居要实现真正的智能,必须建立统一的协议或标准。
云知声CEO黄伟对当前的应用发展情况很乐观,“目前,人工智能的应用看起来很零碎,其实都是客户需求。通过一个一个点的突破,整个社会用户的使用习惯和认知就能够培养起来”。
语音智能先行
眼下,人机交互日益频繁,人们对智能设备的依赖程度不断提升,原有的操控方式变得越来越复杂、效率低下。而语音识别能够使人机交互以人类最熟悉的方式进行,大大降低了人们对智能设备操作的要求、节省人机互动的时间。
围绕语音技术,多家厂商推出软硬一体化产品,云知声和合作伙伴合作推出陪伴机器人康力优蓝;科大讯飞与京东联合推出叮咚智能音箱,在听音乐的同时可以控制智能家居;事实上,定位于家庭服务机器人的优必选阿尔法二代机器人也利用科大讯飞的语音技术。
目前,在运算和存储上,人类已经不是机器对手;在感知领域,图像和语音识别发展迅速;真正人工智能的终极挑战是认知。黄伟解释,语音技术目前发展相对成熟,认知层面的突破现阶段则较为困难,目前厂商正试图通过设立具象化、阶段性的命题进行攻克。
一、主要国家支持人工智能发展的政策
以美国、欧盟、日本为代表的发达国家的人工智能技术领先全球。人工智能从诞生开始就没有离开政府的支持,近年来各国政府更是加大了对人工智能技术的科研投入力度,通过公共投资引导人工智能产业的发展。
人工智能的概念起源于美国,最早由约翰・麦卡锡(John McCarthy)和马文・闵斯基(Marvin Lee Minsky)等人1955年提出,随后两人在麻省理工学院创立人工智能研究室,使人工智能成为一门科学。因此,人工智能的技术和应用前沿也位于美国。美国国防部高级研究计划局(Defense Advanced Research Projects Agency,DARPA)、美国战略与国际研究中心、兰德公司均认为,人工智能及其相关的量子计算机、机器人是可能产生新兴技术和颠覆性技术的领域。国际金融危机后,美国制定了一系列重振制造业的政策,以期增强创新能力,确保美国在先进制造业的领先地位。由于先进制造业的知识密集度不断提高,越来越依赖于信息技术、模型和模拟,因此机器人、人工智能等领域成为美国产业政策的支持重点。在2011年的“先进制造伙伴关系计划”中,美国就将先进机器人技术列为关系美国全球竞争力提高的新兴技术,并投入7000万美元支持新一代机器人研发。在2013年初的国情咨文中,美国总统奥巴马宣布投入30亿美元在10年内绘制出“人类大脑图谱”,从而促进人工智能、机器人和神经形态计算系统的发展。2015年10月美国国家经济委员会和白宫科技政策办公室联合了新版《美国国家创新战略》将计算计算技术前沿(高效计算)列为大力支持的战略领域之一,以推动经济竞争力、科学发现和创新。2016年2月,机器人有史以来第一次成为年度《总统经济报告》的关注对象,希冀美国制造业凭借机器人获得复兴。
欧盟在2013年初将“人脑项目”(Human Brain Project)列入“第七框架计划”(FP7)中的信息通信技术(ICT)研究子计划,10年投入10亿欧元,力图为基于信息通讯技术的新型脑研究模式奠定技术基础,加速脑科学研究成果转化。在此基础上,开发将神经形态计算装置与常规超级计算技术相结合的综合技术,推动神经形态计算和神经机器人技术的发展以及在家庭、制造业和服务业的应用。“第七框架计划”在2013年底结束后,欧盟新的研究与创新框架计划――“地平线2020”启动,将在“未来和新兴技术”(FET)领域投入26.96亿欧元,以期在具有可持续性、竞争力和增长优势的未来科技领域占据领导地位。FET划分为“开放基金”、“探索基金”和“旗舰基金”3类基金,其中探索基金支持的重点就包括未来机器人和其他人工智能系统。2014年,欧盟启动“火花”计划,到2020年投入28亿欧元用于民用机器人的研发。
日本在机器人产业具有明显的国际优势,世界四大机器人巨头中有两家位于日本,分别是发那科和安川电机(另两家是瑞士的ABB和德国的库卡),而且在服务机器人领域全球领先,日本软银公司Pepper人形机器人能够进行语音交流和客户服务。为确保世界机器人创新基地和世界第一机器人应用国家地位、引领迈向世界领先的机器人时代,日本政府在2015年初《机器人新战略》,计划到2020年累计投入1000亿日元用于机器人扶持项目。由于机器人与信息技术日益融合的趋势,特别是人工智能技术将使机器人能够适应智能制造、服务和家庭生活更多的场景,日本文部科学省在2016年拿出100亿日元预算用于支持研究机构和大学开展人工智能研究,如护理型机器人的人工智能程序、无人驾驶汽车、智能化的农业机械等。
二、主要企业人工智能的发展情况
鉴于人工智能技术的巨大发展潜力,一大批ICT领域的著名企业纷纷发力,新兴企业也如雨后春笋般成立。目前全球人工智能企业近千家,其中IBM、谷歌、微软、Facebook等美国信息和互联网企业居于领先地位。
IBM很早就开始人工智能的研究。早在1997年,IBM的超级计算机“更深的蓝”就在与世界国际象棋大师卡斯帕罗夫的对弈中获胜;2011年,IBM的超级计算机“沃森”又击败美国电视智力竞赛节目《危险边缘》的两位人类冠军。此后IBM斥资10亿美元推动沃森系统的产业化应用,例如为癌症患者推荐个性化治疗方案,协助理财规划师提供更好的理财建议,帮助金融机构发现风险与客户需求。2016年,IBM与美国劳伦斯・利弗莫尔国家实验室签署首款类脑超级计算平台的订单,该平台基于IBM TrueNorth 的突破性神经突触计算机芯片,能耗更低、体积更小,能够比传统芯片更高效地处理复杂的认知任务,除用于国防安全领域外,在因电力和容积问题而导致计算能力受限的条件下具有广泛的应用前景。
AlphaGo战胜李世石使谷歌在人工智能领域的名声大震。实际上,谷歌2011年就在其著名的Google X实验室建立了内部代号为Google Brain(谷歌大脑)的人工智能项目。2013年6月,谷歌使用1000台电脑创造出包含10亿个连接的“神经网络”,在没有外界输入“猫是什么样的”情况下,就能通过机器学习的方式在图片中找出有猫的图片。2014年,谷歌在人工智能领域进行了一系列收购,包括神经网络创业公司DeepMind Technologies、机器自我学习式图片搜索方案提供商Jetpac、专注于计算机深度学习和自然语言处理的Dark Blue Labs、专注于计算机深度学习和视觉识别的Vision Factory,从而在深度学习、神经网络、计算机视觉、语言识别和自然语言处理等人工智能前沿领域占据优势。谷歌基于人工智能技术的无人驾驶汽车已进行了累计150万公里的路测。
Facebook为了应对支撑超过十亿用户的巨大计算量,在2013年成立了人工智能研究室(Facebook Artificial Intelligence Research,FAIR),2015年又成立了机器学习应用团队(Applied Machine Learning team),负责运行一个覆盖全公司的机器学习内部平台――FBLearner Flow。Facebook也开发了一套围棋人工智能系统,代号为Darkforest,在2016年世界规模最大的电脑围棋大赛UEC杯中获得第二(第一是日本团队开发的Zen,AlphaGO并未参赛)。微软在2014年推出了虚拟个人助理服务Cortana和人工智能对话系统“小冰”展示了具有强大图片识别能力的全新人工智能系统“亚当”(Adam),并在测试一款名为Tay.ai的新型聊天机器人。
国内互联网公司也在积极推动人工智能技术的发展。2013年除,百度成立深度学习研究院,2014年在硅谷成立深度学习研究中心。目前,“百度大脑”已具备大约相当于2至3岁孩子的智力水平,百度图像识别能力已达到国际一流。阿里巴巴集团的云计算部门阿里云推出名为DT PAI的人工智能服务,该平台整合了阿里巴巴的机器算法和深度学习技术,为开发者提供云测用户行为的服务。阿里云的人工智能系统“小Ai”成功预测了在今年4月9日举行的《我是歌手》第四季总决赛歌王。腾讯在4月初宣布研究长达11年之久的人工智能系统贝塔鹅(Betae)即将上线使用。
三、促进我国人工智能发展的建议
人工智能作为一项通用目的技术,不但自身具有发展成为巨大产业的潜力,而且将广泛应用于国民经济的各个产业、家居生活和国防安全等领域,成为影响国家综合实力和产业国际竞争力的关键。近年来,受人口红利消退、生产要素成本快速上涨的影响,我国制造业建立在低成本基础上的价格优势正在被削弱。在发达国家重振制造业和低成本发展中国家大力发展劳动密集型产业的双重挤压下,我国产业结构调整和制造业的转型升级迫在眉睫,人工智能将是拓展新兴产业领域、提高制造业生产效率的重要手段。同时作为一项新兴技术,我国与发达国家的差距并不显著,且我国已经形成一批世界级的互联网公司、拥有巨大的市场容量,是我国抢占产业制高点的历史契机。