公务员期刊网 精选范文 人工智能医疗方向范文

人工智能医疗方向精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的人工智能医疗方向主题范文,仅供参考,欢迎阅读并收藏。

人工智能医疗方向

第1篇:人工智能医疗方向范文

虽然现在大家都把眼光盯上了谷歌AlphaGo对阵围棋,可谷歌的心思却并非在这里,下棋只是一场商业秀,实际上,在各种版本的公关宣传中,谷歌已经非常明确的把未来人工智能的重点方向锁定医疗

对于医疗产业的巨大蛋糕,谷歌垂涎欲滴早已经不是一天两天,谷歌在大数据上的应用最早也是从所谓的可以预测流行感冒这种传染病而被社会所知。而且,社会上真正能让谷歌手里所掌握的这种“人工智能”发挥作用的领域并不多,而医疗显然是最合适的场所。

AlphaGo之所以可以和顶尖高手下棋,主要原因是全部吸收了人类棋手千年的成果和经验,这都得益于保留和流传下来的丰富棋谱,否则,巧妇难为无米之炊,AlphaGo根本就不可能会下棋。当然,下棋这个营生获利太小,对于谷歌的吸引力一点都没有,社会上的各行各业中,能够保存基本完整且具有连续性资源可供机器进行学习的,医疗的病例最与棋谱类似。当然,病例要比棋谱还要复杂的多,非标准化的记录也增加了很多麻烦,好在可验证的机会比围棋更多,操作的难度也应该适中。

在2007年微软推出“健康库”系统,让患者可以上传病历之后,谷歌也打造了谷歌健康(Google Health)平台,让患者通过互联网,将自己的病历、健康数据上传到统一的网络平台,由自己管理,或选择与医生、朋友、家人共享。如此,谷歌已经收集和整理了大量的数据,为人工智能在医疗上的应用做足了功夫。

据报道,现在谷歌健康的合作伙伴已经包括各类研发机构、健康保险公司甚至医药零售商。谷歌通过与美国最大的药品零售商CVS(Consumer Value Stores)合作,让消费者将药物服用数据上传到谷歌健康系统,从而辐射1亿多美国人口,获得这些患者的部分病史,这相当于美国总人口的1/3。

有专家认为,医疗历来是技术驱动的重要代表。没有听诊器的发明,医生要用人耳靠在背上和胸前听诊;没有CT磁共振的发明,骨科、内科、外科都没法进展;没有无菌术和手术器械的发明,很多疾病还是不治之症;没有很多重磅药物发明,很多疾病必然素手无策。除了战争,医疗一直是应用最新科技的试验场和推动力。

在互联网改变医疗的发展途径上,据说有七个方面,但实际就是两种道路。一种是借助互联网平台的分享与众筹能力,通过全社会的资源共享来研发新药或新治疗手段。比如,制药巨头葛兰素史克(GlaxoSmithKline)公开了13500种化合物的数据,帮助开发抑制疟原虫的新药物。葛兰素史克希望通过分享信息,帮助科学家设计出一种治疗效果更好的新药物。这是制药行业首次大规模应用开源开发模式到新药开发上,志愿者通过通力合作可能创造新药。另外一种,就是以谷歌为首的,使用网络收集整理数据,提高自己人工智能水平,然后应用到药品开发和治疗手段的研发上。

可以预见,在未来,如果谷歌AlphaGo这样的工具应用到中医领域,这个依靠艰难的经验积累才能获得治疗能力的古老行业也许会焕发青春,当流传至今的千年验方通过计算机的深度学习加以提炼吸收,也许会真的造就一位古往今来最牛的“神医”,华佗就真的重生了。

像AlphaGo这样的人工智能未来会帮助培训医生,辅助提高医生的诊疗水平,大大减少误诊率,可以拯救数以百万人的生命,甚至,未来可以是这样的人工智能来操控手术刀进行复杂的手术,毕竟,人工智能没有情绪和压力,也不会疲劳,手术的风险会更小。实际上,这只是工厂里的制造机器人在医疗上的再造。

当然,未来的医疗,很可能需要人工智能、虚拟现实和3D打印结合起来,构筑成完美的现代化医疗科技体系。人工智能主导诊疗,虚拟现实负责心理治疗和医生的技术训练,3D打印则在人工智能的指令下完成器官再造等治疗方案。

第2篇:人工智能医疗方向范文

所谓的第四次工业革命,一定要结出实际的革命成果。广阔天地,谁能大有作为?

很多AI创业公司在各自的领域取得了突破,但具备强大的AI技术储备,并且有能力渗透到几乎所有领域的玩家,目前来看主要还是BAT三家。

这场AI“赋能”的战争,较量的是平台、技术、场景、生态等多方面的综合实力。百度喊All in AI,腾讯喊AI in All,阿里盖起达摩院。

谁能在新革命中笑到山花烂漫?

短兵相接的前夜,我们绘制了一幅时局图。

BAT时局

为了一争高下,BAT下注或早或晚,但都离不开几件事,例如组团队、做研发、建生态等。

到现在,三大巨头在人工智能上的布局已经能看出大致轮廓。

百度

百度在AI领域的野心,最初显露于2013年1月,深度学习研究院(IDL)的创立。

后来李彦宏陆陆续续建成了五大实验室,除了深度学习实验室之外,还有硅谷人工智能实验室、大数据实验室、增强现实实验室和深度学习及应用国家工程实验室。

这些实验室的研发成果历经5年的整合,逐渐形成了一个平台体系:百度智能云和百度大脑。智能云提供计算的基础设施和数据的获取、分析、标注能力,而百度大脑,整合了机器学习、深度学习算法,再将AI对语音、图像、视频、AR/VR的感知能力和自然语言处理、知识图谱、用户画像等认知能力开放出来,就形成了百度AI开放平台。

根据百度最新公布的数据,百度大脑现在拥有80多项核心AI能力,超过37万名开发者和合作伙伴,每天被调用2.19亿次。这些调用,来自百度内外。

对内,百度将AI能力输送到百度现有的各个产品之中。主业搜索自不必说,从一开始就受惠于AI技术的进步,包括手机百度、爱奇艺等应用也在AI的驱动下不断提升,2016年推出的信息流业务也在迅速发展。对外,百度走上开放平台的道路,主推DuerOS和Apollo。

陆奇一年前降临百度后,通过多种方式对业务进行了梳理和聚焦。核心当然就是上面两个平台,他们都各自成立了新的事业部进行支撑,当然也有医疗等业务被直接砍掉。

当然,百度在其他方面也一直有尝试,比如金融、机场、新零售等场景下,百度也在不停地开拓,一步一步积聚力量,构建自己的下一个生态。

不过总体来说,无论是从“All in AI”的技术投入来看,还是从所有能力汇总于百度大脑、全力推进Apollo、DuerOS两大平台的布局来看,百度似乎在把自己的AI力量集中起来,向着最重要的行业,单点突破。

最近陆奇在CES明确表示:“我们认为自己是一家旨在加快创新的AI公司,致力于实现AI技术的产品化和商业化。我想强调的是,最重要的是将该技术商业化,否则一切都是空谈。”

阿里巴巴

众所周知,马云不喜欢“人工智能”这个说法,偏好机器智能。说辞的变化不影响本质。在整个互联网行业涌向AI的浪潮中,阿里也在2017年推出“NASA计划”和承载它的实体组织:达摩院。

达摩院的研究领域可谓广撒网,涉及量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,可以看出,AI在其中占据了半壁江山。达摩院的主要任务,是在全球范围内建实验室招揽人才,和高校建立合作。

实际上,阿里AI研究起步的远远早于达摩院,这家公司大部分AI基础研究成果,出自2014年成立的数据科学与技术研究院,也就是iDST。

比如最近机器阅读理解方面取得突破的阿里团队,就来自iDST。当然阿里内部体系众多,展开AI研究的部门也不少。例如在“双十一”期间,商品推荐、客服、海报宣传、运营维护等方面均有AI技术的加持。蚂蚁金服也在与金融机构的合作中,把AI技术作为一个重要的亮点。

另外,不喜欢“人工智能”这个词的阿里,还有一个以之为名的人工智能实验室:A.I. Labs,它不止是一个研究机构,还承担着基于AI技术打造平台、推出产品的职责。目前,他们除了天猫精灵智能音箱和搭载的AliGenie操作系统、AliGenie语音开放平台之外,还推出了AR开放平台和AR内容平台。

从2017年末开始,自动驾驶也成为了A.I. Labs发力的领域之一。

和自带产品开发职责的A.I. Labs不同,iDST的研究成果走进现实世界,依靠的是他们打造的一个个“大脑”。这两年来,阿里云相继推出了ET城市大脑、ET医疗大脑、ET工业大脑、ET环境大脑、ET航空大脑,将AI能力与大数据和云计算结合起来,在各个垂直市场跑马圈地。

阿里最近,在努力将这些大脑们整合为一个统一的平台:阿里云ET大脑。2017年最后一场云栖大会上,ET大脑正式,所布局的领域也不再限于原本的城市管理、医疗、工业、环保、航空,同样走上了“广撒网”之路。

腾讯

腾讯无论做什么,都不会只投入一支团队。在人工智能上也是一样。

要论基础研究,腾讯有AI Lab、优图实验室和微信AI实验室三大机构,优图专注于计算机视觉技术,而AI Lab和微信AI在研究方向上虽然叫法不同,但多有重合,都是AI实验室标配的机器学习、自然语言处理、语音识别和计算机视觉。

根据各个实验室列出的合作伙伴和案例,这些实验室的技术,大部分都输送到了腾讯各条产品线之中,成了微信里的语音转文字、视频音乐新闻的推荐和排序、QQ的高能舞室、天天P图的军装照……

但是,就算产品体量庞大如鹅厂,也承载不完“AI in All”的野心。

腾讯的AI技术也同样寻求着在更多垂直领域的落地应用,其中最引人注目的,是医疗平台腾讯觅影。在金融、安防、政府政务、智慧零售等等领域,腾讯也都将AI技术与自身的社交、支付、地图、小程序等等技术结合起来,推出了垂直解决方案。

另外,腾讯也有类似于百度大脑的“AI开放平台”,在深耕的垂直领域之外,将自己的AI技能开放出来,供应给开发者。不过,目前这个“开放平台”的用户案例,依然是以腾讯内部产品为主。

在战局最喧闹的自动驾驶和对话式AI平台上,腾讯也分别投入了不止一支团队,开始造平台、积累合作伙伴。

虽然腾讯进军AI的时间较晚,但是能明显感到动作和决心都很大。

重点战场梳理

矛盾有主有次。

虽说广阔天地大有作为,三家也各自有钦定的重点方向。但仍有一些是战场是重中之重,也是未来BAT在人工智能技术落地的过程中,有可能最早展开厮杀之地。

对话式AI

人机交互的重大革新、下一代服务入口、下一个Android、家庭的控制中心……种种期待,让用于智能设备的对话式AI成了BAT争夺最激烈的领域。

百度有DuerOS,阿里有AliGenie,腾讯则至少有两个:腾讯云小微和移动互联网事业群(MIG)的叮当。

如果我们以智能音箱销量来评判对话式AI系统的发展,很会做生意的阿里似乎冲在最前。2017年7月,阿里AI Labs初次亮相,了一款智能音箱:天猫精灵X1。这款音箱,双十一降价促销,当天卖出了100万台。

但是,卖音箱只是手段而非目的。天猫精灵背后的终极目标,还是一个关于AliGenie开放平台、生态系统的梦想。

这个生态系统的梦想,BAT都有。

百度虽然直到去年底才推出渡鸦raven H智能音箱,但最新的数据显示,DuerOS开放平台半年时间里,已新增130余家合作伙伴,落地硬件解决方案超过20个,每月新增5款以上搭载DuerOS的设备,覆盖家居、车载、移动各个场景,机顶盒、电视、冰箱、音箱、机器人、车载、手机、耳机等各类设备。

为了守住这个领域,百度除了在北京和硅谷建设AI庞大的团队之外,还收购了两家创业公司:做语音交互和自然语言理解的Kitt.ai,和后来推出了raven H音箱的渡鸦。

内部竞争还未分胜负的腾讯势头也很猛。公开亮过相的两个团队里,叮当的发展速度似乎更快一些。2017年4月,它作为一个“语音助手”以App的形态,12月20日,了首款合作硬件1More耳机。截至目前,叮当虽然没有推出名为“硬件开放平台”的东西,但他们的“生态伙伴计划”也的确很见成效,做机器人的优必选、做音箱的哈曼、造车的广汽、做手机的魅族、努比亚等二十多家硬件厂商,都在腾讯叮当的合作案例名单之上。

相比之下,腾讯云小微的硬件开放平台和技能开放平台仍处于内测状态,除了和华硕一起造的机器人之外,没有太多关于合作伙伴的声音传出。值得一提的是,他们似乎在硬件之外,开辟了一条退路:智能客服。

智能音箱先行的AliGenie同样不是天猫精灵专属,它的硬件接入平台页面上,也展示着十多家合作伙伴。另外,AliGenie还推出了垂直行业智能语音解决方案,想在家居、移动硬件之外,为对话式AI开辟出新场景。

自动驾驶

2亿辆汽车和200多家OEM车厂,勾画出一个有更大想象空间的产业。

BAT在出行这件事儿上向来不安分,战火从地图、打车软件一路烧到了自动驾驶。

如果我们将时间倒回一年之前,你可能会发现,“自动驾驶”这个话题,几乎还只有百度一家在谈。而2017年过完,BAT已经悉数入局。最后一个传出消息的,是阿里。

阿里的自动驾驶业务目前还处在招兵买马阶段。12月中旬开始,阿里官方网站上开始出现自动驾驶相关的人工智能实验室(A.I. Labs)岗位,另外据36氪报道,这个团队中有不少无人车创业公司nuTonomy的旧部,已经开始面向车厂做介绍。

在这之前,阿里和车厂的交集,都围绕着互联网汽车操作系统发生,最亲密的盟友可能要数上汽。阿里和上汽合作打造的斑马智行,已经推出了“全球首款互联网汽车”荣威RX5。美国大厂福特、Tier 1供应商德尔福也是阿里的合作伙伴。除了这些合作伙伴之外,阿里还投资了一家国产电动汽车厂商:小鹏。

在投资车厂这件事上,出手最阔绰的当属腾讯。除了先后入股创业公司蔚来和威马,腾讯还在二级市场投资了特斯拉5%的股权,甚至秘密在硅谷投资了一家自动驾驶公司。

而腾讯本身的自动驾驶业务,据说已经到了全面研发、多次路测的阶段。

在自动驾驶进展还不够清晰的当下,腾讯的合作伙伴,也大多与AI in Car车联网系统相关,广汽、长安、吉利、比亚迪、东风柳汽、博世都和腾讯有着或多或少的联系。

自动驾驶领域的领先者,其实已经被科技部点了名。2017年11月,科技部公布首批国家人工智能开放创新平台名单,其中自动驾驶方面依托百度公司建设自动驾驶国家新一代人工智能开放创新平台。

入局最早的百度,和阿里腾讯早已不在同一个发展阶段。百度已经围绕Apollo与博世、大陆、一汽、长安、奇瑞、北汽、金龙等90多家企业达成了合作,也探索出了一条清晰的路线——还是在这个领域打造一个Android。

Apollo,是百度2017年4月启动的自动驾驶开放平台,要为合作伙伴提供一个开放、完整、安全的软件平台,帮他们搭建完整的自动驾驶系统。到2018年初Apollo 2.0的,云端服务平台、软件平台、硬件平台、车辆平台在内的四大模块全部开放,释放了在简单城市道路上自动驾驶的能力。一切,都按照去年7月公布的路线图进行着。

按计划,2018-2020年,百度会加快开放速度,直到最后能让合作伙伴完成完全自动驾驶。

但对于Apollo来说,更重要的还是生态。所谓生态,不仅仅是被赋能的车厂,Apollo还为向产业链上下游延伸而建立了基金,要在未来3年投出100多个项目。作为一个开源系统,创业公司、高校实验室同样是Apollo的伙伴。

和腾讯一样,百度也投资了威马汽车,也投资了共享出行平台首汽约车。此前百度还投资了自动驾驶关键部件激光雷达的核心厂家Velodyne,相关技术开放商xPerception等。

金融

还有一个不可忽略的战场,是金融。

阿里旗下的金融巨头蚂蚁金服和阿里云都在尝试赋能金融机构。

2017年1月以来,蚂蚁金服开始逐渐转变自己的定位,尝试用自身积累的技术能力来赋能、服务金融机构。夏天,蚂蚁金服在理财和保险领域,向金融机构开放了“理解用户”、“优化投资策略”和“用户与金融产品匹配”三个层面的能力,后来,AI客服能力、智能图像定损技术等等也相继开放。然而这还并不是蚂蚁金服AI布局的全貌,首席数据科学家漆远说:“蚂蚁AI技术将成熟一个,开放一个。”

2017年底,阿里云又了ET金融大脑,要帮合作伙伴风控、营销和客服方面提高效率。

相比之下,腾讯向金融行业合作伙伴提供的技术就显得比较表面,没有涉及风控这样的专业垂直应用,而只是将更为通用的身份检测、客服等能力注入其中。

你可能想不到,百度,也是这个战场上的一个重要玩家。虽然百度金融这一年来在to C市场上声量不大,但这家“All in AI”的公司,在金融上也要将“智能化”坚持到底。

在11月的百度世界大会上,百度金融技术负责人许东亮说,百度金融已经赋能近400家机构,为机构客户提供解决方案,为它们提供安全防护、智能获客、大数据风控等服务。

百度金融据说还在谋划更为独立的未来。

医疗

要说AI在各行各业的应用,不少人都会第一个想到医疗影像。

在这个领域,百度在医疗事业部部分团队转入AI体系之后就悄无声息,但腾讯和阿里都在抢占布局。

首批国家新一代人工智能开放创新平台中,腾讯就以医疗影像平台“觅影”入选。腾讯觅影于2017年8月,最先推出的是早期食管癌筛查。后来,觅影又相继推出早期肺癌筛查、糖尿病性视网膜病变筛查、乳腺癌早期筛查等医疗影像技术,还基于自然语言处理推出了AI辅助诊疗、病案智能化管理产品。

腾讯觅影结合了AI lab、腾讯优图、TEG架构平台部等团队的AI技术,由互联网+合作事业部牵头建立。推出至今不到半年,腾讯觅影已经有了西门子医疗、兰州大学第二医院、深圳市南山人民医院、中山医院等十几家合作伙伴。

马化腾此前表示,医疗与AI是非常好的落脚点,未来腾讯在医疗方面会做更多的事情。

阿里入局AI医疗其实比腾讯还要早。2017年3月底,ET医疗大脑首次亮相,宣称具有虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等功能。

与腾讯思路不同的是,ET医疗大脑的技术并非都出自阿里内部,而是聚集了不少合作伙伴一起提供服务,比如做皮肤检测的宜远智能、分析病历的惠每医疗等等。

目前的阿里云ET医疗大脑,能够提供影像智能诊断、智能病历诊断、语音医嘱录入、医疗意图识别、辅助管理决策、家庭慢病管理、DNA序列分析等功能。阿里在医疗方面,还跟华大基因、上海华山医院、浙江卫计委等机构展开合作。

另外,阿里去年也在医疗方面有一些投资布局,包括嘉和美康、Prenetics等。腾讯的动作也不少,去年已经披露出来的医疗相关投资包括:VoxelCloud、Grail、企鹅医生、Practo等。

零售

不管是新零售还是旧零售,不管是线上还是线下,阿里在这个领域都有天然的优势。

先梳理一下AI给阿里自身业务带来的变化。机器人客服“阿里小蜜”,双11当天承担95%客服咨询;机器智能推荐系统,双11当天产生567亿不同的货架;AI设计师“鲁班”,双11期间,设计4.1亿张商品海报;华北数据中心运维机器人:接替运维人员30%重复性工作……

与AI之于百度的搜索业务一样,AI之于阿里的电商业务也具备天然的赋能加成。除了上面提及的进展,蚂蚁金服还基于AI技术推出客服机器人“小蚂答”,以及AI助力的车辆定损服务“定损宝”等。

阿里还搞出了无人零售咖啡店。无人商店,是一个未来非常有意思的趋势。

此外,阿里在新零售思想的指引下,还大举投资了一批线下零售相关企业,包括:企加云、大润发、东方股份、新华都、易果生鲜、银泰、bigbasket、联华超市……

可以想见,阿里在零售方面的生态布局,一定会成为其AI技术应用的重要场景。

零售不是腾讯的强项,不过腾讯也提出了“智慧零售”的概念。腾讯COO任宇昕对此解释称:腾讯希望的是通过’去中心化’的方式,把平台能力开放给广大品牌商、零售商以及商业地产等合作伙伴。

腾讯表示将提供场景、大数据、AI技术支持,以及腾讯全产品线,帮助商家量身定做解决方案,帮助线下门店实现数据化和智能化,让消费者与商品之间,实现跨场景的智慧连接。

第3篇:人工智能医疗方向范文

这些前后端的人工智能技术在应用又可分为四类:语音识别、图像识别、自然语言处理和用户画像。那么在这四类具体应用的实现上AI技术给我们生活带来哪些便利,同时存在哪些局限?下面一一来解构:

一、语音识别

语音识别

语音识别有两个技术方向,一个是语音的识别,另一个是语音的合成。

语音识别是指我们自然发出的声音需要机器转换成语言符号,通过识别和理解过程把语音信号转变为响应的文本或命令,然后再与我们交互。语音识别技术可以应用在电话销售上,例如:公司新人特别多,没有经验,拿到单子的可能性很低。怎么才能让新人也能有很优秀的销售能力呢?过去的做法是,把经验总结成册子,让新人去背,很容易就忘了。但如果有了高精度的语音识别能力,就能识别出客户在问什么,然后在屏幕上告诉新人,该怎么回答这个问题。

语音识别的第二个方向是语音的合成,是指机器把文字转换成语音,并且能够根据个人需求定制语音,然后念出来。以前的声音是那种匀速的、没有语调起伏的机器声音,现在能用比较自然的人声。语音合成能模拟任何一个你喜欢的人的说话方式,可以做到每个人听的东西都不一样。我们驾车经常使用的百度导航里李彦宏的声音就是语音合成的结果。

尽管深度学习被引入语音识别后,识别率迅速提升到95%,但要将ASR(自动语音识别)从仅在大部分时间适用于一部分人发展到在任何时候适用于任何人,仍然是不现实的。一个无法突破的问题就是语义错误。例如:生活在南京的人都知道有个地方叫卡子门(kazimen),但是百度导航在理解卡子门的时候,会分词为:“卡子-门”,结果卡子门(kazimen)就被读成了卡子门(qiazimen)。

二、图像识别

计算机视觉

图像识别就是我们常说的计算机视觉(CV)。常用在:印刷文字识别、人脸识别、五官定位、人脸对比与验证、人脸检索、图片标签、身份证光学字符识别(OCR)、名片OCR识别等领域。

人类认识了解世界的信息中大部分来自视觉,同样,计算机视觉也成了机器认知世界的基础,其终极目的就是让计算机能像人一样“看懂世界”。目前计算机视觉在人脸识别、图像识别、增强现实等方面有很好的应用,但也存在一定的挑战。我们就拿谷歌的无人驾驶来说,通过机器视觉识别的技术路径在现阶段,仍有完全无法逾越的技术难题。

不谈算法,图像的摄取精度就是难关,即使最顶级的摄像设备都无法达到人眼的细节获取能力,看看最顶级的哈苏相机配合最顶级镜头,在夜晚街头短曝光时间下拍的照片,对比人眼看到的图像就能看到差异,这还不谈经济上可行的低成本摄像设备,视觉识别自动驾驶这个系统,眼睛就是近视眼。

而且如果下雨,灰尘等对分辨的影响都是很难解决的bug。如果配合雷达的话又有逻辑判断优先的问题,信摄像头,还是信雷达?会不会误报?而作为激光雷达,如果单纯的车身自己也有同样的逻辑判断的问题,什么样的东西是有威胁的,什么是无威胁的。什么是潜在的威胁,这都不是计算机视觉这种单一智能所能解决的。因为预测未来的感知能力,是人与机器最大的区别。

三、自然语言处理(NLP)

贤二机器僧

自然语言是人类智慧的结晶。自然语言处理(NLP)是人工智能中最为困难的问题之一。由于理解自然语言,需要关于外在世界的广泛知识以及运用操作这些知识的能力,自然语言认知,同时也被视为一个人工智能完备(AI-complete)的问题。

举个例子,我们以前用键盘,鼠标,触摸屏去和设备互动。但是现在你操作设备,只需冲着智能音箱说:请给我的手机充值100元即可。虽然这种功能在阿里的天猫精灵上已经实现了,但实现的前提是天猫精灵APP上已经录有你的声纹,并且你的手机号码,及支付密码已经预先在APP端设置好,否则机器没有办法理解我是谁、给谁的手机充值100元话费。

其次,自然语言处理背后所依赖的是传统的问答系统技术,即Question Answering(QA)。QA技术是自然语言处理中非常重要的一个研究方向,原理是:对于输入的问题首先做句法分析,从而理解问题或者指令的结构和意图。比如如果用户问的问题是某人出生在哪儿,那么机器需要先对这句话进行解析,进而了解所要回答的应当是一个地点,并且这个地点应当满足某人出生与此的条件。

当我们能够准确地了解到用户提问的意图并能根据机器可以理解的方式重新组织之后,就需要寻找答案。为了实现这一目的,QA系统的背后都存在一个庞大的数据库(也就是知识库),这个数据库中存储着所有的指令对应的行为或者问题对应的答案,当系统在数据库中搜索到了自己要做什么或者回答什么的时候,就可以将答案反馈给用户,或者直接实现用户的指令。当然,如果数据库的规模实在有限,有一个兜底的方法就是基于信息检索来返回答案,即将用户的输入提取出关键词然后求助于搜索引擎返回相关的内容再返回给用户,由于互联网无所不包,因此结果一般也尚可接受。

自然语言处理这块相关落地的产品就很多啦。典型的代表就是聊天机器人,其中一类是以Siri、Amazon Echo、微软小娜、阿里天猫精灵、小米小AI音箱等为代表,偏向于工具性的服务型机器人。另一类则是以微软小冰为代表的娱乐型机器人。第一类聊天机器人,以完成任务或回答事实性问题为导向,譬如你问天猫精灵“今天的天气如何?”,或者给“小爱同学”下达“关闭卧室台灯”等指令。第二类则以闲聊为导向,并不需要给出某一个事实性问题的解答,只要交谈自如、博君一笑即可。比如:北京龙泉寺的贤二机器僧。

四、用户画像

碟中谍6:全面瓦解

用户画像是根据用户社会属性、生活习惯和消费行为等信息/数据而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”——用数据来描述人的行为和特征,而标签是通过对用户信息分析而来的高度简练的特征标识。

用户画像在商业领域应用的非常广泛。拿百度举例。百度现在识别了将近10亿用户,用了几千万个细分标签给用户分类,比如性别、年龄、地理位置,还有这个人在金融领域的情况,在旅游方面有什么爱好等等。这些东西合在一起,就组成了用户画像。百度就知道你是什么样的人,喜欢什么样的东西。比如,今年暑期档将要上映的电影《碟中谍6:全面瓦解》,在宣传的时候把人群分成了三类,一类是不管怎样都要看的,一类是不管怎么都不会看的,第三类是可能会进电影院的。宣传方就会使用百度大脑的用户画像功能,识别出第三类人群,对这类观众进行定向宣传。

人工智能在用户画像里最重要的作用就是找到相关性,给用户打标签。用户标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。比如好人和坏人、90后80后,星座、白领等。具体流程一般是从纷乱复杂、琐碎的用户行为流(日志)中挖掘用户在一段时间内比较稳定的特征,即给用户打上标签。

举例来说,如果你经常购买一些纸尿裤,那么电商网站即可根据母婴购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有1-4岁的孩子”这样更为具体的标签,而这些所有给你贴的标签组,就成了你的用户画像,也可以说用户画像就是判断一个人是什么样的人。但是今天的人工智能虽然能够找到相关性,但是却无法找到内在的逻辑,因此容易把前提和结论搞反了。比如根据大数据的统计,喝咖啡的人比不喝咖啡的人长寿。但大数据没告诉大家喝咖啡是不是原因,或许是生活水平高的人才有钱、有时间喝咖啡。所以真实的情况是长寿的人喝咖啡。

五、人工智能算法

深度学习算法

说完了语音识别、图像识别和自然语言处理这些涉及交互的前端人工智能技术, 我们再来说说后端人工智能技术。后端的人工智能技术指的就是人工智能的核心算法,包括深度学习算法、记忆预测模型算法等。

首先,我们来说说深度学习算法。我们知道2016年是人工智能爆发的一年,先有AlphaGo战胜李世石,到了年底又有Master连胜60场,横扫中日韩围棋高手,一时间舆论为之震惊。这个Alpha Go背后的DeepMind团队,用的就是深度增强式学习,这是深层神经网络用于决策领域的成果。深度学习是机器学习的一个新领域,普遍认为深度学习的开创者是加拿大多伦多大学一位叫Geoffrey Hinton的教授,他是一位“神经科学家+计算机科学家”,他认为大脑是用全息的方式存储外界世界信息的,并且从上世纪80年代就开始研究用计算机系统架构来模拟人类大脑,就是我们今天说的深度学习的原型。

今天我们可以这样理解深度学习算法,深度学习就是运用神经网络一层又一层的计算来找到最优的参数,再结合参数去做出未来的决定。出发点在于建立、模拟人脑进行分析学习的神经网络。深度学习的整个学习过程中,几乎可以做到直接把海量数据投放到算法中,让数据自己说话,系统会自动从数据中学习。从输入到输出是一个完全自动的过程。深度学习算法现在被设计成实现设计者既定目标的工具。比如,AlphaGo的目标就是去赢得围棋比赛,而不是去开车或干其他事情。AlphaGo不能自己设定自己的目标,如果要完成另一个目标,就需要设计另一种机器。当然人工智能有N多条路,深度学习算法是目前人工智能算法里表现最好的。但深度学习并不是一上来就好的,让深度学习崛起还有两个华人:

一个就是斯坦福的教授,也是后来谷歌大脑的创始人吴恩达教授,因为他发现深度学习需要有更强的计算能力,所以他找到了英伟达的GPU(Graphics Processing Unit,图形处理单元),使得计算能力提升了上百倍。

另外一个人也是斯坦福的教授李飞飞,她建立了一个图像识别资料库。而且这个库里面的所有的图像都是标注过的,也就是说,如果图里有山就会标注出山,如果有树就标注出树。这样的话,你可以用这个图形库来训练人工智能系统,看它能不能识别出来这个图形库上面所标注的这些元素。经过这个图像库的训练,就可以训练出视觉能力超过人的人工智能系统。

但是千万不要以为深度学习达到今天的水平就是无敌了,甚至可以超越人类了。深度学习发展起来的人工智能系统存在一个明显的缺陷,就是他的过程无法描述,机器不能用人的语言说出来它是怎么做到的。例如,Alpha Go打败了李世石,你要问AlphaGo是为什么走这步棋,它是答不上来的。也就是说,我们没办法知道机器做事情的动机和理由。

要想更好的认识到人工智能算法的局限性,需要引入一个概念,就是认知复杂度。什么是认知复杂度呢?就是指你建构“客观”世界的能力。认知复杂度高的人,善于同时用互补,或者互不相容的概念来理解客观世界,因为真实世界本身就不是非黑即白的。那么对于机器来说,“认知计算”和“人工智能”有啥关系呢?人工智能的未来一般被分为三个发展方向:人搞定机器、机器搞定人和“人机共生”。而以“人机共生”为目标的人工智能,就是认知计算。IBM在认知计算领域获得了大量经验,并且总结了认知计算的三个能力,分别是交流、决策,和发现。

(1)交流

第一个能力是交流,认知计算可以处理非结构性的问题。很多用Siri的人,只会把这当成娱乐功能,因为它不能保证交流内容的准确性,有时Siri根本接不上你的话,因为你的话对它来说太复杂了。这个只能算作人工智能比较初始的状态。

而认知计算可以完全模仿人类的认知,你可以把它当做一个孩子。就好像孩子周围有一群逗他玩的大人,有人告诉孩子1+1=2,也有人说1+1=3。但是随着孩子的成长,他自己会明白1+1=2才是对的。这就是非结构性问题。早期的人工智能只能学会别人教给他的知识,但是认知计算可以处理模糊的,甚至是自相矛盾的信息。

(2)决策

第二个能力是决策,我们都知道人工智能可以分析复杂的逻辑,然后做出决策。认知计算可以更进一步,根据新的信息来调整自己的决策。更厉害的是,认知系统所做的决策是没有偏见的,而“毫无偏见的决策”对人类来说几乎是一件不可能的事。比如说治疗癌症,这是典型的医疗决策场景。

癌症之所以难治,一方面由于这种疾病太过复杂,另一方面,医生如果不能及时发现患者的癌症信号,可能会延误患者的治疗,或者导致诊断错误。而认知计算可以综合分析复杂的医疗数据,还可以在医生语言的上下文中解析含义,最后提出它的建议。

这就大大减少了医生查病历的时间,让医生能将更多的时间用在患者身上。2016年8月,《东京新闻》报道说,IBM研发的认知计算机器人“沃森”,就学习了海量的医学论文,只用了10分钟,就为一名患者诊断出了很难判断的白血病类型,还向东京大学医科学研究所提出了适当的治疗方案。

(3)发现

第三个能力是发现,认知计算能发现新事物和新连接,填补人类思维的空白。比如在竞争激烈的餐饮业,怎样才能做出令顾客满意的新菜品呢?

认知系统可以整合区域知识、文化知识,还有各种食物搭配理论,帮助用户发现想象不到的美食搭配。比如突然有一天,它会告诉你:用卤煮的配方做个披萨,可能很合你的胃口。你照着一做,发现还不错!实际上,从2015年开始,IBM开发的“沃森大厨”,就已经学习了35000多种经典食谱,然后通过分析海量的食材搭配,结合化学、营养学等方面数据,为厨师和美食家带来了超出人类想象的新型食谱。

认知计算可以帮助我们更好的交流、决策和发现。但是人工智能依然有很多做不到的。例如:抽象能力,自我意识,审美,情感等。

第4篇:人工智能医疗方向范文

这不是现在它自己就可以作出的决定—注意,我说的是现在。至于以后,这会是一个更重大的话题。

我们可以先从它怎样为IBM带去新生意谈起。接受《第一财经周刊》采访的沃森商业化主管Manoj Saxena最近透露说,IBM的相关规划已经制订到了2015年。而到了那一年,“包括沃森项目在内的IBM数据分析业务收入将超过160亿美元。”

这不算一个小数目,它看起来比深蓝要厉害多了。要知道因为击败了国际象棋冠军,深蓝也曾经名噪一时,但它最终只是成为了IBM每年公司折旧费用上的一部分数字。

很大程度上,这是因为沃森站在了深蓝的肩膀上。

2011年2月16日晚,在超过3500万名观众面前,沃森在美国著名的智力竞赛节目《危机边缘(Jeopardy)》中,击败曾连续74次夺冠的Ken Jennings和另一位选手Brad Rutter,拿走了100万美元奖金。后来Ken Jennings在他的题板上写下了那句被人们所熟知的话:“嗨,电脑们。现在,我们的新老大来了!”

他是被这样一台东西击败的:它有一块方型显示屏,还有90台IBM POWER 750处理器—其中包括2880个CPU,还有15TB的内存。这些都被藏在演播室上方的机房里。

IBM大中华区Power服务器产品部总经理侯淼解释说,这样的配置可以让沃森每秒进行80TB的浮点运算。这相当于每秒阅读100万本书籍,而它身边的Ken和Brad可能一辈子也读不完其中的1%。

类似这样的超强运算能力深蓝其实也具备,并且也正是依靠这种能力,它才可以每秒分析2亿步棋,最终战胜了卡斯帕罗夫。但如果要让深蓝参加智力竞赛,它可能一题也答不上来,甚至连问题也无法理解。

这正是沃森的强大之处:它可以理解人们所说的话,并快速做出反馈。这个被称为“头脑”的部分,是IBM为沃森研发的深度问题回答(Deep QA)技术。

再通俗点说,这是人工智能(AI)的真正开始。

举个例子的话,当沃森被问到“哪个城市在2008年举办了一项标志为‘五环’的重要赛事”时,它的整个处理过程是这样的:第一步,根据语法,找到“问题焦点”并进行标注,在这一题中,“城市”就是问题焦点;第二步,它会对“2008年”、“标志”、“五环”、“重要赛事”等关键词,按照不同权重进行知识库搜索,从中抽取初始答案;第三步,将这些初始答案—常常是成百上千个模糊答案,重新带回到问题中;最后一步,也是最关键的一步,沃森通过一个学习模型,综合搜索信息,对所有答案按照概率排序,将它认为可能性最大(概率最高)的三个答案显示到答题板上。整个过程都发生在几秒中之间。

IBM在全球拥有12个研究院,每年会投入60至70亿美元进行研发。“有一类研发公司内部称为Grand challenge。”侯淼说:“一旦研发成功,将会对整个社会产生非常巨大的影响。”

2000年初,时任IBM总裁的彭明盛第一次对研发部门提出了“Grand challenge”的目标,希望到2011年也就是IBM诞生100年时,能够研发出一款革命性的产品,影响整个计算机行业未来的走向,甚至能够对人类有非常巨大的帮助。

4年之后的一天,IBM研究经理Charles Lickel在一家餐厅里和同事吃饭,突然之间,整个餐厅安静了。他发现所有人的目光都集中在了大屏幕上,期待Ken Jennings扩大他在《危机边缘》节目中的连胜记录。

这个情景让Charles Lickel产生了一个想法:让IBM开发一款答题机器。这个想法很快得到了上层的支持。IBM语意分析与综合部接下了这个最具挑战性的项目,从2006年开始进行了一系列测试。

在最初的测试中,研究人员向沃森提了500个《危机边缘》中出现过的问题,沃森只能答对15%左右的问题,而节目中最好的选手,可以用比沃森少一半的时间答对其中95%以上的问题;从2007年开始,IBM给这一项目加派了15个研究人员,希望通过3至5年的时间把沃森训练成一架优秀的答题机器。

在此过程中,沃森进行了55次模似竞赛,这些比赛完全按照《危机边缘》的赛制,邀请节目中的冠军们和沃森进行比拼。当沃森答错一题时,沃森会对错误答案进行记忆,当下一次碰到同类型问题时,将对原有的答题逻辑进行优化,避免再犯同样的错误。这跟人类的自我改正十分相似。

在整个训练过程中,沃森逐渐取得了70%的胜率。到了2011年比赛前的最后几个月,沃森几乎可以击败所有的选手,它准备好了。

除了强大的计算能力和海量的数据来源,研究人员为沃森设计的自我记忆、纠错、学习的模型,成为沃森不同于其他超级计算机的关键。这样的“学习模型”,也出现在Google无人驾驶汽车的研发中:技术人员每天带着电脑上路,让它记忆人类在驾驶汽车的过程中,面对不同情况时的应对方法。

不同的学习模型可以造就不同的沃森,这也是IBM在考虑沃森的商业化方向时,需要面对的问题:沃森到底是什么、它应该解决什么问题。

在IBM的官方网站上,对沃森的介绍是“集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用”,但这样一个文绉绉的解释,很难说服那些目标客户。这些客户通常只在乎自己的钱花在了哪儿、沃森能为他们做什么。

IBM资深副总裁和研究主管John Kelly在接受媒体采访时曾表示:“我们真的认为它可以用在任何地方。”同时他和他的同事也清楚地认识到沃森真正的“基因”:它可以在很短的时间内处理海量的信息,并从这些信息中找出有价值的部分,通过自然语言同人类实现信息的交流和交换。

这让沃森可以成为一个“智囊”、“顾问”和“助手”。那些需要处理大量数据、知识不断更新,同时又需要据此做出复杂判断的领域,成为了最能发挥沃森作用的领域。

沃森在医疗行业找到了自己的第一份工作。根据IBM和医疗保险公司Wellpoint的协议,从2012年年初开始,沃森将帮助护士们管理复杂的病例和来自医疗服务提供商的请求;然后,Wellpoint会开发一套面向医生的技术,使得医生可以通过自己的手机和平板电脑,了解肿瘤患者的身体状况。

侯淼说,选择医疗领域是因为这里具有良好的档案储存制度,积累了大量的医学数据、病历档案,并进行了科学的分类。这些大量的可搜索数据,是沃森发挥作用的重要前提。

不同地区医疗水平的巨大差异,也使得沃森拥有广泛的应用前景。“一些偏远地区的小医院也可以通过云端访问全国的医疗数据库,享受到沃森带来的服务。”

Mark Kris所在的Memorial Sloan-Kettering癌症研究中心(MSKCC)在1年前加入了这一项目。Kris是一位经验丰富的临床肿瘤医师,同时也是《危机边缘》的忠实粉丝。他告诉《第一财经周刊》,从2年前他在电视机前目睹沃森表演的那天起,就对沃森产生了兴趣。

过去半个世纪,人类在许多领域取得了突破性的进展,但癌症研究和临床治疗方面一直没有重大突破。按照Kris说法,在过去40年中,癌症研究方面最大的突破,仅仅就是让人类了解到了这种疾病的复杂性。

在癌症治疗领域,不同病人之间有十分微妙的差异,医生们需要有更好的方法了解和区分这些差异,因为这些小差异带来的影响,有时候可能是致命的。

无法准确知道这些差异的结果,就使医生无法针对每个人不同的病情确定最佳治疗方法。“化疗是常见的一种治疗方法,”Kris解释道,“但是你怎么在数十种不同的化疗选项中进行挑选呢?你又如何确定剂量?怎样的化疗频率才是最佳的呢?”

在现在这个阶段,沃森还不能马上成为这个救世主。它眼下的主要工作,还是通过搜索医学文献和历史数据,快速为某一患者找到情况相似的其他患者。这一过程可以帮助医生在相似案例间获得更多的有用信息,在信息更充分的条件下做出更有说服力的判断。在沃森之前,医生需要自己熟记每一个病人的情况,还要在新病人出现时立刻从头脑里搜索出相似对象,费时费力,准确性还不高。

在进入Memorial Sloan-Kettering癌症研究中心之后,“补课”是沃森要做的第一件事,MSKCC的员工和IBM的项目成员一起训练着沃森。从肺癌开始,研究人员通过分享关于肺癌的知识和经验,让沃森了解到所有关于肺癌的内容。

沃森沿用了它在参加《危机边缘》训练时建立的学习模型:它的所有答案最终都会以一个概率的形式出现,那个概率最高的答案,就是沃森认为的正确答案;当这个答案被证明错误时,沃森会找到它与正确答案之间的区别,以后再遇到同类问题时,就会更新原有的逻辑;另外,它还可以从其他选手回答的同一类型问题中归纳出答案特点,帮助它用来回答这类问题。

在经过6个月的培训以后,沃森成为了一名可靠的医疗助手。医生们在自己的平板设备中打开沃森的应用,录入数据并提出问题。几秒钟之后,沃森就会提供几个可能的治疗方法,并且以不同的数值表示确信程度。有的治疗方法有90%的确信度,有的则是80%。而选择哪种治疗方式,还需要医生最后拿主意。

2013年秋天,Kris将和他的同事一起利用沃森帮助真正的病人进行癌症治疗。IBM在前不久联合Wellpoint了第一款商业用“基于沃森的认知计算系统”。

相对于参加《危机边缘》时那个拥有几十排服务器的家伙,从体型上看,这个新系统已经瘦身了不少,仅为一个双门冰箱的大小。

其中一个很重要的原因是,《危机边缘》中的问题涉及人文、历史、地理、政治等众多方面,选手们碰到相似问题的概率甚至小于3%,所以需要用数量众多的服务器储存足够多的知识。而在具体应用到某一行业时,所需的知识量会小很多,而且遇到相似问题的概率也会提升很多,对服务器的数量要求也就随之降低了。

沃森原有的Power750处理器也升级到了POWER7+,性能提升了50%。沃森可以用更短的时间处理更多的信息。原来回答问题需要3秒的话,现在就变成了2秒。

在IBM不断改造和培训沃森、试图提升它的自我学习能力的同时,Google也在人工智能领域取得了突破—它们让计算机认识了“猫”。

2012年6月,Google X实验室用一个由1.6万多个处理器、10亿个内部节点组成的“虚拟大脑”,模拟人脑中“神经元”的概念,形成了一个“神经网络”。这个神经网络会不断接收新数据。在一些模型的帮助下,神经元与神经元之间传递的数据发生了变化,它具备了初步的学习能力。

10天之后,这个“虚拟大脑”分析了1000万帧从YouTube上随机抓取的无标签视频剪辑图片,并成功学习到了“猫”的概念,并从随后导入的2万张图片中准确找出了有猫的照片。

这些试图改变世界的工程师们的下一步,是使这些“学习模型”更聪明、更高效。

IBM正在琢磨怎样把沃森部署到各行各业。就在这会儿,一台沃森正在接受花旗银行的岗前培训,通过读年报、财经新闻、招股说明书、监视交易,以及学习更专业的金融术语,更好地给客户推荐投资组合,或者回答诸如“接下去的3个月内哪家公司最有可能发生合并?”这样的问题。

在这个过程中,沃森最大的问题在于学习的速度:如何在最短的时间内学习这个行业的知识、术语,并学会用这些知识进行“思考”。即便学习模型的架构被总体沿用下来,也会根据不同行业做出有针对性的调整。

沃森还需要变得更聪明。很多时候,病人并不能很准确地,甚至会错误地描述问题。“一个病人说他头疼,但他的问题可能在其他地方。”侯淼说:“这个时候,沃森就需要能够识别出这些问题。”这也是将沃森运用到其他行业要面对的问题—那些“错误的描述”、“善意的欺骗”都需要它去识别和破解。

第5篇:人工智能医疗方向范文

目前,美、英、日、德等发达国家凭借其经济实力和技术优势,已经在数字医学领域占得先机。高端的医疗影像设备、人工智能产品等大多来自发达国家,其在数字医学基础研究和技术应用方面的成果同样引人注目。我国经历二十多年的医院信息化建设,各种信息管理与临床信息系统遍及全院,数字化医院成为综合实力较强医院追求的建设目标,远程医疗快速发展,区域卫生信息化建设成为医药卫生体制改革的重点,公共卫生信息化也取得了明显的进展。

同时,自2001年以钟世镇院士牵头提出构建“中国数字人”的设想开始,数字化技术在我国的基础医学研究便逐渐铺陈开来,而多个国内数字医学研究机构如南方医科大学、清华大学、复旦大学、浙江大学以及青岛大学附属医院与海信集团联合成立的山东省“数字医学与计算机辅助手术重点实验室”等,分别在计算机辅助诊断系统、数字医学影像设备、计算机辅助手术系统等领域投入了大量的科研力量,并取得令人瞩目的成绩。但是,我国在数字医学的核心技术领域起步较晚,与发达国家仍有差距,想推动我国数字医学快速持续发展,必须先对数字医学的未来发展趋势有深入的认识。

数字医学的发展趋势

目前,数字医学基础理论正逐步完善,数字医学学科体系逐渐清晰,智能化、可视化、微电子等高新技术也将进一步与医学检测、诊断、治疗等技术交叉渗透。数字医学的未来发展趋势主要体现在以下四个方面:

首先,未来会出现更加人性化的数字化医院管理。功能单一的医院信息系统的格局将被打破,PACS应用将会向区域、远程发展,无线移动、重症监护、远程医学、数字化手术室建设将会涌现,电子病历在社区医疗以及大范围的健康管理方面的应用会催生更多人性化的管理系统。随着信息技术的高度渗透,数字化医院必将会更注重信息提供利用的人性化,而且从管理到医疗,从门诊到临床都正在孕育着新的突破。

其次,数字医疗治疗技术将会更加智能化。将人工智能与经典医学理论和经验知识构建集评估、诊断、决策与预测于一体的智能专家诊断系统将会在临床诊断与治疗中发挥重要作用,而随着数字制造和智能制造飞速发展应运而生的智能医疗机器人,尤其是智能微型医用机器人将会在一定程度上辅助医生进行治疗。智能化的数字医学治疗技术将会给传统医学治疗带来重大变革。

最后,微创化、无创化的数字医疗检测技术将会不断涌现。多种生理参数的测量能够对人体健康状态或疾病进行诊断,而基于多种光学成像技术的临床应用将会是数字医疗检测技术实现微创、甚至无创检测的一个重要途径。近红外光谱技术、光学弱相干层析成像技术、多模态多光谱分子影像技术都将会实际应用在人体多种生理参数的检测中,而且由于光学成像技术本身对于人体没有损伤的特点,光学成像技术的进一步发展与应用将会推动数字医疗检测技术微创化甚至无创化。

计算机辅助手术系统的发展

精准化的数字医疗诊断、手术技术正成为国内外研究热点,这也是我国突破发达国家数字医学技术垄断的关键。其中,计算机辅助手术系统功能的日益强大,将会使精准外科手术成为可能,推动临床外科的跨越式发展,也必将会成为医学教育、医学科研和临床医学的新手段。与计算机辅助手术系统相配套的医用显示器的规范与普及,能够为医生诊断提供更精确的判断,推动远程医疗和社区医疗的快速发展。数字芯片的进一步发展与嵌入对医疗诊断设备性能和便携化的提升有着不可估量的作用。

目前,海信医疗设备有限公司通过与青岛大学附属医院董教授合作,开发出了低辐射剂量下的低质量CT图像消噪、增强技术,做出了一款世界水平的计算机辅助手术产品,该产品被命名为海信双子3D医学影像重建与计算机辅助手术系统(Hisense Gemini 3D Medical Imaging Reconstruction and Computer Assisted Surgery System,Higemi)。

它通过独自开发的医学图像预处理和分割技术,只需在一幅图像上设定相应参数和少量人工辅助,算法可以自动精确地在一系列CT图像上分割出肝脏、血管、肿瘤、胆囊等肝脏各组织。然后,通过滤波、CT层间自适应对应点插值、形态学、模式识别等算法处理分割结果,追踪肝脏三期图像上肝动脉、门静脉、肝静脉的血管走形,并利用三维配准算法对三期肝脏数据进行立体配准,精确地三维重建肝脏、肿瘤和胆囊等器官。

它可以三维观察病变与血管、脏器的关系,精确计算脏器、病变体积和门脉、静脉各分支供血区域,实施虚拟手术切除,确定最佳手术切除线。它在最难的肝部成像领域能够重建3级以上血管,区分0.6mm的肿瘤与血管间距,精确计算肝脏、肿瘤体积,极大地满足医生的临床需要。Higemi在临床上已经实际应用于多位小儿巨大肝脏的手术前模拟手术的规划设计和术中指导,以及活体肝脏移植的肝脏手术前精准判断。

未来,该产品将扩展到脑部、五官、神经外科和口腔等多个临床医学领域,形成功能强大的全身手术辅助系统。本产品利用了以下具体科学技术开发:

1.低剂量或普通剂量CT图像高清增强技术。海信开发的低剂量CT图像高清增强技术是一种CT图像后期处理技术,可以不对现有CT设备做结构性更改,将低辐射量低质量的CT图像还原成高质量图像。该系统可以减少50%~80%有害照射剂量(从300mAs降到60mAs)的情况下,仍达到同样质量的成像效果。如果按照原卫生部2012年公布的《GBZ165-2012 X射线计算机断层摄影放射防护要求》,使用针对不同人群、不同部位CT检查上限的辐射水平作增强型CT,得到的图像再作此项高清处理,则可以得到非常清晰的CT图像。利用此图像,可以更精确地分割器官和病变组织,做出精确的器官三维重建图形,非常有利于常规状态下的疑难病例的诊断和手术方案规划。该技术在世界处于领先水平,对提高现代医学影像设备的性能和安全性有十分重要的意义。

2.医学图像分割技术。在大量DICOM标准的CT腹部扫描图像上,根据灰度、纹理、血管生理特性等特征把二维图像分割为不同的部分,找到分界线(如器官外沿、肿瘤外沿和血管外壁等)。真实精确地找到不同组织分界线,是后续工作的基础。

3.建模,图像追踪技术。追踪多幅图像上肝动脉、门静脉、肝静脉三期的血管造影图像的CT强度变化,建立自学习拓扑模型将每幅图像中代表血管的CT值变化连接起来,形成血管走向信息。

4.模式识别技术。将分割出的不同组织分类并识别。

5.三维可视化,三维图像配准技术。同期不同图像间、不同期不同图像间的配准、建模;不同组织或功能区成像的容量渲染、着色;透明显示、任意断面显示、多平面显示。

6.定性定量分析。器官和内部组织的参数测量,定性定量计算,如精确计算器官总体积和部分体积。

7.肝脏功能分段与手术模拟技术。1954年,Couinaud根据人体肝脏Glission系统的分支走向以及肝静脉系统的回流将人体肝脏划分为八段,由于人体肝脏血管走向的个体差异性,Couinaud方法并不具有普适性,尤其是针对肝内出现肿瘤、血管变异等复杂情况,单纯依靠Couinaud方法进行肝脏分段并没有实际临床指导意义,实施肝脏精准手术迫切需要肝脏功能分段的精准导航。

随着数字医学的快速发展,现有的计算机辅助手术系统可以初步实现肝脏功能分段,同时为后期的模拟手术进行指导,与医生直接根据二维影像确定手术方案相比,肝脏功能分段及手术模拟系统的出现又将精准手术的发展向前推进了一大步。

目前,大多数肝脏功能分段方法根据肝脏内血管分支走向和血管分支支配区域进行分段,这与解剖学中关于肝脏分段的解释是一致的。其主要步骤包括:从二维影像信息进行精准血管信息提取,对重建后的三维血管系统进行骨架化操作,运用图论相关方法进行血管智能化分支(鉴于肝脏内血管系统较为复杂,需要借助人工辅助进行不同血管系统的判定),根据近似分段模型进行全肝分段并进行体积测算。其中,从现有的二维影像信息中进行准确的血管信息提取是肝脏功能分段的基础和前提;如何对骨架化血管进行智能化分支是极其关键的步骤,直接影响到全肝分段的结果;构造与肝脏实际功能一致的近似分段模型,能尽可能地减少手术出血率,降低术后并发症的发生。借助于肝脏功能分段以及精准的肝段体积测算数据,医生能方便、直观地进行术前规划。

目前,由于使用不同的血管骨架化方法和近似分段模型造成结果不同,如何统一业界功能分段标准,才能使肝脏分段更好地满足手术临床需要值得研究;由于肝脏血管系统的个体差异性以及肿瘤组织等的存在造成的肝脏畸形,目前必须借助少量人工辅助才能实现功能分段,如何实现完全自动化和智能化将成为未来肝脏功能分段的重要研究方向。

8.肿瘤定位及消融引导技术。近年来,随着医学、计算机学和生物学等的发展,肿瘤的治疗技术正在发生重大的变革,如何采用微创或无创方法靶点杀死和灭活肿瘤,同时又能最大限度地保护周围正常组织,已成为肿瘤治疗的热点。北美放射学会(RSNA)于1997年首次提出肿瘤消融的概念,即在超声、CT、MRI等现代影像设备等的指导下利用物理或者化学(热或冷效应)直接破坏异常或病变组织的技术。本产品具备的图像配准是图像融合的先决条件,必须先进行配准交换,才能实现准确地融合。之后进行的亚毫米级精度三维立体重建,能够清晰显示肿瘤大小、位置、数量及其与周围重要结构、脏器的毗邻关系,还能对肿瘤消融治疗的疗效进行评价。未来将US、CT、MRI图像融合的新型影像融合技术,根据各自影像的特点结合起来进行优势互补,可以更准确地发现肿瘤、制定治疗方案及引导穿刺和监控消融。

9.符合Dicom标准的2D/3D图形人机交互引擎技术。以上各种算法和相关功能的实现,有赖于强大的符合Dicom标准的2D/3D图形人机交互引擎技术,该技术是计算机辅助手术技术的核心难点之一,也是国内目前技术水平较弱的领域。海信集团开发的人机交互引擎将主流的OpenGL、DirectX、GPU加速等显示方式以统一接口形式表现,利于程序员开发调用。它涉及到多种类库耦合、多线程、GDI (Graphics Device Interface) 等多种底层操作技术,Dicom文件编解码等引擎底层分别编写,形成一组功能齐全的2D/3D图形人机交互引擎。海信Higemi计算机辅助手术系统即是基于此人机交互引擎实现了质的飞跃。

医用显示器的规范和普及

医疗显示作为医学影像的显示终端,为了达到对医学图像的精确显示需求,要求在显示终端首先符合DICOM Part 14的标准,使显示符合灰度标准显示函数(GSDF),从而保证在阅读医学灰阶图像时能够呈现出最精确的效果。而如果使用的普通显示器是不符合医学影像显示标准的,则容易造成误诊。

在精准手术临床辅助系统中,需要利用3D技术来展示更加真实生动的三维手术场景或CT/MRI人体器官图像。眼镜式3D显示器由于需要医生佩戴专用眼镜,会影响到医生手术操作,所以在未来会选用裸眼3D显示器。目前较成熟的多视点裸眼3D技术是光栅式,一种是狭缝光栅,一种是柱镜光栅。

首先,狭缝光栅方式裸眼3D显示器亮度较低,主要用于个人用移动设备即小尺寸显示中,而精准手术系临床指导系统需要大尺寸的裸眼3D显示器。这种大尺寸的裸眼3D显示器一般采用柱镜光栅,这种方式的显示器同样也存在一些目前无法突破的问题:1.由于光栅式裸眼3D显示具有分光的作用,贴装的光栅导致2D和3D信号的清晰度降低,难以满足手术临床指导显示器的需求。2.存在视区角度小、视区突变问题,在突变区域会看到重影和不正常的图像,同时立体景深和视区突变也是一个平衡关系,无法同时达到最佳状态。目前有研究针对此问题开发了视点跟踪技术,实时检测观看者在电视前的位置,将处在突变的区域调整为良好的视觉区域。但此方法更适合于单人观看的设备,当手术中多名医生观看的时候,很难调整并保证观看者都处于正常视区内。3.存在串扰问题、立体景深小于眼镜式3D显示器。

海信集团开发新型高性能的裸眼三维显示设备和人机交互设备可以解决这些问题。该设备通过UHD液晶屏的采用和UHD电路、光栅的开发,将3D分辨率提高到1280*720以上的高清标准,满足手术临床指导显示器的需求;通过独特渲染算法技术和柱镜光栅的研究和配套开发,解决视区角度小、视区突变的问题,扩大视区,达到不用视点跟踪能满足多人同时观看的要求;通过语音识别技术和手势识别技术,开发新型人机交互控制设备,实现便捷的操作,解放医生双手,防止手术污染。

数字芯片在数字医疗领域中的发展

针对数字医学影像设备的快速发展,应用高性能芯片进行设备集成化设计成为未来数字医疗设备发展的主流方向。为了满足这个需求,芯片应满足实时性和可靠性等要求。

首先是实时性,医疗设备需要快速的启动、无延时的图像显示、无缝的功能/参数转换,例如手术中的数字X射线影像、救护车与医院的实时影像交流。其次是可靠性,需要器件能够在各种环境下的长时间无故障运行,能够迅速从软件错误引起的故障中恢复,能够电磁环境抗干扰。

在满足性能需求的同时,还有一些因素需要考虑:1.体积,直接影响产品的便携性,便携性能使设备得到更广泛的应用,将医疗保健从城市普及到乡村及边远地区、灾患区、医院各个病房甚至救护车上;2.功耗,低功耗能大大延长设备续航时间,并有助于减小电池与设备尺寸;3.成本,低成本意味着更多人能够享受最新的医疗技术,比如发展中国家与边远地区的居民。

针对上述目标,异质SoC(片上系统)可以有效利用各种处理单元的优势,实现性能、功耗、体积、可配置性、可扩展性、开发效率(硬件&软件)、一次性工程费用(NRE budget)等因素的优化配置,成为当前的发展趋势。一个很明显的例子是,现在大多数高端嵌入式应用处理器都基于ARM内核(多核),并整合了图形加速器,视频编解码加速器等资源,实现了全可编程SoC,通过可编程硬件、软件及I/O,大大提高了系统的差异化与灵活性。

结语

第6篇:人工智能医疗方向范文

关键词:工业电气自动化;自动化技术;发展

工业电气自动化在发展的时候是离不开理论支持的,这也是工业电气自动化发展的基础。工业电气自动化技术在制造业和民用产品中发展是非常好的,工业电气自动化的发展是离不开计算机技术,计算机技术推动着工业电气自动化技术的发展。工业电气自动化实现了人工智能,使得工业生产中得到了巨大的进步。工业电气自动化设备是一种智能设备,在使用的时候实现了与人类智慧相类似的反应。工业电气自动化在研究对象方面是非常广的,其中包括系统运行、自动控制、电力电子技术、信息处理、试验分析以及计算机技术的应用。电气自动化技术在工厂中的应用是非常广的,电气自动化技术逐渐成为了工厂发展的主要技术支持,在电子工厂中,电气工程自动化体现在很多的方面,在编程和设计方面都要非常注意的。工业电气自动化主要要研究的就是与电气工程相关的自动化控制,在研究的时候,一定要不断提高技术水平,这样才能使电气自动化得到更好的发展。

1 工业电气自动化的定义

工业电气自动化通俗的说法就是为了实现机器设备和装置在无人操作的情况下,可以按照预先的设置程序或者是指令进行自动操作和控制的过程。现在自动化技术已经在很多的行业得到了应用,在工业、农业、交通运输业、医疗方面都有应用。自动化技术的应用可以将人力资源的工作强度降低,同时可以将部分简单的脑力劳动实现自动化操作,同时在面临恶劣环境和危险工作环境的时候,可以不必使用人力资源来进行工作,这样可以更好的保护工作人员的生命安全。电气智能化在劳动生产率方面得到了提高,同时也改变了人类认识世界和改造世界的能力。自动化现在已经成为了工业和农业发展的重要条件,同时也是工业和农业发展的重要标志。

2 工业电气自动化的发展历程

工业自动化出现在机械制造业中,随着科学技术的不断进步,计算机技术在自动化技术中得到了应用,这样就使得自动化技术同计算机技术紧密联系在一起,自动化技术也同信息化技术结合在一起,使自动化技术从生产过程中的最优控制逐渐向综合自动化控制阶段。自动化技术在二战之后对战后发展格局的建立非常有帮助。自动化技术在不断发展中,设计出了各种精密的自动调节装置,这样就使得自动化技术在系统和控制方面得到了新的发展。电子计算机技术的发展,推动着自动化技术向着更好的方向发展。电子计算机使得自动化控制系统在应用程序方面奠定了基础,同时将逻辑控制技术直接运用到了产品的生产过程中。自动化技术在发展的过程中,机器的操作更加的简单,同时实现了无人操作模式,使得生产过程更加的好。工业电器生产过程中,自动化程序在设计和使用的时候都是需要大量的研究的。

3 工业电气自动化的应用

工业电气自动化在含义方面包含着很多的内容,在形式方面,工业制造业的电气化主要表现在三个方面,实现自动化以后可以代替人的体力劳动,还能代替人的脑力劳动,在一定程度上能够协助人员更好的进行工作。自动化系统在进行制造的时候,实现了人和整个系统的协调性,同时在管理和控制方面也得到了更好的发展。工业电气自动化在功能方面实现了代替人员体力劳动的作用,但这仅仅是自动化功能目标体系中的一小部分。自动化的功能表现在很多的方面,现在已经逐渐形成了一个有机的体系。自动化技术在使用的时候,不仅仅要在生产过程中进行应用,而是在整个产品生产周期中都是要应用的。工业电气自动化是一个动态的概念,有着十分广泛和深刻的内涵。在制造自动化应用的过程中,工业电气自动化得到了更好的发展,工业电气自动化是一门涉及非常广,应用范围广泛的综合性科学技术。工业电气自动化作为一个系统的工程,主要包含五个方面,第一个方面是程序单元,这个单元主要要决定做什么和如何做。第二个方面是作用单元,在这个单元中,主要是施加能量和进行定位。第三个方面是传感单元,这个单元主要是对性能和状态进行检测。第四个方面是制定单元,这个单元主要是对传感单元发过来的信息进行比较,同时对信号的做出相应的指令。最后一个方面是控制单元,主要是制定和调节单元结构。

工业电气自动化的研究内容主要有自动控制和信息处理两个方面,包括理论、方法、硬件和软件等,从应用观点来看,研究内容有电器产品过程的自动化、机械制造自动化、管理自动化、实验室自动化和家庭自动化等。工业电气过程自动化石油炼制和化工等工业中流体或粉体的化学处理自动化。20世纪60年代以后,由于电子计算机的应用,出现了数控机床、加工中心、机器人、计算机辅助设计、计算机辅助制造、自动化仓库等。研制出适应多品种、小批量生产型式的柔性制造系统(FMS)。以柔性制造系统为基础的自动化车间,加上信息管理、生产管理自动化,出现了采用计算机集成制造系统(CIMS)的工厂自动化。

4 工业电气自动化的发展趋势

工业自动化的发展不仅实现产品方面的改变,同时也要改变现代工业的发展情况,工业自动化使工业产品更加的人性化,同时在资源利用方面也做到了更好,工业自动化对降低生产成本是非常有帮助的。工业自动化不仅仅可以给经济发展带来更好的社会效益,同时也能给生产企业带来更多的经济效益。企业在发展的时候,要不断发展工业自动化技术,这样不仅可以提高工业技术的水平,同时还能缩小我国在工业技术方面同发达国家之间的距离。在提高工业自动化水平的时候,可以通过自主研发的方式来进行,同时要重视工业自动化对经济发展的作用。工业自动化在发展的过程中,要不断应用新的技术,计算机网络技术在工业电气自动化中的应用效果就是非常明显的,计算机技术可以使各个运行的部分更加的紧密,同时实现了操作的一体化,这样使得工业自动化在操作方面更加的便捷,同时也能减少人员的工作强度。工业电气自动化在在发展的过程中,更加的开发,而且在信息化方面更加好。开放化就是要将系统与外界建立联系,实现电气自动化的各方的网络连接,提高信息处理能力;分布式的结构可以保证在网络中建立起独立的网络,以实现把安全危险分散,促进电气自动化系统的正常运行;而信息化就是实现设备与网络技术相结合,实现网络自动化和管控一体化。

5 结束语

我国加入世界贸易组织以后,企业面临的市场竞争更加的激烈,为了提高企业的竞争能力,企业要从产品销售价格上取得优势,这样就要降低产品的生产成本。企业在进行生产的时候,要吸取高科技先进的经验和技术,为实现自主研发提供条件。同时,将科学发展观作为前进的基础和指导思想,根据每个地区部门的实际情况,以人为本,及时发现问题,总结先进的经验,改变传统的发展观念,寻找一条合适的发展道路。工业电气自动化的发展目标是人工智能化,这在人类制作机器表达出来的人工智能,体现了自动化的特征优势。因此智能化技术在电气工程自动化控制中可以发挥最大的效用,使人类享受高科技的幸福。

参考文献

[1]范然,杨健.电气系统中自动化发展方向的探究[J].中国新技术新产品,2012(02).

第7篇:人工智能医疗方向范文

关键词:数据挖掘;循证医学;区域卫生信息平台;分析平台

1 引言

随着大数据时代的到来,数据挖掘和模式识别已经逐渐成为新的医学科学研究范式。而临床大数据集具有数据格式多样、复杂且难于统一,使得很大一部分临床数据得不到有效的利用。因此,如何根据循证医学特点,合理利用数据挖掘技术,获取有价值的治疗证据是循证医学的关键所在。

宁波市区域卫生信息平台自2013年建设开始,目前已接入市属8家医疗机构和鄞州区、海曙区、江东区、江北区、镇海区、奉化市、余姚市、慈溪市、宁海县、奉化县等区市县级平台以及市级公共卫生专业机构,实现了医疗服务信息和公共卫生服务信息的采集与交换。

本文从循证医学视角出发,构建电子健康档案和电子病历信息资源整合与挖掘的宏观模型和数据分析系统,对数据采集、数据挖掘等几环节进行设计,把纷繁复杂的医疗数据转变成有价值的信息,初步实现了对医学数据的交融扩展及挖掘分析的目的,为医学科学研究、临床诊疗、卫生决策、公众服务制定提供依据,其中包括:①帮助寻找最佳药物组合及标准化治疗方法,提高诊疗效果;②预测慢性疾病风险,查明罹患疾病几率;③协助医院评估、监测和提高患者治疗的安全性;④优化医院资源利用等等。

2 系统的架构及功能

系统采用B/S结构、面向对象的设计,以C#作为开发工具结合MSSQLServer数据库技术开发而成。系统由数据采集、数据管理、数据应用、平台访问、平台管理五大类模块组成[1]。

平台功能可分为智能报表分析、动态表单管理、动态数据库管理、动态数据库管理以及动态数据接口管理。系统采用高性能的缓存机制,确保网站访问速度;采用强大的安全机制,防止各种注入式攻击等漏洞;系统充分考虑了底层大数据量并发的性能问题。

3 系统的应用

3.1统计分析 统计数据分为传染病数据、高血压数据及门急诊数据三大类别,各类数据可根据时间、地区、患者年龄、患者涞源、性别、职业、疾病等进行分项统计。数据展示形式可分为曲线图、柱状图、饼图、漏斗图等。

3.1.1传染病统计 系统可将传染病报告例数按年份、月份、地区、年龄、性别、职业、疾病病种进行分项统计;图1、图2中分别显示了2011年~2014年传染病报告例数的逐月分析和按病种分析。

3.1.2 高血压统计 根据系统对已进行登记管理的高血压人群相应地区、年龄、性别的统计分析,我们可以对高血压病的易感人群开展重点防控。见图3。

3.1.3门急诊分析 门急诊统计可以对宁波市属各医疗机构及全市总门急诊量进行逐月统计。见图4。

3.2 数据预测

3.2.1 算法介绍 数据预测采用了移动平均算法,移动平均法是用一组最近的实际数据值来预测未来一期或几期内数据的一种常用方法。移动平均法适用于即期预测、能有效地消除预测中的随机波动。

移动平均法是一种简滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。因此,当时间序列的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出事件的发展趋势时,使用移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势(即趋势线),然后依趋势线分析预测序列的长期趋势[2-3]。

移动平均法可以分为:简单移动平均和加权移动平均,系统采用的是简单移动平均算法。简单移动平均的各元素的权重都相等。简单的移动平均的计算公式如下:

Ft=(At-1+At-2+At-3+…+At-n)/n

在此公式中,oFt表示对下一期的预测值;on表示移动平均的时期个数;oAt-1表示前期实际值;oAt-2,At-3和At-n分别表示前两期、前三期直至前n期的实际值。

3.2.2 预测效果

3.2.2.1传染病预测 根据2011年1月~2014年12月这一段时间的传染病数据,运用移动平均算法对数据进行处理,预测2015年度宁波市传染病发病数量预测,见图5。

3.2.2.2 门急诊预测 在宁波市某医院2014年门急诊量数据的基础上,运用移动平均算法对2015年该院的门急诊量进行预测,图6为2014年该医院的门急诊量统计,预测结果见图7。

4 讨论

该数据挖掘系统有效地利用了区域卫生信息平台中的海量数据,采用海量检索、人工智能和统计学等方法对宁波地区传染病、慢性病中涉及的循证医学统计指标进行分析,对医院门急诊量进行预测,有助于宁波地区医疗管理用户更加合理、有效地配置卫生资源及配套设施,为各项医疗计划的制定,及决策的实施提供可靠的理论依据。随着科技的进步,数据挖掘技术在疾病诊疗、药物应用,及医疗决策支持中的挖掘应用范围会越来越广,数据挖掘分析平台将衍生出更多面向具体问题的分析子平台,从而能够更好的为疾病诊疗带来保障。

参考文献:

[1] 孙向东,黄晓琴,朱春伦,等. 基于循证医学的海量医学数据挖掘分析方法研究[J]. 医学信息学杂志,2015,(3):11-16.

第8篇:人工智能医疗方向范文

选来选去,张锐最后决定从医疗健康入手。这是冷门方向,但他认为自己创办的移动平台应用春雨掌上医生的生存空间是中国供需不平衡的医疗市场,伴随着人口老龄化的加速,这一市场空间会进一步放大。

“想象一下,一个人感到头疼或者腰疼的时候,会选择去医院还是其他办法?”张锐对《环球企业家》说:“人们出现轻微的病痛时很少会去医院”。他解释说,按照医学常理,人们的病痛分1至10,大多数人在1至7级病痛时,很少去医院就诊,只有在7至10级才会看医生。而春雨掌上医生所要解决的问题便是人们1至7级的病痛—这大都是人们相对琐碎的小的病患需求。

在互联网中,已有一些医疗主题的网站,很多人也会在百度知道以及一些论坛中求助医疗信息。不过,在张锐看来,网络中关于医疗的数据,一方面它们是非机构化的,要想从纷繁复杂的网络世界找到针对性的信息与指引十分困难;另一方面是非专业性的,甚至可能只是某些网友一腔热忱的经验认识。

解决“看病难”,也是“春雨”的目标之一。张锐介绍说,因为自己祖父与父亲都是医生的缘故,他对医患供需不平衡的矛盾有着更深的认识:医生的确很忙—医生一上午要看30个病人,每天都有人在医院排队。一个职业医生,一周被切割为14个半天,其中有2个半天要看门诊,3个半天要巡视病房,这些时间段的确很忙;但其他时间可能是做科研和出席各种研讨会,这时候医生并非外界想象得那样忙得不可开交。这些医生零碎的空闲时间,可以通过一个方便的平台解决病人不紧急的问题。

移动诊疗

有了市场供需矛盾的认识之后,张锐与网易一同出来的合伙人开始琢磨起这款最终命名为“春雨掌上医生”的产品。这款产品分为用户健康自查与向医生问诊两个部分。

在用户健康自查模块是以三维立体的机器人形象页面,用户可以根据自己的病痛部位点击机器人相应的部位,点击之后,后台程序会带你进入相应的症状栏目,选定相应症状之后,便会进入下一个栏目—具体病症中去了解其概述、症状、检查、分科以及治疗方式等栏目,当然,更为重要的是,后台程序会识别用户的地理位置信息,提供附近就诊的医院或药店,甚至还有附近相应科室的医生信息。

张锐分析说,其实用户健康自查这个模块,相对比较简单,这只是将互联网上非结构性、非专业的病患资料进行结构化的专业整理。通过有经验的医生资源将人们所能遇到的病例进行有针对性的筛选,春雨掌上医生更多的只是扮演着数据梳理的角色。

真正复杂,同时也更有效果的,还是“春雨”为用户提供的“咨询医生”模块。这个模块解决的问题是,如何通过移动互联网技术,将医生自有的闲置时间利用起来,面向全国各地的患者。

“咨询医生”模块的基础是,“春雨”必须拉来足够多的好医生,并且鼓励他们利用闲暇时间回答病人的咨询问题。张锐告诉我们,他的团队花了4个月的时间,在全国各地拉来了4000多位医生入驻“春雨”,让这4000名医生成为最初的“种子医生”。

“春雨”以补贴的形式,用最直接的经济利益,驱动和鼓励这些“种子医生”回答患者问题,一个问题给医生人民币6块钱。获得这批种子医生之后,张锐也进一步采取了医生相互推荐的制度,通过这批“种子医生”吸引来更多的医生朋友过来。

根据介绍,由于用户数庞大,用户每天都有非常多的问题,目前“春雨”平台只开放了1500个问题,平均每天有1300多个可以得到比较满意的答复。不过,随着用户数继续扩大,张锐也面临着新的问题:一方面医生数量依旧有限,而另一方面,如果继续补贴,“春雨”的成本还将增加,并且这种惯性会把“春雨”嬗变成“网上医院”。无论是出于成本,抑或是出于政策风险,这种模式始终难以为继。

为此,张锐给“春雨”提出了新的规划与定位:让医患双方在“春雨”的平台上,自行定价问诊—或是患者提出一个问题,并开出相应的价格,由有时间的医生们选则,或是由医生开出报价,患者向他提出问诊。

按照张锐的设想,“春雨”的未来,更像是一个健康服务的“淘宝平台”,或健康问诊的拍卖市场。这一平台最基础的条件便是移动互联的发展,通过智能手机和互联网,医生的闲暇时间有了充分的利用,而用户亦可以足不出户,突破地理位置的限制看病。张锐告诉我们,在“春雨”的平台上,有一名协和的医生,他每天都是在下午6点至8点之间回答病人问题,“因为这时候是他在下班回家的路上”。这就是典型的移动互联应用场景。

病状自查与咨询医生两个模块之下,是疾病库、健康播报与个人中心。疾病库的作用不言而喻,它旨在为关注健康的用户提供一个疾病词典,而健康播报则是提高用户活跃度的一个重要产品—即便用户在健康的状态下,也可以根据自己的设定,订阅一些健康养生方面的新闻和资讯。张锐介绍说,个人中心是一个增加用户黏性的设置,也是“春雨”未来最重要的一个基础。通俗的说,它是病人的电子病历,将为注册用户提供包括疾病、医生、医院、用药等信息在内的个人健康档案。

创业前,张锐曾问过做医生的父亲一个问题,“你们医院有多少医生?最多有多少病人?”,父亲答到:“180多个医生,1000多病人。”

张锐想了想,自豪地告诉父亲,他可以做一个有1万医生,容纳10万个病患者的医院。目前,他已经完成了对父亲的许诺。但“春雨”这个超级医院显然还能扩张到更多的手机、平板电脑之上。

周鸿祎

职位:奇虎董事长

主要产品:360安全卫士

点评:已有近4亿用户选择360安全卫士来防杀木马、优化电脑性能。360安全卫士已成为广受欢迎的安全软件。周对消费者需求的洞察和把握更令人称道。

岳国峰

职位:百度无线事业部总经理

主要产品:掌上百度

点评:这是一款手机客户端,内置了无线搜索,且移植了百度贴吧、百度知道等百度产品。虽然不是浏览器,但贴吧、知道等模块是通过百度数据接口直接调用数据,速度远远快于其他基于WAP的浏览器,且产生的流量很低。另外,掌上百度还提供论坛入口、新闻资讯、天气、网络小说、网址导航等实用信息。掌上百度很可能将陆续移植百度旗下其他基于网页的产品,成为百度在无线领域的产品“集中营”。

丁磊

职位:网易CEO

主要产品:有道词典

点评:2007年9月网易旗下搜索引擎有道第一版有道词典桌面版,至今,在有道词典全平台的1.6亿用户中,手机端占6000万,PC端过亿。词典的手机端利用海量的在线词库句库,不占手机内存,方便快捷。凭借搜索引擎的优势,实时收录互联网上最新最流行的词汇,ORZ这样的网络词语也不放过。

成从武

职位:高德软件有限公司CEO

主要产品:高德地图、高德导航

点评:2009年,针对iPhone、Andriod Pad和新版Andriod手机的“高德地图”正式。成从武表示高德将逐渐向移动互联网业务转型,未来将定位于移动生活位置服务门户。目前高德地图有近5800万用户,高德导航已有将近7000万用户。

马健

职位:金山网络产品经理

主要产品:金山电池医生

点评:通过在充电时的适当维护,延长电池寿命。金山电池医生不仅能提供十几项省电技巧,还能预测电池可用电量(准确到分钟),避免电量不足的尴尬。

雷军

职位:小米手机董事长

主要产品:小米UI

点评:MIUI是小米公司旗下基于Android系统深度优化、定制、开发的第三方手机操作系统。与其他手机操作系统不同的是,MIUI是动员几十万网友每天刷机,并根据其反馈意见构造出来的。产品小组还根据测试用户的反馈意见,每周五更新改进。MIUI支持23个国家的语言,在16个国家有粉丝站,一半用户来自于国际市场。

李森和

职位:ZAKER CEO

主要产品:扎客ZAKER

点评:个性化定制阅读和分享软件,将微博、博客、报纸杂志、网络新闻、图片、RSS、团购、谷歌阅读器等众多内容,按照用户个人的意愿聚合到一起,用看杂志的方式轻松阅读。用户绑定微博后,可与好友进行分享、互动。这一产品符合移动互联网带来的碎片化、浅阅读的读者行为习惯。

王小川

职位:搜狗CEO

主要产品:搜狗输入法、浏览器、搜索引擎

点评:自2010年8月搜狗从搜狐拆分为一家独立的公司,搜狗的业绩增长十分迅速。王小川曾表示,搜狗输入法是一级火箭,浏览器是二级火箭,搜索是三级火箭,最后的发射来自前两级的推动。

马瑞麟

职位:长安福特马自达汽车有限公司总裁

主要产品:福享连篇

点评:除了互动体验长安福特全系产品、靓丽的车模秀,这个小工具还提供天气情况、洗车指数、限行提示和爱车保养方面的常识。长安福特在2010年底推出的这一苹果应用,成为国内汽车企业利用数字营销资源的成功案例。

俞永福

职位:UCWEB CEO

主要产品:UC浏览器

点评:作为一款智能手机浏览器,UCWEB拥有独创的U3内核和云端技术,支持HTML5应用,是阅读、看视频、上微博、玩游戏、网上购物等众多移动互联网体验最常用的工具,能为用户节省流量提高上网速度。

打造一款优秀的产品,您的方法论是?

成功的产品,都是不断试错调整出来的,它反映的是真正的用户需求。相反,你只做宏观的规划,靠逻辑、理性来定义产品,往往与用户的需求偏离更远。微创新就是要小步快跑,不怕失败。

李学凌

职位:多玩游戏CEO

主要产品:多玩YY

点评:游戏玩家的必备“武器”,解放双手,在虚拟世界笑傲江湖、征战沙场、过关斩将的同时可以实现团队语音互动。如今YY已经延伸至音乐、教育等各个领域。在淘宝事件中其再次火了一把。

袁辉

职位:赢思软件CEO

主要产品:小i机器人

点评:国内最早的网络机器人之一,在上网的同时,可以实现人机语音交流,机器人语音识别率和自然度高。

刘庆峰

职位:科大讯飞董事长

主要产品:讯飞语点

点评:语音助手应用软件, 改变用户使用习惯,通过语音即可实现聊天、拨号、文本输入、内容搜索、咨询答复、备忘录等多种功能,偏重实用,反应速度快,语料丰富。

郭秉鑫

职位:Talkbox CEO

主要产品:TalkBox 语音聊

点评:6个人的小团队先于米聊和微信开发出TalkBox 语音聊,成为最早解放用户“双手”的语音发送工具。

Paul Ricci

职位:Nuance 公司 CEO

主要产品:声龙听写(《Dragon Dictation》中文版)

点评:语音识别应用,在轻松自然说话的同时,可将语音转换成要发送的文字信息或电子邮件,识别度高,甚至可以“听”得懂方言。

王金星

职位:艾伏锐(北京)总经理

主要产品:EverFriends

点评:不同于大部分人机语音交互应用,EverFriends虚拟化了服务人物并取名Brainy(布兰妮) 和 Spoony(史卜尼),可以唱歌,讲故事,注重娱乐性。

打造一款优秀的产品,你的方法论是什么?

最好的用户体验加上独特的核心技术,同时遵循大道至简的设计原则。就讯飞的移动互联网产品而言, 我们的做法是在把握好产品核心定位的基础上从简单做起,然后在认真分析用户需求的基础上进行快速换代。 艺术来源于生活又高于生活, 打造一款优秀的产品也是这样。

做一名优秀的产品经理,所需要的关键能力是什么?

“源于热爱”——做一个优秀产品经理的前提是对产品发自内心的热爱和激情。三项关键能力:透彻理解客户需求,深刻把握核心技术,良好的沟通技巧和协调能力。

消费者需求正在发生什么样的变化?

过去的20年中,互联网一直在深刻的改变着人们的生活。 技术上的发展使得信息获取的成本无限降低,同时沟通的效率无限提高。消费者根本的需求没有改变,但需求的表现形式由于互联网的发展而不断地发生变化。

第9篇:人工智能医疗方向范文

关键词: [甲状腺结节; 超声特征; 不平衡性; 改进的集成学习

中图分类号: TP391

文献标志码: A

文章编号: 2095-2163(2016)06-0012-05

0引言

在甲状腺结节的临床治疗过程中,医生的首要内置目标即是判别结节的良恶性,而对于恶性结节患者需及时采取有效重要的手术治疗。但是在临床实践中,为了准确判别患者结节的良恶性特征属性,医生首先对疑似或确诊为甲状腺结节的患者设计指定超声检查,然后根据超声检查的各项指标,对疑似恶性结节患者增加细针穿刺活检,由此方可初步确定患者的良恶属性,最后才会得出推荐手术治疗的终诊论断[1]。不难看出,患者诊断结果的准确性主要依赖于医生的主观判断。由于不同医生的临床经验和医院医疗设施等存在差异,势必会造成不同程度的结果误诊。如此一来,将不仅严重影响患者正确治疗的展开推进,危及患者身体健康,而且也将对医疗资源造成一定的损失和可观浪费。

为了帮助提高医生临床诊断的准确性,同时降低患者误诊率,简化患者前期检测的定制流程。近年来,越来越多的学者试图通过机器学习、专家系统等人工智能方法进行甲状腺结节良恶性鉴别。其中,集成学习作为使用上具备广阔领域的机器学习算法之一,设计思路就是在对新的实例进行分类的时候,把若干个单一分类器集成起来,通过对多个分类器的分类结果构建某种组合来确定最终的分类,以取得比单个分类器更好的性能。因此在一般情况下,集成学习预测效果均要优胜于绝大多数机器学习算法。

但是目前大多数研究都是基于甲状腺超声图像数据,或者经过挑选之后比较完整的文本特征数据,再采用已有的机器学习方法直接送入模型训练,而却未曾考虑到真实医疗数据的稀疏性和不平衡性问题,因此得到的结果都存在一定的改进余地与完善空间。进一步研究可知,医疗数据的稀疏性主要体现在数据提取的缺失性上,由于患者病症的不同,提取的规则不同,难免会导致许多缺失数据,也即稀疏数据。而不平衡性则体现在患者的实际诊断结果上,由于大部分结节都是良性结节,造成数据中良恶性样本失衡。

为此,本文通过在目标函数中加入自定义项对集成学习算法来设计实现改进,提出一种基于改进集成学习的甲状腺结节良恶性鉴别方法,最大程度上消除数据的稀疏性和不平衡性对实验结果造成的影响,同时提高预测结果准确率。具体而言,该方法主要包括:在真实医疗数据集上,先通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,再将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成[2]。然后利用改进的Boosting算法,在节点分裂过程中自动利用特征的稀疏性,加快模型训练速度。实验结果表明,本算法相对于已有的机器学习方法具有更高的准确率,在真实医疗数据集和UCI标准数据集上分别达到92.43%和94%。

文章第1节概述了在甲状腺结节判别方面的相关研究;第2节展现了对数据的基础预处理设计;第3节具体描述了改进的Boosting算法;第4节通过与传统机器学习方法的实验对比,论证本算法的优异性;第5节给出本文的结论并对未来工作做出展望。

[BT4]1相关工作

通过机器学习方法提高对疾病的诊断预测准确率已经成为智慧医疗的一个重要实现途径,当下则有很多学者在甲状腺结节的诊断分类方面开启、并推进了相关研究。具体展开如下。

在数据的不平衡性处理上,David Masko对正例样本进行过抽样处理,人工注入样本使得正例样本的数目增加,使得正负样本达到平衡[3];Rok Blagus对少数类数据集规划执行数据预处理后,即运用过抽样和欠抽样相结合的改进方法,再利用交叉验证的方法来得到效果验证,改进效果明显[4]。

在甲状腺结节的预测鉴别研究上,熊伟等人提出了一种利用局部纹理特征与多示例学习相结合的方法,从感兴趣区域提取其局部纹理特征,将感兴趣区域看作由所有局部特征构成的示例包,最后利用KNN算法来实现对甲状腺结节的分类,准确率达85.59%[5];Jieming Ma等人提出一种基于SVM的甲钕俳峤げ夥椒ǎ并且为了防止模型的过拟合,在普通SVM模型的代价函数中加入惩罚项生成设计优化,准确率达86.6%[6];李前程等人将结节的良恶性作为因变量,以超声表现作为自变量,采用二分类logistic 回归分析筛选出对甲状腺结节良恶性有显著鉴别作用的超声指标并建立回归模型,准确率可达89.91%[7];张振宇等人对基于k-means聚类的动态集成算法研究了创新改进,提出了一种选择加权动态集成方法,采用多个分类器进行并联集成,以此来增加分类模型的稳定性,准确率则达到了90.2%[8]。

[BT4]2数据预处理

针对甲状腺结节患者治疗的临床经验以及某三甲医院患者的实际超声指标特征,实验前先将非结构化的医疗数据进行结构化处理[9],提取出研究需要的指标以及对应的文本描述。然后将表示特征指标程度的文本变量转换为算法能够处理的数值型变量[10]。

为了降低信息重叠造成的结果失真,研究中利用主成分分析法对诸多的特征作出选择,在最大化保留原始数据信息的前提下,去除不必要的特征,提升模型训练速度和结果准确度。首先对原始数据设定修正达到标准化,计算其相关系数矩阵,求出特征值与特征向量,然后选取累计贡献率达到85%以上的特征值对应的主成分,替换原始特征变量[11]。[JP2]经过主成分分析后,选择使用血流模式、血供程度、回声分布、包膜接触面积、甲状腺实质血供、结节边界等16项指标作为输入特征变量,以其对应的结节病理诊断结果作为预测输出变量。[JP]

在数据平衡性方面,研究则利用改进的SMOTE算法对恶性结节样本进行过抽样处理,人工注入样本使得样本数量增加;对良性结节样本进行欠抽样处理,将谱聚类算法引入其中,选取样本的子集即可使数据集在良恶性样本的数目上趋于平衡,提高试验结果的准确性。

4实验结果与模型评估

[BT5]4.1参数确定

为了找到算法的最优结果,需要通过实验确定各参数的最佳值。一般情况下,各参数需要同时考虑,才能得到全局最优值,但是考虑到此处的特殊性,当迭代次数足够大时,模型的分类准确率趋于稳定,因此实际调参过程中通过设置足够大的迭代次数、如1 000次,可以得到最优的树深度,然后在此最优深度下选择最优的迭代次数,避免不必要的空间和时间浪费。在此,将给出预测准确率与树深度间的对应关系,如图1所示。

从图1中可看出,当树深度为3时,模型的预测准确率达到最大,具体为92.43%。分析原因在于:原则上当树深度增加时,模型复杂度也随之增加,对数据的分类也就越准确,但当树深度达到一定数量(在这里是3)后,再增加树深度只会造成过拟合,在测试集上的准确率反而会出现下降。

接下来,研究中进一步给出了预测准确率与迭代次数之间的统计关系,结果示意如图2所示。

从图2可以看出,当迭代次数达到400次以后,预测准确率达到最大,具体为92.43%。至此,本模型参数确定为树深度为3,迭代次数为400次。

[BT5]4.2模型评估

模型评估是检验设计模型是否具有使用价值的重要依据,是模型建立过程中必不可少的基础有益环节。本文拟将从混淆矩阵和ROC图像两个方面进行模型评估。

4.2.1混淆矩阵

混淆矩阵主要用于比较模型预测值同实际真实值之间的差别,是一种常用且有效的模型评估方法[13]。实验以297名患者的数据作为测试集,对比预测值与实际值之间的差别。实验结果如表1所示。

从表1可以看出,算法预测准确率达到92%。其中恶性结节预测准确率达到86%,召回率达到96%,也就是说几乎所有的恶性结节患者都能获得正确识别。作为对比,该医院的真实临床数据却清晰地显示出,被医生诊断为恶性结节并实施相应手术治疗的患者中,实际恶性患者占比仅为63%。

4.2.2ROC图

ROC(受试者工作特征)曲线常常用来检查在找出真阳性和避免假阳性之间的权衡,曲线上的点表示不同假阳性阈值上的真阳性的比例。简单来说,ROC曲线下面积越大,模型效果越好[14]。本次研究模型的ROC曲线则如图3所示。

从图3可以看出,ROC曲线距离完美情况比较接近,经计算也可得出AUC(ROC曲线下面积)为0.935,说明模型预测性能非常好。

4.3算法对比

为了验证本算法的实际性能,本文选择了3种常用的数据挖掘模型展开对比测试。实验采用真实临床医疗数据和UCI标准数据集new-thyroid分别进行分类预测效果对比,且各模型都选取最佳参数下的效果,对比结果如表2、表3所示。

从表2、表3中可以看出,本文提出的方法预测准确率较之前已有的研究方法均呈现有一定程度的提高,证明了本文算法的优异之处,对于疾病的诊断预测研究有一定的帮助。

[BT4]5结束语

近年来,甲状腺疾病、尤其是甲状腺结节的诊治医疗已然成为研究学界的一个重点课题。如何在临床施诊过程中能够有效提高良恶性结节的诊断准确率,正确及时制定、推荐治疗方案,无论对患者的病情进展控制还是对医疗资源的合理配置都将具有重要的意义。本文提出的改进的Boosting算法,在真实医疗数据集和UCI标准数据集上都呈现出一定的优异性,具有较高的预测正确率。并且考虑到实际医疗数据的不平衡性和稀疏性,使结果更具说服力、及优良可行性。

未来的工作主要从3个方向入手:首先,在更趋宏观科学的指导下确定鉴别结节良恶性的特征属性;考虑其他忽略的特征属性对鉴别结果的影响。其次,提升特征属性的质量;包括特征属性的提取、转换和选择。最后,要重视算法的优化,针对医疗数据的特征作出相应的模型优化,让算法对数据集分类的结果更具普适性和高效实用性。

[HS1*2][HT5H]参考文献:[HT]

[WTBZ][ST6BZ][HT6SS][1] [ZK(#〗

[HJ*2]

[JP3]HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association[JP] Management Guidelines forpatients with Thyroid Nodules and Differentiated Thyroid Cancer[J]. Thyroid, 2016, 26(1): 1-133.

[2]u权,郭茂祖,刘扬,等. 类别不平衡的分类方法及在生物信息学中的应用[J]. 计算机研究与发展, 2010,47(8):1407-1414.

[3] Masko D, Hensman P. The impact of imbalanced training data for convolutional neural networks[D]. Stockholm:KTH Royal Institute of Technology, 2015.

[4] LUSA L. Joint use of overand undersampling techniques and crossvalidation for the development and assessment of prediction models[J]. BMC bioinformatics, 2015, 16(1): 1-10.

[5]熊ィ龚勋,罗俊,等.基于局部纹理特征的超声甲状腺结节良恶性识别[J]. 数据采集与处理, 2015,30(1):186-191.

[6] MA J, LUO S, DIGHE M, et al. Differential diagnosis of thyroid nodules with ultrasound elastography based on support vector machines[C]// Ultrasonics Symposium (IUS), 2010 IEEE. San Diego, California, USA: IEEE, 2010:1372-1375.

[7] 李前程,孙丽娜,吴双,等. 高频超声及弹性成像对甲状腺结节性质鉴别诊断的logistic 回归分析[J]. 中国地方病防治杂志, 2015,30(4):291-293.

[8] 张振宇. 改进集成技术在甲状腺超声图像分类中的应用研究[D]. 保定:河北大学, 2014.

[9] 陈德华,冯洁莹,乐嘉锦,等. 中文病理文本的结构化处理方法研究[J]. 计算机科学,2016,43(10):272-276.

[10] 戚ィ陈俊,李千目. 基于冗余消除和属性数值化的XACML策略优化方法[J]. 计算机科学,2016,43(2):163-168.

[11]Furuya S, Tominaga K, Miyazaki F, et al. Losing dexterity: patterns of impaired coordination of finger movements in musician's dystonia[EB/OL]. [2015-08-20]. http://sci Rep.2015;5:13360.

[12]Chen T, Guestrin C. XGBoost: A Scalable Tree Boosting System[EB/OL]. [2016-03-09].https:///pdf/1603.02754v1.pdf.