一、人工智能是做什么的?
“人工智能”一词最初是在1956 年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能(Artificial Intelligence),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
二、人工智能可以以什么方法解决某些问题?
1、所用的方法
尽管人工智能已渗透到各行各业,但它的应用和落地方式还极其有限。驱动百亿的市场容量的,基本上属于同一种AI: 监督学习(Supervised learning),即用AI来确定A-->B的映射——输入A和响应B的映射,输入数据(A)快速生成简单的回应(B),举个例子:
输入A | 输入B | 应用 |
贷款申请 | 是否还款(0 or 1) | 贷款批准 |
广告+用户信息 | 用户是否点击广告(0 or 1) | 定向精准广告 |
音频剪辑 | 音频转录文本 | 语音识别 |
英语 | 法语 | 翻译 |
硬盘、飞机发动等传感器 | 是否即将要坏 | 定期检修 |
图片 | 有没有人脸(0 or 1) | 图像标注 |
汽车摄像头和其他传感器 | 其他汽车的定位 | 自动驾驶 |
A→B 系统发展速度很快,这其中深度学习很大程度上受大脑的工作原理启发。即便是受大脑原理启发,但是这些系统的智能程度仍旧远远达不到科幻小说里的那样。许多研究员正在探索其他形式的人工智能,其中一些已被证明在特定环境下有效,也许还有更好的突破方式,让更高级的人工智能诞生成为可能,但我们仍然没有清晰的路径去实现这一目标。
不过,目前监督学习有一个致命的弱点:它需要庞大的数据。研究者需要给系统输入大量A 和B 的样本:搭建一个图片标注器就需要十几万的图片(A)和可以证明图中是否有人存在的标签(B)。同样,建立一个语音识别系统需要数万小时的输入语音(A)和语音转录文本(B)。
现在,监督学习、迁移学习、非监督学习、强化学习这四类算法所创造的经济效益是递减的。当然,这只是目前的情况。计算机学科不断有新突破,每隔几年就变个天。这四个领域中的任何一个都可能发生突破,几年内这个顺序就可能要重排。
2、能解决的问题
在哪些产品里能用到AI?
产品经理常常希望了解AI能实现的,和不能实现的。一个简单的思路是:一般人能在一秒内想出来的事情,现在或很快就可以用AI自动实现。
AI进展最快的领域正是人能做得到的领域。比如自动驾驶。人类能驾驶,所以AI也能驾驶。在医学影像阅片和分析上,人类放射科医生能够阅片,所以AI也很可能在未来几年内做到。
而人类难以做到的事情,比如预测股市变化,AI可能也难。
原因1:人类能做的,至少是可行的;
原因2:可以利用人类的数据作为培训样本,比如前面提到的输入A和响应B;
原因3:人类能提供指导。如果AI对某个放射影像的结论有误,设计者可以向医生请教,医生所做的正确结论的原因是什么? 进而对AI进行改善;
在Andrew Ng所接触到的80-90%的AI项目中,都遵循这一规律:在人类能做到的领域,AI的进展更快。很多项目的发展一旦超越人类水准,发展也会变得缓慢。这也带来一个社会矛盾:如果AI和人的水平类似,实质上是跟人类竞争。
三、所研究方向的现状?
每当一个事物兴起的时候,随之而来的就是大量的观点与推测,其中最受欢迎的往往是那些最大胆的;而后每增加一个论据,都会让我们对这个观点更加深信无疑。就像从Alpha Go战胜李世石后,人工智能在中强势回暖,而后李彦宏在世界互联网大会上的言论,也再度加强了人们对它的关注。
为什么AI会突然在这几年进步这么快?
如果你的横轴是你的数据量(amount of data),纵轴是效率或准确度,当企业产生大量的数据,传统企业按照过去的算法无法提供数据的计算效果,但如果训练一个巨大的神经网络,效果会非常巨大。
如果你要达到最好的效果,有两个必要条件:
第一,要训练一个巨大的神经网络(NN);
第二,要有大数据。
今天很多企业有海量数据,但几年之前没有办法训练足够大的神经网络来实现计算。
今天,最好的人工智能团队都可以从算法(机器学习)和超级计算机架构入手。
不仅百度,马化腾在2015年6月的演讲中也说道:人工智能是我最想做的事情。马云也在2015年5月内部信中写道:未来三十年云计算、大数据、人工智能等技术将会让无数的梦想成真。
目前国际互联网巨头纷纷入场, 亚马逊的 Alexa、苹果的 Siri、微软的 Cortana,作为人工智能的第一块敲门砖,已经被较为广泛的使用;搜索、翻译、地图、无人车,深度学习的影子无处不在,人工智能正在重构人类的生活。
同时,伴随互联网的高速发展和底层技术的不断进步,人工智能所需的能源正在不断完善。
1)数据量: 2000年至今,互联网及移动互联网的高速发展使得数据实现了量的积累,据IDC预测,2020年全球的大数据总量将为40ZB,其中有七成将会以图片和视频的形式进行存储,这为人工智能的发展提供了丰厚的土壤。
2)深度学习算法:多伦多大学教授Geoffrey Hinton(致力于神经网络和深度学习研究)的学生在业内知名的图像识别比赛ImageNet中利用深度学习的算法将识别错误率一举降低了10%,甚至超过了谷歌,深度学习进而名声大噪。2015年,微软亚洲研究院视觉计算组在该项比赛中夺冠,将系统错误率降低至3.57%,已经超过了人眼。
3)高性能计算:GPU响应速度快、对能源需求低,可以平行处理大量琐碎信息,并在高速状态下分析海量数据,有效满足人工智能发展的需求。
4)基础设施成本:云计算的普及和GPU的广泛使用,极大提升了运算效率,也在一定程度上降低了运营成本。IDC报告显示,数据基础设施成本正在迅速下降,从2010年的每单位9美元下降到了2015年的0.2美元。
四、所研究方向存在的问题?
目前人工智能虽处于寒武纪的大爆发阶段,但也很可能再度面临寒潮。具体来说,人工智能可能会面临这五大考验:
1、理论鸿沟很难逾越
目前人工智能在学习上遵循的理论依然是上个世纪80年代提出的,人们并没有从本质上理解人类的学习原理,从监督学习到无监督学习的方法还在探索。目前的人工智能技术多数都要依靠形态匹配,在监督式学习下,输入训练数据,每组训练数据有一个明确的标识或结果。人们将预测结果与训练数据的实际结果进行比较,不断调整预测模型,直到模型的预测结果达到一个预期的准确率。而无监督学习中,计算机无需人类帮助的情况下,像人类一样自己学习知识。计算机并不被告知怎么做,而是采用一定的激励制度来训练机器人培养出正确的分类。无监督学习方式是机器人工智能发展的关键技能之一。“目前朝着良性的趋势发展,但还未达到我们希望的阶段。”微软亚洲研究院院长芮勇表示。
2、知识表达问题
许多输入的数据其实都经过了人脑抽象,若要完成形式化知识结构的搭建,是需要很多知识的,而机器中没有人脑中的背景知识,所以数据中蕴含的信息是不完整的,继而计算不出正确的结果。
如果将这些信息补足,是有可能用机器处理的。但同时要看到的是这些信息很难补足,一方面是因为很多人脑中的知识难以形式化,另一方面,补什么补多少才能达到特定的效果,很难衡量。并且人脑输出的信息带宽太小,很难通过一个人来补足机器中没有的知识,而多人协同又存在知识相互不兼容的问题。所以知识太多,知识难以形式化,人脑输出太慢,成为了知识表达的三大障碍。
3、人才问题
现在人工智能领域的理论掌握在顶尖教授手上,但应用的数据在公司手上。顶尖教授一般会有与同行进行交流、发表研究成果的诉求,但公司的研发却要求不能透露商业核心秘密,甚至要将这个科学家雪藏起来,比如苹果现在人工智能的领导者是谁,我们都还不知道。这里面存在天然的冲突,很可能成为制约人工智能发展的瓶颈。
4、资本化问题
由于人工智能是巨头公司的天下,所以被并购是许多初创公司的宿命。当前,谷歌、IBM、雅虎、英特尔、苹果、Salesforce以及国内的百度、阿里等互联网科技巨头公司布局势头凶猛,引发了一场全球范围内的人工智能投资收购热潮。
首先,反观目前国内人工智能企业估值偏高,仅有2~3人的早期初创公司有时开价达1~2亿元,较成熟公司的估值甚至比上市公司还高。这种高估值企业有时甚至让产业投资者难以接受,结果导致某些上市公司和产业基金纷纷出海,布局硅谷、以色列等海外市场。不过,上市公司或产业基金布局海外市场都需要考虑落地问题,这时候沟通成本、管理成本、人员适应本地化成本便会增加。因此,如何降低成本成为布局海外市场的一大难题。
其次,上市公司在投资初创企业时多对其业绩有要求,这就使得它们在投资并购时倾向于选择较为成熟的AI公司。然而目前国内人工智能领域的创业公司在整体效果上并没有达到上市公司的期望值,许多初创公司的成熟度与上市公司自身业务发展的匹配度也不够高。
所以,现在多数上市公司采取的方式是先在体外投资孵化,待孵化的公司成熟到一定程度时再装进上市公司内部。
另外,有些上市公司自身也存在追逐热点的问题,在并不具备布局大数据、人工智能产业的基因的情况下,但却在积极布局。这使得被投资或并购来的公司不能匹配上市公司的业务、管理能力和战略发展方向,反而导致初创公司的未来发展受到了。
5、安全问题
这里面的安全不是某一项人工智能产品是否存在风险,而是对强人工智能何时出现的整体的考量。人工智能毁灭人类论属于强人工智能阶段,目前我们的科技还停留在弱人工智能阶段,强人工智能目只存在于科幻片。
对于人工智能的安全性,扎克伯格的观点代表了中国创投界大多数的想法:我们过度担忧人工智能,将阻碍人工智能实际的进步。现在担忧人工智能的安全性,就如同两百年前担心要是以后有飞机了飞机坠毁怎么办一样。我们要先造出飞机,再担心飞机的安全性。
五、人工智能在医疗、护理、老人和小孩照管中的应用
1、智能问诊
百度"医前智能问诊平台"宣称汇聚超过2万种常见症状,580万条病例数据,能满足人们在就医前基本的问诊需求。如在百度或者百度知道中搜索"头疼",网友可以根据自身情况选定性别、所属人群、症状等,定制化寻医问症各项参数,百度搜索技术则通过后台计算,智能匹配推送更精准的参考病例和针对性建议。
在智能问诊的小测试中,百度医生的诊断和北大国际医院的医生诊断,在80%的情况下是一致的,而且它可能在一些比较罕见的情况下表现更好。当然这些技术除了对大量的医疗知识进行机器学习外,也需要对病人表述的理解能力不断地提升。
2、智能影像识别
随着深度神经网络的出现,计算机视觉领取了性的进展,如今影像识别是人工智能在医疗领域的又一个重要的分支,并且普遍被认为是已经成熟可商用的领域,国内的人工智能医疗团队Airdoc如今已经掌握了世界顶尖的图像识别算法,并且在人类顶尖医生的帮助下,通过海量医学影像的学习,如今已经诊断多种疾病,以糖尿病性视网膜病变为例,在顶级眼科医生的帮助下,Airdoc的辅助诊断模型,在在灵敏性和特异性等主要指标上,准确率已经和三甲眼科医生水平相当。
计算机视觉可以在检查CT影像时帮医生阅片,事实上,人工智能技术在辅助诊疗方面已经有所落地。日前,国内首个AI+医疗"智慧医院"安徽省立医院发现,AI医学影像辅助诊断系统已经可以实现胸部CT和乳腺钼靶影像的智能辅助诊断及辅检服务。据该院院长许戈良介绍,上述AI医学影像辅助诊断系统由该院与科大讯飞合作研发,于2016年6月开始学习和应用。一年来,该系统通过学习68万张肺部CT影像资料,已在该院CT室辅助医生诊断了约11000人次的CT影像资料,诊断准确率达94%。
3、智能语音交互
医生与人工智能系统的语音交互也是AI医疗的实践中一个重要内容。人工智能语音技术已在医护查房、超声检查等多个场景中得以使用,医生使用的"云医声"手机App,不仅可以语音输入查房记录,还可追踪患者的病案信息。
4、医用机器人
医疗机器人是用于医院、诊所的医疗或辅助医疗的机器人,因为应用领域的不同,医疗机器人的种类很多,有临床医疗用机器人、护理机器人、医用教学机器人和为残疾人服务机器人等。达芬奇手术机器人便是其中名气较大的一款医疗设备,如今已经在全世界范围内开始应用,并且已经为数以万计的患者提供服务。
5、基因分析
用基因来进行治病,最大的一个问题是大多数已知的基因导致的疾病都是单基因导致的,而这些病又大多是罕见病,大多常见病是多基因导致的。通过大量的计算,人工智能可以帮助医生搞清楚一个病是由哪些基因共同作用导致的。
6、新药研发
今天已知的、有可能形成药的小分子化合物大概是10的33次方那么多,这可能比全宇宙所有的原子加起来还要多。这样的一个量,怎样用它的分子式跟产生疾病的蛋白去合在一起,用来治病?怎样对未知的那些分子式进行大量的筛选,找到有效的新药?计算机科学、人工智能能够在这方面有所帮助。
7、护理机器人
百度推出了一位名为Melody的聊天机器人,与病人进行交流并改进诊断方法。Melody可以通过对病人进行提问,在网上找到相关的健康信息,给医生提供一个假设,医生检查后再跟病人进行沟通交流。
由腾讯资助的iCarbonX公司利用人工智能收集信息,并直接向患者提供医疗建议。该公司可以通过基因信息和生物样本来预测健康问题。
另外,基于人工智能的机器人现也在中国老龄化的人口中充当伙伴和帮手的角色。 Siasun机器人及自动化有限公司最近推出了一款新型机器人,其目标是为老人服务,帮助他们沟通并进行健康检测。 这类护理机器人使用了人工智能技术,如语音识别、自然语音处理和机器学习等, 预计将在中国人口老龄化日益严重的人口中,发挥越来越重要的作用。
除上述外,机器人还可以帮助老人探测入侵者以及家中潜在的危险。 去年,由山东大学云智能计算机实验室设计的陪护机器智使用了音频和视觉信息,结合面部识别技术来辨别陌生人。 疑似入侵者会被拍下来然后通知房主。 此外,如果房主摔倒,相关的照片会被发给紧急联系人。