最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

大数据在医疗领域的应用

来源:动视网 责编:小OO 时间:2025-09-26 00:08:56
文档

大数据在医疗领域的应用

大数据在医疗领域的应用课程前言可能大家注意到,最近正式下发了《关于积极推进和规范医疗健康大数据应用的指导意见》,应该说这是我们当前在大数据应用领域非常重要的文件,我围绕着这个文件的一些个精神跟大家讲一下自己的学习的体会。在正式讲之前,我给各位领导简单的讲一个关于大数据的段子,这个可能大家很多都看过。比如说某一个用户打电话给一个比萨店,说我要订一份比萨,他就问你的用户卡号是多少,他说我是多少,他说我知道了,你是姓什么,叫什么,住在哪里,你电话号码是什么,你的手机是什么。然后说我订一份
推荐度:
导读大数据在医疗领域的应用课程前言可能大家注意到,最近正式下发了《关于积极推进和规范医疗健康大数据应用的指导意见》,应该说这是我们当前在大数据应用领域非常重要的文件,我围绕着这个文件的一些个精神跟大家讲一下自己的学习的体会。在正式讲之前,我给各位领导简单的讲一个关于大数据的段子,这个可能大家很多都看过。比如说某一个用户打电话给一个比萨店,说我要订一份比萨,他就问你的用户卡号是多少,他说我是多少,他说我知道了,你是姓什么,叫什么,住在哪里,你电话号码是什么,你的手机是什么。然后说我订一份
大数据在医疗领域的应用

课程前言

可能大家注意到,最近正式下发了《关于积极推进和规范医疗健康大数据应用的指导意见》,应该说这是我们当前在大数据应用领域非常重要的文件,我围绕着这个文件的一些个精神跟大家讲一下自己的学习的体会。

在正式讲之前,我给各位领导简单的讲一个关于大数据的段子,这个可能大家很多都看过。比如说某一个用户打电话给一个比萨店,说我要订一份比萨,他就问你的用户卡号是多少,他说我是多少,他说我知道了,你是姓什么,叫什么,住在哪里,你电话号码是什么,你的手机是什么。然后说我订一份这个海鲜比萨,然后这个店里的接线员就说,说你不要吃这个海鲜比萨,我们通过了解了你的健康档案,说你患有血脂高,不适宜吃这种动物性的东西,最好吃植物性的东西。说那就是吃一个素的吧,然后说那我要一个比如是10寸的,他说我了解了你们家里头现在就三口人,你适宜买这么大的,你买一个小的就可以了。然后说那行,你就给我送来吧,说我准备到时候信用卡给你付款,他说你不行,他说我们了解了,你现在信用卡本月那个刷卡记录已经把你的那个额度刷爆了,你准备好现金吧,说那行,那我准备现金,你给我送过来吧。他说我们看了你现在的行车的轨迹,你离我们比萨店只有5分钟的路,你自己开车过来取得了,说我要给你送过去还得30分钟。这是个笑话,这个段子说明这个大数据跟我们每个人都密切相关,而且这个数据的关联性实际上是可以给我们每个人画一个像。所以今天我就跟大家介绍这样一个内容,主要是讲我们怎么样积极规范和来推动我们这个医疗健康大数据的应用。

一、当前的新技术、新趋势和面临的新机遇

第一点,我们讲一下当前新的技术、新的趋势和我们面临新的机遇。大家都知道,就进入现代社会以来,一个技术主导了一个世纪的发展。比如说18世纪是机械开始的时代。到了19世纪有了动力、有了蒸汽机。到了20世纪的上半个世纪,是我们的机电自动化和重化工。从20世纪下半个世纪开始,应该说一直到现在,是信息技术主宰我们这个时代的前沿的技术。到了这个新世纪,21世纪,以这个云计算、物联网、大数据为代表的这个东西,也主导了我们新的世纪。

当今时代,我们的人类社会步入了一个以科技创新不断涌现的重要时期,新的技术推动了我们世界范围内生产力、生产方式、生活方式巨大的变革,其中信息技术进一步推动了经济的增长和社会的发展,推动了知识传播应用进程的变化。所以当今以云计算、物联网和大数据为代表的新的技术,成为我们新时期整个的重大突破发展的一个前沿,也是我们当今面临的最大的机遇,也是我们最大的挑战。

总的来说,当今信息技术的发展有四大趋势,就像前面我们说的,大家都感受到,第一个是互联网的发展,特别是移动互联网的发展和这种互联网泛在的这种网络人人相连、人物相联,物物相连这个网络,通过智能终端的这种发展,这是第一个大的趋势。由于有了这样的一个移动互联网,有了物联网的这种推进,也有了这个智能终端的发展,当今的社会有一个很大特点,就是这个网络社会促进了社交的发展,这个社交化的平台,比如说大家都熟悉用的微信、微博,已经成了我们现在沟通、协作、分享的一个平台。由于有了移动互联网,有了一种社交网络,使得我们的数据就剧烈地增长,而且变化非常快,而且它的合适内容也更加多样化。如何处理这样的数据,用传统的方式能力就不够了,这样就产生了新的计算的模式,就是云计算。

著名的咨询公司麦肯锡,对今后未来20年中间具有性的科技创新做了预测。其中移动互联网,我们说的知识工作的自动化,物联网、云计算等等都成为最主要的新的技术。而支撑这些技术的东西它的基石就是大数据,所以这个海量的数据,以及与他们采集的工具、平台、分析系统一起合起来,我们就称为大数据。

所以大数据的来源既来源于我们互联网上的数据,也来源于我们物联网,用各种传感器传感的数据,各种实时的数据,比如说我们现在的交通的这种流量,我们这种视频的监控,还有各种的比如说地震、物探所探测的数据,我们气象的数据,这样的数据总起来就成了当前的最具有的特征,就是大数据。在当今大数据和互联网这种蓬勃发展的时候,我们看到了,就是这种世界因互联网而精彩,生活因互联网而更加丰富。我们还可以戏说,就是互联网和大数据的这种激情碰撞,改变了我们整个发展的格局,改变了生产的方式,改变了生活方式,所以我们戏说,“金风玉露一相逢,便胜却人间无数”。

在产业发展领域,它加速了产业优化升级的步伐。现在越来越多的企业,通过部署云计算、开发大数据资源,实现了协同设计、协同制造,现在又叫云设计、云制造,利用云平台来推动了我们整个发展。我们可以举一个例子,大家都看到,我们国家的航天事业发展非常快,我们国人也引以为自豪。过去我们研制一个新型号的航天器,从开始设计到制造出原型,不管是火箭、导弹,还是卫星,平均要6到7年的周期,现在由于有了现代信息技术的支撑,已经把这个周期从开始设计到出样机,缩减到18个月以内,这主要是得益于我们这种数据资源的共享和云计算,包括这种3D打印。一个航天器新型号里头要有1万多条导管,这个导管过去如果是逐个的来加工,那周期很长,还要在对接的时候做很多的辅助工作。现在用这种精确的3D打印,依靠大数据,可以是85%的导管一次成型,直接就可以对接。

在城市和我们目前的广大公共服务中间,也随着云计算和大数据的应用,在智慧城市,在这种社区管理,我们今天还讲到了关于疾病的预防和治疗,食品、药品安全的监管等方面都发挥了重要的作用,给我们个人的生活也带来了巨大的便利。

所以现在的大数据时代,我们常说,是一个5个“无处不在”的时代,包括计算无处不在、网络无处不在、软件无处不在、大数据无处不在,更重要的是给我们带来的服务无处不在。因为现在我们各位领导、各位同志,你们每个人的手机现在都是智能化的,都是一部功能很强大的电脑,它可以计算,可以联网,里头有很多的软件服务,也产生了大量的数据,我们现在手机上的这个APP,每一个APP都是给我们提供了很好的服务。比如说我们出差,我们可以找携程、去哪儿,然后我们订票,我们去查航班,可以查航空管家、航旅纵横,我们甚至出去吃饭,我们可以上大众点评,这些都是给我们带来的服务。

所以我们在研究中间,我们认为当今全球的信息化有六大发展趋势:第一个就是前面说,移动互联网正在高速的发展;第二个就是大数据被多个国家上升成为国家的战略;第三,还有一个重要特征,就是我们的互联网不仅是有生活上的,大家消费上的互联网,更在朝着产业互联网、工业互联网发展前进。全球的信息化还步入了一个智慧化的阶段。大家看我们现在都在讲智慧城市建设、智慧社区建设、智慧医疗,我们现在有智慧水务、智慧警务,都是标明我们的信息化建设朝着一个新的阶段,而且这些技术促进了我们各行各业、各个领域的创新。当然我们说还有一个特点,就是当今网络安全非常重要,既我们常说的制海权、制空权、制太空权之后,制网权成为各国激烈角逐的一个全新的领域。也就是我们在这个领域里必须捍卫我们网络空间的我们的主权。

其中大数据被多个国家上升成为国家战略。继美国之后,英国、法国、日本、韩国都把大数据成为国家的在新世纪的重大的发展战略。我们国家也在去年,以国办发50号文件的正式下发了《大数据发展行动纲要》,明确把大数据作为国家的发展战略。这个已经写在十三五规划纲要里。

大数据成为全球信息化发展的一个主要趋势,一个是各个国家掀起了我们开放数据的热潮,就是把掌握的公共数据开放出来,供全社会的共享和开发利用,第二是各国纷纷出台了围绕本国特点大数据的发展战略和这个行动的计划。第三大数据进一步成为各个国家进行社会治理,甚至包括我们的这种全球治理的一个重要的依托和治理工具。

这方面有很多的案例,比如说以韩国来说,他们首尔地区首都过去夜间也是没有公共交通的,只有出租车,费用还是比较贵的。等到凌晨一点以后出行,就只好选择这种最贵的出租车。当时这个市民就通过互联网向市民提出意见,因为韩国年轻人夜生活也很多。后来就怎么解决这个问题呢?就是首尔就利用市民打电话的这个地点和频度,通过大数据来解决这个问题,他就是按照把首尔分为若干个相类似我们这种叫做网格式的,分成若干个六角形,半径是一公里,一共分成了1252个,然后他分析每一个六角形里头,这个市民打电话、发短信的那个信息,以及通过这个来判断夜间市民出行的这个路线和范围,然后根据这个来设定夜间开公交的路线和频度。这样的话,既节约了这个公交的投资,然后又满足了市民夜间出行通过公交的要求,所以这是很精准。其实我们看到,我们国家也可以借鉴这个,比如说我们这个城市里公交有的时候你就会发现,大家都要上公交的时候,他车很少,等到你不怎么要上公交的时候,你看那公交空着车来回跑,这就是我们现在需要解决的。

类似的,比如说我们查航班是不是准点,有了很多的办法,比如说大家手机上的APP 里头非常准、航旅纵横、航空管家这些东西,还有直接可以查航空公司。但是过去是没有的,就是因为没有开放出民航的数据。这个应该说是借鉴了美国的一些地区经验。美国是首先把全美的航班延误的数据,甚至道路交通的数据开放出来,这样的话,很快一些个企业就开发了航班延误的查询系统和公共交通最优路线的查询,类似我们现在大家也常用的导航,所以这个也是解决老百姓出行中间很方便的问题。我们国家这方面,特别是在民航的这些开放之后,应该说给大家提供了很多的方便。

当然我们说大数据还不止这个,更重要的它可以促进我们经济的发展,催生新的业态,对扶助商业的决策、降低运营成本、精准市场的营销,可以说都能够发挥作用,进一步提升了企业的竞争力。我们研究了解的情况看,当前全球大数据和它的应用发展性能,正在推动新一轮信息技术的到来,特别是新的大数据的应用,进一步改变了我们整个经济社会管理的面貌,在宏观决策方面,还是在微观管理方面都发挥了重要的作用。

今天,大数据已经成为具有商业价值的一种宝贵的资源,所以有人称它为是“新世纪未来的石油”,因为这些大数据资源的利用,对于各行各业都是非常宝贵的,关于医疗健康,下面还要展开给大家说。正是由于信息技术的这种发展,包括特别是以信息资源作为关键资源的这样一个知识经济的出现,应该成为我们国家改革开放30多年来,迅速发展一个很大的动力,所以在我们国家的发展中间,它是功不可没,特别是我们说,以信息资源作为关键资源的知识经济的出现,这个是一个非常大的,所以今后它的发展前景也非常看好。

正是在这样的一个背景下,我们很高兴的看到十二五以来,我们国家在信息化的发展中间取得了很大的成就,呈现了六大亮点。

第一个是信息基础设施取得了长足的进步。大家都知道,我们现在的宽带中国战略,我们的村村通,包括广播电视的村村通,发挥了很重要的作用,这些信息化的基础设施,为我们信息化建设的发展提供了重要的支撑和保障。

第二,这些年来,我们电子信息产业规模越来越大,他对我们国民经济的带动作用、支撑作用、保障作用进一步增强。在近几年来,我们的经济进入新常态,总体的发展速度有所趋缓的这样一个背景下,电子信息产业一直保持了10%以上的年增长速度,成为我们国民经济各个领域中间的佼佼者。其中两化融合进一步推动了我们传统产业与信息化的融合发展,应该说成为我们当前工业时代、工业化进行进一步创新、进行转型升级的一个重要的支撑保障。

尤其让我们感到非常振奋的是,这些年来电子商务异军突起,这个大家都知道,我们现在的互联网企业中间有几个做电商,特别做涉及到我们民生的这种面向消费者的,我们常说的B2C的这种网络零售发展非常迅速,规模每年都翻好几番,这个我们现在不管是阿里的淘宝,还是京东,还是一号店、苏宁都有了很大的发展,同时,电子商务还不仅仅是面向网络零售,在我们的企业之间,我们常说的B2B,我们常说的垂直电商,还有跨境电商都有了很大的进步。

另外在民生服务领域,信息化的水平也有了很大的提高,比如说我们社保卡的发放力和使用,已经在中国覆盖了7亿多人,这个给我们现在看病难,应该说解决了不少问题。另外电子政务的应用也走向了融合,这几年来,我们一些重大电子政务工程都取得了很显着的成绩,包括比如说金关工程、金税工程、金盾工程,都取得了非常显着的成绩。所以我们可以看到,新一代的信息技术,正像我们说的像润物细无声,它悄然的改变了我们的生活方式、工作方式和思维方式,也加快了人才的培养,改变了我们中国社会发展的这种新的模式。就现在大家购物,我们上这种大的网站,而且它还带动了一个很大的就业队伍,你看这快递小哥,各个快递公司,这个发展也非常的迅速。的服务也进一步通过互联网开展互联网+政务服务,通过网上的一站式的服务大厅,可以说给大家解决了很多的问题。包括比如说我们现在出行,大家买火车票,很多人都通过12306这个网站,解决了很多的问题。特别是4G移动互联网在中国的推广应用,应该说为我们互联网的发展作出了重要的贡献。

我们明显的看到,我们的互联网的用户数在剧烈的增长,到去年年底,我们的网民的人数已经超过了7亿,现在新增的网民中间,大多数是通过移动互联网来上网。

在这样的一个背景下,智能终端发挥了更好的作用,每一个智能终端都是一个服务的入口,而且都是和每一个人密切相关,我们国家现在手机的拥有量超过了13亿,有相当多的人有两部手机,所以中国的IT产业呈现了更加丰富的内容,也提供了更好的服务。所以我们信息产业呈现了一个高速发展的态势,有利于进一步推动我们经济的转型升级,也恰逢我们现在改革开放深化的这样一个天时,我们也有我们巨大的市场,所以有我们的地利,同时,应该说我们的产业部门也在积极的创新,像我们的华为这些企业,都在世界上成为最著名的IT企业。所以我们说,今后发展我们的电子信息产业,就是要以应用为导向,同时要深入挖掘我们的信息资源,以大数据作为我们业务的发展的引擎,通过云计算的支撑,通过移动互联网的带动,通过把社交网络作为纽带,我们在电子政务和电子商务都会取得很大的进步。所以我们说在今后,到2020年这5年期间,我们的IT市场应该说,会呈现一个持续高速发展的新阶段,其中云计算大数据,他们将发挥最重要的作用。

在看到我们国家和整个世界信息技术发展的新的形式的同时,我们必须看到,我们的信息化发展还存在着一些不容忽视的问题。

信息化发展还不够均衡。这个大家都知道,我们东、中、西部沿海发达地区和内地欠发达地区,少数民族地区,城市和农村之间都有很大的差距。传统产业跟互联网的全面融合发展明显不足。我们的传统的束缚了信息生产力的发展。数据资源开放共享不够。我们现在很多的数据资源,特别是用公共财政采集的数据资源,往往没有得到充分利用,就睡大觉。而大家知道,数据资源有一个很大的特点,它还是需要及时的利用,一旦过时之后,当然有的还是有价值,但它的价值就会发生重大的变化,而且也不利于解决我们当前各个领域所面对的紧迫的必须解决的棘手的问题。当前网络和信息安全的形势依然严峻,我们怎么样来处理好数据共享的安全问题,怎么样来解决数据资源的保护问题,仍然是我们必须面对的一些尖锐的课题。

二、大数据与云计算相向而行、发展迅速

(一)大数据的产生与发展

第二点我想还是跟各位领导和同志们介绍一下大数据的基本概念,以及大数据和云计算相向而行、共同发展一个重大的机遇,这里头还会提到我们医疗健康大数据的定位和主要内容。

大家知道,我们当今信息化特别是在我国,经历了从上个世纪90年代到现在,我们21世纪已经进入了第二个10年。这20年在历史上时间很短,但是在我们国家信息化发展历程中间,是一个非常不平凡的20年,应该说起了非常大的变化,发生了非常令人鼓舞的振奋。

我们从过去的单机应用到联网应用,到现在的大数据时代,表明了我们当今的信息化建设已经进入了一个叫做广泛感知、深度分析和智慧决策新时期。这就是基于当今我们万物互联,前面我们说了,我们有人和人相连的互联网,有物物相连的物联网,而且有人物一起相连的这种泛在的泛联网,这个给我们带来了非常大的发展机遇,所以网络化的数据也进入了指数膨胀的阶段,发展的非常快。

我们今天来到的是一个大数据的时代,就是我们现在对数据的认识,对跟它相关的信息技术的认识,有了更加清晰、准确、合理的认识。简单的说是什么呢?就是大家逐步的认识到真正的信息系统,或者我们说的计算机系统里头最宝贵的不是你购买那些硬件的设备,比如说服务器、计算机,也不是这个网络,最重要的是我们计算机里头采集的、处理的、存储的这些数据资源,以及通过网络进行传输的这些资源和它的传输能力、处理能力,这才是最重要的。这就是我们为什么说我们来到大数据时代的主要的理由。

我们现在来到了大数据时代,就是因为我们从信息的被动的接收者,变成了主动的创造者,大家可以回忆,我们每天每个人都发多少短信,发多少微信,发多少邮件,这些个都是我们是作为当今这个网络时代大数据的信息创造者之一,这是一个人人都在创造信息、创造数据的时代,所以这个大家可以看到,就是我们现在常说,我们的手机每天离我们的距离不超过30公分,也不在你兜里,就在你的桌子上、床边,或者你手上拿着,所以这个信息量是非常巨大的。

大数据时代,数据量呈着爆炸式增长。从2006年,我们个人所用的数据已经平均到达了叫TB时代,那时候全球才产生180个EB的数据,一个EB是2乘的60次方。人们预测到2020年,整个世界的数据量将达到35. 2个ZB,而一个ZB等于10亿个TB,就可以想象这个数据量之大。

我们回顾大数据这个名词是怎么来的呢?其实它是来源于最早在20世纪90年代的时候,作为数据仓库之父的一个著名的科学家叫比尔•恩门,提到叫大数据,但真正的把大数据这个名字提出来,是在2011年的云计算与大数据的这个EMC的一个年会上,提出了叫大数据。

大数据这个定义是什么呢?它就是指的是需要新处理模式,才能具有更强的决策力、洞察发现力和流程优化能力的海量高增长率和多样化的信息资产。这句话什么意思呢?大家一看就知道,就是主语是大数据,最后大数据是信息资产,所以它这个资产就重要,有价值。它这个有三个特征,量大、高增长率和多样化,所以我们说大数据现在有人说3个V,有的说4个V,也可以说5个V。

总的来说是一个多V,但是一般常说的,现在是按照4个V数,就是它量大,第二是变化快,第三个就是多样化,另外一个常说的,具有价值,但现在也有的把它提出,叫做真实性。这就是我们对大数据的定义和特征的一个基本的理解。

在这里头,大家可以看到,它就是一个数量很大的数据集合。我们之所以称它叫于大数据,一个就是数据量大,第二是变化快,第三是构成复杂,第四是蕴含着大的价值。就是我们常说,大数据里头有大的智慧、大的价值和大的发展,为什么呢?就是因为大数据不仅仅是一个数据的这种堆积,更重要的它是一种思维方式和管理治理路径的变化,所以我们高度重视大数据,更加强调的是后者,就是怎么样用好大数据。所以我们看大数据和传统的小数据是可以比较的,就是由于你现在有了互联网出现了更多的数据创造者,也有了更多的消费者,由于你现在互联网实现了高速、宽带、移动,所以更多的影像这种多媒体的数据,你可以通过手机,通过移动互联网进行传播。第三个就是社交网络可以促进它的发展。第四个就是我们看到怎么样来保障我们数据的安全、数据的真实、数据的不被篡改,不被非法的人获取,是一个大的问题。

所以我们看到大数据,指的就是规模巨大、复杂,用现有的数据处理工具,难以获取整理、管理以及处理的数据。所以我们再展开说一下,大数据有4个V,第一个是量大;第二是类型复杂,既有结构化的,也有半结构化,还有非结构化;第三,沙里淘金,价值密度低;第四,实时获取,需要变化的快,因为它变化快,就需要实时获取。这里我特别强调一下,大数据有大,但不仅仅是大,更重要的是它的复杂性、全面性。大数据里的一条微博,有的时候就透露出具有性的信息,所以这个价值可不能忽略。

比如大家都知道,前几年微博上发了这个郭美美炫富,一下子影响到红十字会的声誉。她自称是什么红会的干部,当然她不是,但是这给红会造成的恶劣的影响,至今还没有完全消除。所以大数据的四大,除了我们讲的4个V之外,它还有一个特点,就是处理是复杂的,因为大数据的采集、存储、分析,是一个很复杂的一个过程,是一个很周密的环节。所以这一点包括我们说在医疗健康领域里头,它就会向医疗健康服务这个链条里头,每一个环节来采集和获取数据。当今我们对大数据高度的重视,其中医疗健康领域就是当今搞大数据的企业和各行各业从事大数据最关注的一个领域,就是医疗健康行业。

大数据很大的一个特点是由于我们不同看数据的方式和规模是不一样的。经过大致的统计,在所有的数据中间,结构化的也就是说各位领导经常能够看到表格化的,能够画成表格来管理这种二维表的数据,大部分是结构化的,大概仅仅占到目前我们数据的15%左右。而非结构化的,不能够排成这种二维表的,比如说我们影像的数据,视频的数据,地图的这类数据,占到整个数据的85%,所以我们目前没有大数据给各级领导看到的一些个辅助决策的数据,往往是不够完整。由于大数据,你在不同看数据的方式和规模不一样,有的时候我们看到的一些数据很难加以扩充,很难加以利用。一旦处理起来时间过长,或者成本也过高,特别是对这种非结构化的数据怎么样来做处理,这是很难的事情。正是在这样的背景下,我们仍然要跟大家说,大数据实际是什么。

大家注意,大数据就是信息资源和数据资源,从资源的角度来看,大数据和信息资源之间没有不同的含义。所以大数据是我们当今重要的生产力要素,它是除了劳动土地和资本之外,以及劳动者的智能之外最重要的一个生产要素。大家一定要注意,大数据不等于传统的数据库建设,也不等于传统我们搞的抽样调查,或者传统的普查,大数据也不等于说是我们搞数据中心建设就是大数据。大数据需要云计算,但大数据不等云计算建设。

大数据和传统数据库存在着重大的和原则的差别。当然我们说,大数据是在传统的数据库和数据仓库数据挖掘的基础上发展起来的,但是他们两者有很大的不同。传统的数据库保存的都是结构化和半结构化的数据,就是能够用表格实现,以两为表,或者是标准的XLM 文件。这些由于它结构简单,处理就相对简单,大数据面向的是一切可以用计算机来存储的数据,那当然就复杂,包括我们说网页、图片、音频、视频,各种的文档,包括我们搜索引擎上你输入那些关键词,你社交网里的留言,你体现你的爱好,包括我们现在用物联网的各种传感器,收集起来的监控的结果。比如说视频监控,视频监控的图像,这些个都不是结构化的,处理起来难度还是很大。

第二个就是对噪声是怎么处理,所谓噪声就是在过去数据结合里头异常的数据,不正常的。过去传统的数据库怎么处理?就是把这些异常数据剔除掉,删除掉,不要它。但是大数据之所以大,它讲的是全,它是允许你在这数据里头有正常的数据,也有非正常的数据,这个保留下来有什么好处呢?就是在进一步的研究中间,能够找到这种异常数据和正常数据之间的关联关系,看它有没有关联关系,有没有隐藏的关联关系,来加强你对系统的保护。(二)大数据如何工作

大数据是怎么样工作的呢?这个环节很多。一个是我们大家都在制造数据。大家知道,我们每个人都发微信、发微博,甚至于你每天的一举一动都是数据,你带上计步器,戴上手环,你每天走多少步,这个也是数据,也是留下来。所以我们每个人每天都在制造数据,每个单位也不例外,这就是我们说大数据之所以巨大的由来。而正因为这样,所以你遍布世界的传感器,大家对数据的搜集都是很热情的,但是归集起来,整理到哪里,这个是有争议的。

我们现在国家银监会和人民银行前不久发表的文件,就要求在中国服务的外国的银行,包括这些外国的数据处理机构,他对中国客户的数据,原则上应该在本地,就是在国内存储,不能够放到国外去,但是这个具体实施和检查还有难度,但这必须指明了这个方向。大数据大了就会有价值,所以它潜力很大。因为少量的数据,你看不出它之间的关联关系,当数据大了之后,找到的全体数据时候就可以从中根据蛛丝马迹,找出他们之间的规律。

以大数据的利用过程最后就是它的利用过程。一般来说,这个过程要经过四个主要的环节,第一个是数据采集;第二个是导入和预处理;第三个是进行统计和分析;第四,再进行深度的挖掘。大家注意,统计分析都是有预定的格式和目标,而挖掘是没有的,挖掘是没有预先设置了什么主题,简单的说,就像我们发现文物一样,比如知道这地方可能是一个某代皇帝一个墓,那这做的相当于是数据的统计分析,你是这样的分析,但是如果说你不知道具体这个皇上埋哪儿,但知道他埋在这片土地上了,你就到处挖,这就是我们去挖掘,然后你找出它的关系,这个是一个很重要的。所以我们说大数据这三大块还是很好协调,数据的采集,数据的预处理,到数据的处理、数据的挖掘,以及今后进一步深度的挖掘。

举个例子,比如说1.85米,这是个数字或者是个数据,比如奥巴马身高1.85米,这个就进了一步,这是一条信息,就告诉你奥巴马的身高,但是如果你通过查了很多资料,做了很多统计,你得出来说,黑人的男性身高一般都超过1.85米,那这就是一个大数据分析的结论,或者成为一个知识,所以数据加上具体的背景成了信息,信息经过提炼之后,成为了知识,这是我们信息价值提炼的过程。

二、大数据与云计算相向而行、发展迅速

(三)大数据时代及其特点

我们说现在我们进入大数据时代,为什么叫大数据时代?大家知道,是因为人类前进的脚步有了重大的变化,我们已经从农业社会进入到工业社会,又从工业社会进入到了信息社会,当今我们面临着一个生活、工作和思维方式的巨大变革的时期,就是我们说的大数据的时代。

为什么叫大数据时代呢?也是因为我们人类对信息的利用和认识的手段,经过了5次巨大的变革。比如开始最早的时候,我们的猿人,我们的先祖直立起来,能够进行语言的交换,这是第一轮。之后,在公元3500年有了文字。之后,大家知道是我们国家的骄傲,到了15世纪,我们毕升发明了活字印刷。到了19世纪开始有了电子,比如说电话、广播。到了上世纪有了电视。但是现在大家知道,从20世纪末开始到本世纪,人们更加青睐的互联网。互联网最大的问题就给我们带来了方便。大家过去查个东西很麻烦,以前我们大家知道,比如说过去国家图书馆,你去查资料挺麻烦,你要查一个国外的一个数据库的东西,是报刊的东西,也非常麻烦,还要花很多钱,现在很方便。所以这是我们看到时代的变化,在这样一个时代点上,它推动了我们认知的格局,就是你认识世界、了解世界,你实际是变化,所以这一点是非常重要的。

就是我们开通了新的望远镜,开通萨德,这个坦率说,对我们威胁还是非常大,所以这也就是我们为什么现在更加重视这种数据的分析,比如说韩国部署了萨德,最大的一个问题就是它能够监测我们各种的这种卫星、导弹,我们的部署和活动的信息,所以这是为什么我们坚持反对,这一点是我们一个很大的一个,可以说是必须引起高度警惕的一件事情。所以大数据的利用成了新时代的一个显微镜,一个望远镜。

我们说为什么叫大数据时代?我们要理解大数据,就是因为当今我们有三大定律还在发挥重要作用。第一个就是大家熟知的摩尔定律,英国人摩尔提出说,同一个面积的集成电路上可容纳的晶体管的数,每18个月翻一番,同时性能提高一倍。这个就说明什么呢?我们现在对数据的存储和管理,它的效率越来越高,而且越来越方便了,因为能力提高了,价钱还越来越便宜。

第二个定律就是我们常说叫吉尔德定律,吉尔德定律就是指的在当前,我们凡是一个成功的商业运作,总是把价格最低的资源尽可能消费掉,来保留价格最贵的资源。我们举个例子,比如现在大家上网老是找wifi,因为wifi免费不花钱,你自己流量就可以省一些,而现在的这个发展的趋势,将来就是都可以免费上网,而且速度会越来越高。

第三个定律叫麦特卡尔夫定律,这个老麦是以太网的发明人,也就是我们过去常说的一种网络连接方式,特别是局域网,它的核心的思想就是物以多为贵,就是网络的价值与用户数的平方成正比,也就是你上网的人越多,创造的价值越大。所以这个是为什么当今互联网时代,大家都在争夺用户、争夺入口的一个重要的原因。基于这三大定律我们可以看到,在新的时期,数据成为重要的战略资源,在这样一个背景下面,我们可以看到,就是大数据它的应用呈现了很好的前景,所以这一点是我们必须看到,比如航空公司利用数据搞清楚,怎么样来确定我的航班,怎么样来给航班进行定价,银行利用这个大数据决定把贷款贷给谁,贷给谁,谁最有效益,而且还没有风险。

前面讲了,大数据是不讲为什么,它不讲究数据之间为什么有勾连,它只讲这个关联性,各位领导可能都知道,一个非常熟悉的一个例子,叫做“啤酒尿布效应”,这是在美国的沃尔玛超市里头,超市的经理发现了,就是到了周末的时候,这个尿布的销售量有提高,啤酒销售量也提高,后来这个经理就真正到现场去研究、调研。大家知道,美国人他都是周末的时候,到超市去买一大堆东西回来。然后他就注意到了,一些男性的顾客他要给小孩买纸尿布的时候,他想想给自己还是买点东西,就买啤酒。所以超市老板发现这个之后,本来这两个东西毫不相关,但是通过这个调研之后,它相关了之后,他就在商店里头,把这个啤酒和尿布靠的很近,方便大家买。第二,把那个最不好卖的,价格最贵的啤酒跟尿布放得最近,这样照顾一些人,反正我拿着方便,我也不管什么,这提高了它上涨的效应。

所以大数据的价值重在于挖掘,而挖掘就是分析,我们不仅仅是为了数据而数据,而分析就是找出它们的关联程度,找出它们的交点,找出它们的规律,来提高我们的洞察力。所以我们说大数据它了很多传统,比如说过去,我们在各种研究里经常讲抽样调查,现在当然也不能完全代替,但是这个抽样就有问题,你抽的是不是合理?是不是有代表性?你比如说现在经常老百姓吐槽我们现在一些价格的调整,说搞了听证会,说听证会上选的代表,一致都同意涨价,网民都吐槽,说你们这一点代表都没有。所以实际上说,就过去搞抽样调查,也有这个问题,因为你那样本,选择的合理、规范,是不是标准?是不是具有代表性?但现在大数据我不搞抽象调查,我是搞全体的,样本是全部,我这样得出来的结论可能就比抽样要准确得多。

这样一个情况下我们说大数据时代它的核心做的是洞察,洞察有以下几个特色。一个我们可以洞察工作的重点,这点国内外都一样,因为美国也是,它城市里头也有发生丢井盖,或者井盖破损,结果怎么解决这问题呢?美国人也是,也是用了物联网技术,他把井盖都贴上RFID标签,将来一旦没有了,出事了,他自动就警报。

另外可以洞察未来的趋势,这个也是一个很经典的例子,2008年,谷歌就利用网上搜集,搜索到个人,所以它的用户搜索的数据都跟某些看排名,说一发现这段时间大家都在搜流感有关的一些词,可能发生流感,后来就准确预报出来。我们国内其实也有这个例子,2013年,百度的数据分析师就查到网民在国庆节前集中去查询九寨沟的信息,到九寨怎么走?住在哪?怎么玩?当时百度的数据分析师就给有关部门,包括四川省旅游局九寨沟送了这个报告,说今年十一可能游客有爆发性的增长,你们要特别小心。但是很遗憾,这个报告有关部门没重视,结果就造成了什么呢?那个到九寨沟的游客太多,大家知道,进沟是要用他们当地专用的车,车不够,上不去车,结果游客就发生了一些不愉快的事情,什么砸售票处、砸车,这个国际影响很不好。

大数据的洞察还体现在它可以洞察出管理的规律,就像前面我们说的像首尔公共车的部

分,还可以洞察出我们生产调度管理的这种其他的缺陷。另外大数据可以用来洞察我们有生产管理的调度。这一点这个华为也是用这个解决了问题。大家知道,华为这个手机出来之后,大家很受欢迎,但是有一段时间这个手机脱销,它其中的问题,大家知道,华为的手机它这个供应链上,也是有一些关键的器件,靠其他的企业来提供,但是当一些企业跟不上它这个调度的时候就会掉链。所以后来华为就利用大数据,包括我们国家信息中心的那个大数据研究的团队,和他们合作,对每一个供应链上的ERP系统的数据进行获取,然后进行分析,每一个环节,每一个零件企业的ERP的数据把它会在一起,然后就可以看到,比如哪个企业它这个环节供不上东西,然后就及时的来提醒他加快进度也好,或者加快进料也好,就使得这个供应链就好了。大数据作为洞察,还可以洞察客户的需求。比如现在电子商务,你要经常在淘宝上买东西,他可以给你画像,因为你老买东西,他知道你身高多少,穿多大的衣服,几码的鞋,你喜欢什么颜色的?另外还可以洞察你的员工的表现,可以洞察你客户的诚信,你可以洞察合适的人选等等。

所以大数据成为当今新的一个数据采集的手段,比如说可以用于在打击犯罪里头分析一些犯罪嫌疑人的行为,进行预测,可以作为预防犯罪一个很重要的。你看我们现在的视频的监控信息,包括一些犯罪嫌疑人指纹的信息,掌纹的信息,甚至人脸图像的信息,都成为我们打击犯罪的重要手段。

(四)大数据的建立

要做好一个大数据,要设计一个大型的系统。首先我们说这个系统应该能够存储数据,能够处理数据,能够开发出相应的应用,然后可以把这些应用放到一个合适的平台上,比如说像现在大家更喜欢把很多应用放在手机上。这个大家随时都可以用,比如现在大家老用的像这种高德地图、百度地图,这种交通流量也是用的大数据。

这里不能不跟大家提到,就是目前大多数系统里头都用了一个比较成熟的技术,叫hadoop,这个词大家知道一下就可以,它是目前一个开源架构的简称,这个基本上是由谷歌开发出来。然后把它作为一个现代支撑大数据应用的一个公共平台。

我们当今要建设一个大数据的系统,就要搭平台、采数据、建模型,然后再编写应用,最后是以图呈现的方式,是一种最好的模式。我们看到,现在比如说华能一些企业都给领导开发了这种大数据的这种领导的决策系统。像华能做的这个东西,它可以每个领导早晨一上班,就可以看到,在这个pad上或者手机智能终端上推送,他们企业昨天一天经营所有的数据,比如发了多少度电,每个电厂发了多少度电,每个电厂发这些电输出了多少,成本是多少,其中包括这个成本是用了哪个煤矿的煤,煤价是多少,运费是多少?而且每天都给你分析它的效益有提升,还是有下降,所以这些是非常重要的。所以我们要建好数据采集了模型。

另外更重要的是,数据在应用的时候要建立好数据分析的模型,一般来说,现在有四大的模型,就是分类的模型、聚类的模型、预测的模型和关联的模型。建这些模型需要有很多基础必须要有的知识,同时要采用一些经典算法,我这里不展开给大家介绍。通过建好模型做好分析,提供我们这种决策树,来为各级领导做决策提供这种辅助的支持。

最后我们刚才说的这个环节,一图胜千言,大家比较习惯还是愿意看这种图。这个图能够很生动的说明很多的问题。在大数据应用中间,在我们医疗健康领域有很多的应用,最早的就是在2009年,甲型的H1N1流感在全球爆发,大家知道,各国都付出了很大的努力,来防止这个疫情的蔓延和解决好患者就医这些问题。在当时采集这些数据也不容易,往往滞后。谷歌公司就利用人们搜索的,就前面我们说的,根据搜索词汇里头跟流感相关的这种词汇和搜索者的这个位置,建立了一个合理的模型,然后得到了一个预测的结果。比如哪些地方可能是流感的高发区,哪些可能已经好起来了,他得到的这个模型所测算出数据与官方最后的数据相关性非常接近,达到了97%,他能够立刻判断出流感是从哪传播的,传播到哪,而且非常的及时,这是他处理了当时5000万条历史记录,做了4.5亿个不同的数学模型得出来的,其实是不容易的,但是确实发挥了作用。前面我给各位领导主要介绍一般的大数据。

三、医疗健康大数据

下面我重点介绍一下这个医疗健康领域大数据。首先我们说医疗健康领域的大数据有哪些来源?大家知道,第一个就是制药企业,研究这个药理的这些都离不开大数据。第二个就是医院里,比如说临床的各种数据,临床诊断的数据,包括各种的影像数据,这个大家都知道,我们到医院检查,做透视、做照相、做CT、做核磁共振、做超声,这些都是这数据。第三个就是你看病不是免费的,你花钱,你这个花钱的数据、报销的数据,你社保资金的利用率,社保基金是否安全,有没有骗保骗医的欺诈数据,这个也是当今很重要一个犯罪情况。第四个就是患者的一些数据。这里指的患者并不是它指的患者的健康数据,是患者的一些行为,包括患者在社交网络上一些数据,这是什么呢?就是现在大家知道有“医闹”到医院,甚至于打大夫这一类数据。

如何利用大数据呢?一个是你怎么样来治疗,就是提供个性化的服务。还有就是临床决策的支持,大夫看病,特别是我们现在都是要依靠这种临床的诊断的那些数据,化验单,你的透视,你的CT,这些东西。第三个,比如说你怎么样来防范社保资金的安全,防止被骗了。第四个就是说用户的行为分析,既有他的那个疾病,说他由于饮食习惯,或者他基本问题,另外有些比如可能精神不够健全这些问题。

我们可以看医疗健康数据目前的基本情况大概是这样,主要是四类,第一个是你个人的健康管理的数据。咱们大家都体检,体检的数据就是包括你在医院里头病例的数据,现在也逐步要建立个人健康档案。还有就是公共卫生的数据,还有就是我们诊疗的医院的数据,就是医院的电子病历,你的体检健康档案,公共卫生的数据等等,所以医院的这个数据,医疗健康是我们典型的大数据。

医疗大数据的潜在的价值非常大,包括对临床的应用,临床的决策支持,还有对公共卫生的统计,远程的诊断,包括做人口的统计,就诊行为的统计,药物的分析,药品的研发,当然还有新农合,这新农合里头怎么样保障基金的安全,因为现在国家已经明确规定是农民用新农合,城镇是用社保,另外就是怎么来改善我们的医疗服务。

从国外我们可以看到,医疗健康大数据的应用在很多的方面,第一个就是在药物的研究;第二,就是我们的诊断,门诊的诊断;第三个就是我们病人的这种行为和它相关的人;第四个也仍然是我们怎么样来管理医疗社保的这个基金钱,怎么样来更经济、更有效的来使用这个社保基金,这个不仅我们中国有问题,就是美国其他欧盟都有这个问题。所以比如说大数据可以用于疫情的分析,对流感的这些传染病;用于对于医疗质量的管理,比如说你这个医院里头有没有认真的给你做诊断,有没有认真的进行交、术后护理等这些东西。另外就是说,我们可以看对医疗质量进行自动反馈的结果等等,对重症患者信息的收集和管理。所以医疗健康大数据它其实是涉及到健康信息的服务,新兴的医疗服务,比如说个体化的医疗。

比如说现在的肿瘤基因组学的研究和它的诊治,另外就是对我们数据的这种处理,特别是这种视觉化处理,在医学领域是一个特定。大家知道,这个影像是完全电子化,现在我们不仅有透视,有照相,现在更有核磁共振、CT、超声波,这个医疗影像数据的准确分析,既有大夫的经验,也有你这个数据采集的准确和它这种对数据的分析,当然还有我们一般的医疗记录,比如说我们其他的像这种管理。

我举一个例子,现在我们大家在城市里看病,目前碰到一个最大的问题上,就你在某医院做的这种影像的检查,另外一个医院不认,你还得重做,还得重花钱,花钱有一部分可能是自己的,还有一部分是国家的钱,那怎么样做好这个东西呢?实际这是一个大问题。要做好这个问题,就是要推动我们这种医疗影像数据信息的共享和做好它的认真分析。

去年我们在推进全国信息惠民试点城市中间,我们很高兴的看到,有一些城市已经做了,浙江省、福建省一些城市,就是它规定了患者在同城里头一个比如说甲级,二甲或者三甲以上医院做的这种医学影像检查,在一年之内,到另外医院去看病的时候,不能再重复做,你必须把那个医院的信息调过来,你大夫可以看。如果你有理由说,比如他照得不清楚,或者哪个地方需要再特殊的处理,你可以没有理由说不能做,所以这就是我们在当今医疗大数据里重要。所以总的来说,我们觉得大数据医疗的这个领域应用是一个非常有前景,首先在这个研究中间就是很重要的一个途径。

现在就在这种移动互联网的支撑下,在我们当今大数据的应用下,怎么样做好这种影像的分析,比如中文语意的分析,这个是很重要的,而且也为我们真正推动,比如区域的卫生信息化、基层医疗这种东西,推动大数据在健康档案和数据服务等的应用,是个很重要的路径。

另外就是大数据与智慧医疗。现在我们大家知道,在我们看到的那个医学影像中间,现在有一些已经可以能够用3D的技术,真正形成3D的电子表,就是将来不是一个平面的,大家知道,我们现在做CT要做什么东西,它是一层一层的,现在已经很多的医学影像可以用这种3D的方式来展现,所以这样的话,对诊断治疗都起到了很大的作用,也可以同样的用虚拟现实的方法,使得你看到的某一个器官的东西,是一个非常鲜活的东西,便于医生将来诊断和治疗。

同时用大数据可以指导我们每一个人的生活方式更健康,所以智慧健康。因为大家知道,健康跟我们的生活方式有关系,跟遗传因素关系,跟气候有关系,跟社会的因素,也跟医疗有关系,所以这个全面的因人而异的设定你的健康生活方式,这也很大。

当然在智慧医疗,通过大数据,很重要的一个还是提高我们的医疗质量,做好医疗的监控。比如说对于医疗的行为,这个东西要按照做好时间的这种管理监控,比如对于我们的这种电子病历,这种档案的规定的书写内容也要自行监管,这个结构化的病例有规范的标准,现在国家也开始有了,所以这个也要进行管理,另外就是关键必要的医疗流程,你是不是都走了?有没有缺陷?这个也要通过信息化的手段,通过大数据给予检测,就不会给病人贻误病机。

我们觉得发展医疗健康大数据的应用,目标就是助力健康医疗服务业的快速发展,大家知道,医疗健康服务业、健康中国是我们党的“十三五”规划建议里头明确提出的建设任务,已经写在今年正式通过的“十三五”的规划里头。所以要发展我们的医疗服务业,同时发展智慧养老,比如说,还有我们的这种像健康保险,健康的这种咨询工作,所以这个要通过大数据来推动。

大数据要跟“互联网+”医疗健康紧密地结合起来,国家明确的支持“互联网+”医疗、“互联网+”健康。所以在新的医改背景下面,互联网医疗跟大数据的结合将会取得更重要的发展,就是推动惠及全民的健康信息的服务,然后实现智慧的医疗。发展大数据的应用,有助于促进医改。因为现在大家知道,还在进一步深化医院目前就医的改革。要突破一个很大的,就是要突破数据的瓶颈,实现这种整合的升级,所以这个是我们要更好的积累基础数据,打通各家的数据壁垒。由于历史的原因,我们医院的信息化建设层次不齐,水平不一,因为各个医院的财力不太一样,而且由于历史的原因,各个医院里头这个数据应该说标准是不够统一的,所以按照国家卫计委新颁布的各种标准,要把这个东西进行整合,来进行数据的这种比对和转换,来实现数据的统一。

大数据有大前景,所以大家都在掘金医疗的信息化,所以信息化要把基础信息资源的整合于共享做好,比如说每个人口的信息,像我们新生儿这些信息。这样的话,既要通过主导,又要发挥社会的力量,来共同推进医疗大数据的应用。比如说我们在当今,大家都反映的一个问题,就是挂号难、看病难的问题,当然这几年来,各地通过采用移动互联网,通过网上预约挂号,解决了很大的问题,这就是在就医的流程上进行突破,来促进医疗信息化建设,这个大家注意,这种往往是现在广大老百姓或者患者非常容易出问题,或者满意度非常敏感,他不是说大夫给你看病的这个过程,而是说等着看病太着急,你挂不上号,你在挂号的资源上被有人利用,有号贩子,所以这个怎么解决呢?我觉得很重要的就是将来我们要通过互联网的方式,要开展网上预约挂号,大家把资源都放到网上,大家挂号。这个就像我们在网上买12306的火车票一样,他是这样的,是一种比较公平的,所以要从导诊、分诊,医院流程的自动化。这个现在很多做的好的城市一样,我们也看了,都还是做得很好,所以这样来推动我们医疗的细化,也改善了我们老百姓的这对医疗服务的感觉。

另外,大数据还有一个很重要的应用,就是促进了医药分离改革。正在大力推进医药分离改革,遏制虚高的药价。现在就是要对药的成本加强监管,价格监管部门对药品的利润率要加以控制,因为药不是一般的商品,它是个特殊的,事关每一个人的健康,所以在这方面,企业不能够以各种原因,故意虚抬高价,这是不行的,而这个东西离不开数据的支撑,你要知道这个药是怎么做的,采集了什么原料,什么加工工艺,这些是很复杂的一件事情。

还有一个很重要的,就是以大数据来促进我们健康管理的个性化和多元化。因为大家都知道,因人而异,人都有不同的体质,所以不同的健康状况,我们现在按照社会强调个人的健康管理,这个个人的健康管理就需要你提供给你各种的数据,现在完全有好的条件,比如说我们现在有很多的这种穿戴式设备,有手环,它可以记录你的很多的信息,要根据这些信息和你其他的信息,然后给你制定你个人应该怎么样做好健康的管理,你每天应该跑多少步,吃多少卡路里的热量,你是应该注意休息多少,所以这些个我们也是要用大数据管理,特别是我们要通过大数据来实现医疗健康服务,满足个性化的需求,实现健康管理的垂直化、多元化。比如包括给你提供很多健康的资信,对你实施健康的管理,给你开展体检,给你提供一些必要的保健药品和一些辅助的办法。这个就是综合的来对你个人的健康进行管理,这是现在应该说是今后我们越来越富裕的人,对这个生活质量提高的一个主要的追求。所以用大数据来实现个人全生命周期的健康管理。这个就是等于你从少年、青年到中年、到老年是不一样的。

而且要用大数据来促进医疗健康服务业跨界的融合,因为大家知道,整个的医疗健康服务业是一个非常长的链条,你看有做药的到有看病的,有卖药的,有具体做服务的,包括你健康养老,有做养老的,这些都是我说的,当然我们必须看到大数据事关个人的隐私,企业的商业引领和国家的安全是一个非常重要的。

大家注意,就是我们每个人吃的那个药,小的包装上都有一个药品的代码,这个药品代码是一盒一码,所以它的数据反映了我们国家所有这个药物的流向、生产是一个巨大的资源。前不久,国家食药监局和国家质检总局联合发布声明,大家注意,原来搞这个符码的是他们两家下面一家企业叫21世纪公司,后来这个企业被一家大的互联网企业收购,现在国家有关部门已经决定把这个企业收回来,因为这个药品的信息太重要,所以说我们要更加注重在这种开放的条件下,特别在医疗健康领域里头,我们大数据面临的安全风险、道德风险,包括伦理的风险。

大数据云计算发展相向而行,他们像一个钢镚的两面,为什么呢?没有大数据云计算没有意义,有了大数据没有云计算,也不能够很好的利用,所以这个是一个很大的,大数据是一个宝藏,但是挖掘这个宝藏的力气离不开云计算,所以这是我们当前关于云计算有这样三个特点,他服务可以租用,服务可以计算,有好的、高的性价比。

所以我们说,云计算提供的这些支撑技术,有效的解决了大数据的分析、研发的问题,比如虚拟化技术、并行计算、海量存储和海量管理等等,所以它能够使得我们在做大数据的时候,能够实现高效,能够实现资源更好的利用,能够实现互联互通,能够实现数据的规范,最大的优势有效地解决了资源分布和信息孤岛的问题。现在很多地方都开始建设医疗健康云,我们说这是一个好事,但是也面临这些问题,主要的问题是不能够重复分散建设,不能够忽视数据安全,不能够忽视运维成本的降低问题,要真正实现提高资源的利用率,提高数据标准的统一和真正实现互联互通,这是我们健康医疗云建设必须解决的问题。通过这个发

现健康医疗将来对我们健康医疗领域会有很大的价值。所以我们说,建设这种健康医疗云,一定要加强统筹规划,合理布局企业化建设。以上就是我对这些问题的理解。

四、深化对国家大数据战略的理解

最后我再说一下,我们要学习一些重要讲话,来做好理解国家大数据,把我们医疗健康与大数据做好。

总今年4月19号主持网络安全和信息化工作座谈会发表了重要讲话。要求我们要按照党的十八届五中全会提出的创新、协调、绿色、开放、共享的发展理念,来推动信息化建设,为我们发展新时期指明了方向,总的讲话准确的应对了当今世界四大趋势,经济的全球化、全球城市化、全球的信息化和信息的智慧化。

所以总是立足于我国互联网的迅速发展提出的这个重要讲话,讲到说我们有7亿网民是一个了不起的数字,也是一个了不起的成就。所以总在以来,高度重视网络安全和信息化工作,讲过很多著名的论断,比如说没有网络安全就没有,没有信息化就没有现代化。总和总理都高度重视互联网新时代技术的发展、大数据的应用。所以总这个讲话是对我们十三五所提出的这个既定目标的一个很好的诠释,同时,也对我们的新时期的信息化作出了重要的部署。明确提出,就是我们新时期发展信息化建设,发展事业,必须要让互联网更好的造福人。这是总讲话的最大的亮点。

所以总说,当今事业代表了新的生产力,新的发展方向。互联网是我们经济发展进入新常态的新动力,可以大有作为。

所以总还专门提到,要实施“互联网+”医疗,就是发展事业要让互联网更好的造福人民,让老百姓能够用得上、用得起、用得好的信息服务,同时要深入研究国家治理中信息共享难、资源统筹难的问题。所以总的讲话明确指明,事业和大数据大发展的春天已经到来,明确的发展事业战略的目标,一是要加强领导、统筹规划;二是要靠产学研用紧密协同。总对事业有三个“高”,评价之高、定位之高和希望之高。所以我们要按照总提出的,以创新发展驱动事业的发展,要进一步思想,突破关键技术,按照新的理念推动我国信息化的发展,所以使信息化的落脚点落脚在使人民更多的收益。这一点对医疗健康领域大数据应用更是如此。

信息化是党制定的重大战略,从党的提出的推进两化深度融合到四化同步发展,到党的十八届五中全会明确提出了三大战略,网络强国战略、“互联网”+行动和国家大数据战略。按照这样的一个战略,要分别的完成一系列重要的建设任务。

特别是在国家大数据战略里,第一项任务就是推动大数据资源的共享开放,强化大数据的应用和发展大数据的产业。实施国家大数据是党的重大的决策。

今年,促进大数据发展部级联席会议在4月13号召开了第一次会议。会议听取了几位领导的重要讲话,通过了四个文件,包括《促进大数据发展三年工作方案(2016-2018)》、《促进大数据发展2016年工作要点》、《政务信息资源共享管理暂行办法》和《政务信息资源目录编制指南》。那么按照这个会议的要求,今年将加快三大建设,一个是加快制度体系建设,尽快出台《政务信息资源共享管理暂行办法》;二是加快大数据综合试验区建设;三是加快重大工程的建设。

最后我还想跟各位领导特别强调一下,就当前一个非常重要的,就是我们在医疗健康领域要认真学习刚刚下发的文件,就是《关于促进和规范健康医疗大数据应用发展的指导意见》。这个文件明确指出,健康医疗大数据是国家重要的基础性的战略资源,健康医疗大数据应用的发展,将带来健康医疗模式的深刻变化,有利于激发深化医疗卫生改革,提升健康医疗服务的效率和质量,扩大供给,满足广大人民多层次、多样化的健康需求,也促进经济的发展。所以这个是一个非常重要的文件。

这个文件明确提出了我们今后这段时间,促进和规范健康医疗大数据应用发展的基本原则。就是要坚持以人为本,创新驱动。坚持规范有序,安全可控,这个大家知道,个人的健康数据对个人都是隐私,一个整个国家的我们的健康数据,是国家非常重要的资源,应该说也关乎到国家的安全,比如说我们的基因数据,这是非常重要的。所以这个文件特别强调,不仅是促进,而且是规范应用。第三个原则,就是要坚持开放融合,共建共享。健康医疗大数据的应用,比如对于制药业,它肯定是需要研究的,但是这里涉及到个人的数据一定要进行脱敏,要去掉我们的敏感信息,就是他可以看到每一个人比如患者的,但是他不能够知道这是具体哪个患者,这是非常重要的。

按照这个文件的要求,要实现健康医疗大数据应用,到2017年底,要建设国家和省的人口健康信息平台和全国药品招标采购的应用平台,要基本形成跨部门的健康医疗数据的共享,到2020年,要建成国家医疗卫生信息分级开放应用平台,实现以人口法人等基础数据库的共享,医疗、医药、医保和健康各相关领域数据融合应用取得明显成效,要统筹区域的布局,依托现有资源建成100个区域临床医学数据示范中心,基本实现城乡居民具有规范的电子健康档案和健康卡,同时要适合国情的健康医疗大数据应用发展模式基本建立,所以这是一个很现实,但是很宏伟,同时意义非常巨大的建设目标。

为此,这个文件还部署了以下的四个方面的任务:第一个就是夯实健康医疗大数据的应用基础,推动健康医疗大数据资源的共享开放。

第二项任务,全面推进健康医疗大数据的应用,包括健康医疗行业治理的大数据,健康医疗临床和科研大数据的应用,公共卫生大数据云,健康医疗大数据应用的新的业态。还专门提到,要推广数字化的健康医疗的智能设备。

第三项任务,就是要规范和推动“互联网+”健康医疗服务,要发展智慧健康医疗便民的惠民服务,包括要发挥优质医疗资源的引领作用,开展这种线上线下结合的这种健康医疗应用程序,包括比如说现在网上有很多的这种健康医疗的一些辅助的程序,也要把它规范。特别是要大力推进互联网健康咨询,网上预约分诊、移动支付和检查检验结果查询,随访跟踪等应用,形成互联网上医疗服务的新的模式。第二是建立远程医疗的这种应用体系。

第四个方面的任务,加快健康医疗大数据保障体系的建设,包括加快法规的建设、标准的建设,加快网络可信体系的建设,包括加强健康医疗数据的安全保障。第四个就是加强人才的培训。

所以这些文件是非常重要的一个文件,要做好这个文件,明确提出要三个方面加强保障:

第一个是强化统筹规划。

第二个是抓好重点,着力突破。也是要从人民群众最迫切需要的领域入手,特别是重点推进这种网上挂号、预约分诊、远程医疗和检查检验结果共享、互认等便民惠民应用,加快推进基本医保全国联网和异地就医结算,发展这种医疗智能设备,智能穿戴设备,加强疑难疾病的重点研究等等。

第三就是加强的扶持。

我们今天前面讲了这么多关于医疗健康领域大数据,我觉得最终我们要落实到这个文件里头,按照的要求,在各级我们的卫生行政和人口计划生育主管部门的指导下,通过我们各部门的合作,也通过我们各地的不断的创新,我们按照国家大数据的行动纲要,我们一定能够把我们大数据的应用做得更好,为实现十三五既定的健康中国,为真正的提高我们全民健康作出新的贡献。我预祝我们通过这个健康医疗大数据的应用,使我们全民的健康水平和我们的医疗服务水平得到提高,为我们实现“”十三五”既定的全面实现小康社会做出我们应有的贡献。

文档

大数据在医疗领域的应用

大数据在医疗领域的应用课程前言可能大家注意到,最近正式下发了《关于积极推进和规范医疗健康大数据应用的指导意见》,应该说这是我们当前在大数据应用领域非常重要的文件,我围绕着这个文件的一些个精神跟大家讲一下自己的学习的体会。在正式讲之前,我给各位领导简单的讲一个关于大数据的段子,这个可能大家很多都看过。比如说某一个用户打电话给一个比萨店,说我要订一份比萨,他就问你的用户卡号是多少,他说我是多少,他说我知道了,你是姓什么,叫什么,住在哪里,你电话号码是什么,你的手机是什么。然后说我订一份
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top