作者:***
来源:《科技信息·下旬刊》2017年第06期
摘要:当前云计算、物联网、移动互联网等技术飞速发展,数据的种类和规模以前所未有的速度增长,如何管理和利用大数据成为当前研究的热点。云计算和大数据技术对数据处理及服务方式产生巨大影响。文章阐述了云计算和大数据的内涵特征基础, 结合医疗领域,论述了大数据的研究意义及云计算下大数据处理方式。阐述了云计算下大数据技术不仅改变了传统的数据管理模式,必将带来极大的经济与社会价值。
关键字:云计算;大数据;医疗行业数据;应用研究
Abstract:With the rapid development of cloud computing, Internet of Things and mobile Internet, the variety and size of data have been growing at an unprecedented speed. How to manage and utilize large data has become a hotspot in current research. Cloud computing and large data technology on data processing and service methods have a huge impact. This paper expounds the connotation and characteristics of cloud computing and large data, discusses the significance of large data and the way of large data processing in cloud computing, combined with medical field. It expounded that large data technology under cloud computing not only changed the traditional data management mode, but also brought great economic and social value.
Keywords:Cloud computing; large data; medical industry data; applied research
1.大数据
1.1大数据的概念
大数据,即巨大数据量,不能够通过主流的软件工具,在适当的时间内收集管理处理及组织起来,使之作为企业决策的有用信息。大数据,需要特别的技术,由大规模并行处理(MPP)数据库、数据挖掘网格、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统组成。“大数据”,需要更多的决策权及洞察发现力及过程地大规模优化能力,应对新模式高增长率及信息资产多样化。大数据技术的战略意义并不是一个巨大的数据信息的掌握,而是因为这些包含了专门的数据进行处理。大数据的特点可以概括为 4 个“V”(大量 Volume,多样 Va-riety,价值 Value,高速 Velocity)。首先,庞大的数据量。大数据
的初始测量单元至少为 P(1000 个 T),E(100 万个 T)或 Z(10亿个 T);二、数据类型丰富。例如,网络日志,视频,图片,位置信息等。第三,低密度,高商业价值。第四、快速处理速度。这最后一点是传统的数据挖掘技术本质上是不同的。大数据技术,是一种先进的数据分析技术,能够从各类数据快速获取有价值地信息,它需要新地加工方式,实现更大决策力地海量高增长率及多样化的信息。
1.2大数据的意义
面对大数据直接从所有的数据分析,挖掘所需信息。分析数据挖掘是混合的有不同来源数据结构,要求其对样品的精度高并且关注数据相关性地研究。大数据为云计算及计算能力提供了解决空间,对于大数据存储挖掘及云计算业务,大数据需要高效节能的海量云服务器,并从海量数据提取有价值地信息,能够对金融零售娱乐及媒体领域带来性的变化。云计算是基础信息存储,为数据共享和挖掘方法提供有用的工具,通过数据的分析和预测使决策更加准确。中国拥有庞大地高度复杂性充满变化的用户群体,将成为世界数据量最大的国家。探索基于大数据的解决方案能够解决海量数据带来的问题,并使国内产业升级和提高效率。
2.大数据环境下医疗行业
2.1大数据环境下医疗行业新机遇
大数据给医疗行业带来的健康意识和社会效益要超越其获取与管理的成本。如全面数据用于分析病人信息,能更好的提高医疗诊断的准确性和精确性,甚至预测疾病发展,及早提出有针对性的应对措施。因此,大数据时代的思维和态度必然给医疗行业带来新的创意。下文从大数据时代的数据特征:全面、即时、社会化三个方面探讨大数据给医疗行业带来的机遇。1. 数据全面,有利于提高医疗决策的可靠性。信息的全面性是影响决策可靠性的主要因素。医疗决策用于分析的数据越全面,其决策分析的结果越接近真实。传统的医疗决策由于信息的不完整主要依靠自身判断作决策,存在着直觉判断、依靠经验办事等弊端。
在大数据时代,医疗信息孤岛将逐步消失,同时,社交网络的普及也将增进信息的知识共享和信息的交互,医疗决策支持系统将可以获取多样性、高速性和和规模性的数据,可立足于更大、更完整的数据集,通过全面的数据分析,为医疗决策者提供全局性的决策支持。同时,伴随着数据挖掘、数据可视化、数据处理和人工智能等“大数据”处理技术的进步,医疗决策者也可以从中挖掘更多支持决策的有价值的信息。因此,基于大数据全面数据的驱动,将使医疗决策更加精确、更加科学,极大提高医疗决策的可靠性。2. 数据传播即时,有利于加强医疗应急管理。随着互联网的重心向着移动互联转移,目前移动医疗正逐步成为医疗行业的规划重点。根据 CNNIC 第 34 次调查数据显示我国手机网 民 数 量 为 5.27 亿 人,占 总 体 网 民 比 例 高 达83.4%,手机网民的数量第一次超过了 PC 网民。目前互联网上相当大一部分的数据来自平板电脑、智能手机等泛互联网设备,如能利用好大数据环境中的传播即时的数据,医疗应急管理的反应能力及实时效果将会得到极大的提高。如 Google 利用传播即时的大数据和疾控中心一样判断疾病来源,预测的相关性高达 97%,并且判断相当及时,而不像疾控中心需要在疾病爆发一两周后才可发现。因此美国在 2009 年甲型 HINI 流感爆发时,Google 成为了一个更为及时和有效的指示标。3. 数据社会化,有利于改善医患关系。长期以来,患者和医生的矛盾主要源于患者和医生之间存在着信息的不对称,甚至由于信息孤岛的存在医疗工作者在大部分时候无法真正了解患者病情。数据的社会化趋势使每个人在互联网进入到大数据时代,都将是透明性存在着。这将逐步消除患者与医疗机构间的信息不对称,同时由于信息孤岛的消失将极大改善和提高医疗诊断的准确性和速度。而这些都将有效的改善患者健康状态、提高患者的健康理念和知识,有利于改善和缓解医患关系
2.2大数据环境下医疗行业面临的挑战
大数据时代的理念和技术给医疗行业既带来了机遇也带来了挑战。1. 处理医疗大数据的技术困境。医疗大数据的处理首先面临技术上的困境。医疗数据体量大,如一个社区医院累积的结构化和非结构化数据就可以达到数个 TB 甚至PB 级别;其次是我国医疗机构信息系统建设 缺少统一的规划和标准,形成众多的“信息孤岛”,甚至在单体机构部门之间都存在信息割裂。因此医疗数据的数量大、非结构化、种类多及资源的不够开放将对医疗行业的数据挖掘和信息共享造成一定的困境。有估计称企业相关数据有 80%都是基于文本的非结构化数据(Grimes,2008),医疗数据的大部分也是基于文本的非结构化数据。大数据已成为关键因素,传统处理数据的分析技术已无法满足大数据处理,尤其是在机器学习和处理海量信息集。因此,构建良性发展的共享数据系统的大数据处理技术将成为医疗机构面临的一大难题2. 大数据时代医疗的决策分析问题。决策分析已经逐步从数据驱动代替传统的经验直觉决策。对于医疗行业来说,大数据的有效利用与否已经成为提高医疗服务质量、增强核心竞争力的关键策略。然而问题是医院数据的一大部分是基于文本的非结构化数据,而且非结构化数据的增长率远远大于结构化数据;因此,基于结构化数据的传统数据挖掘策略对于大量非结构化的医疗数据已显无力。数据挖掘的传统策略不仅对医疗决策的时效性造成影响,同时在处理结构化过程中丢失了半结构数据与非结构化数据的隐含关系,进而增加了医疗决策的不确定性和不准确性。而这些隐含关系实际上有可能是非常重要的信息,比如找出一些潜在疾病的相关关系。因此,如何有效地将数据存储、处理和保护成本降至最低,通过大数据挖掘把医疗大数据转换为支持临床决策需要的信息,从而达到高效的医疗数据社会效益与经济效益并行,又是医疗行业面临大数据时代的一大难题。3. 大数据时代医疗隐私的安全问题。目前,医疗机构在隐私保护和安全风险应对方面准备明显不足,在一些医疗机构内部缺乏高层管理人员对患者信息的控制,而过时的隐私意识和数据策略、程序有法不依和人员培训不足等现象也十分突出。大数据时代无疑会提高医疗过程数据的透明度,医疗行业正在过渡并开始大规模广泛应用电子健康记录,而临床数据库、家庭监控和远程医疗都有很大的概率发生数据泄露、数据欺诈、身份盗窃而造成医疗欺诈和纠纷案件,从而抬高医疗总费用并产生重大负面影响。同时,由于社交媒介如 Twitter、移动 APP 端等在医疗组织、医师和患者间的广泛应用,一旦利用不当将造成患者隐私安全泄露的风险。如何在大数据时代的数据收集上获得巨大进步的同时确保病人敏感信息和隐私安全再一次引起了人们对于隐私问题的担忧,这一问题至关重要,它很有可能使“大数据”无法实现重大突破。因此,防止泄露敏感病人的数据、提高数据安全保护、维护医疗机构的品牌价值,通过技术和法律等正当手段积极维护患者信息的安全,将是医疗行业面临大数据时代的又一难题4. 医疗行业大数据人才落地问题。人才是企业发展的核心竞争力,医疗行业也不例外。医疗机构面对如此数据量巨大、非结构性强、数据来源庞杂的数据需要存储、处理和分析,更需要有别于传统数据分析的新人才进行管理和分析处理。然而目前,大数据人才缺口巨大,供不应求。根据麦肯锡全球研究院(MGI)2012 年的预测,未来 6 年,仅美国本土就可能面临 14 万~19 万的大数据能力人才的缺口。因此,如何找到应对大数据挑战和机遇所需要的人才,培养和造就一支懂管理、懂指挥、懂技术的大数据专业队伍又是医疗机构面临的一大难题。
3. 大数据视角下医疗行业发展新思维
1. 建立面向大数据的创新思维。尽管有人认为大数据其实仅仅是“信息爆炸”所带来的一种现象,是一些数据商家用来吸引眼球的一个噱头。但现实的实例也告诉我们大数据正在创造价值,新的创新模式和新的价值随着大数据的驱动不断产生。根据 MGI 研究预测,通过有效利用急速增长的大数据,美国医疗行业如果能够以此提高服务质量和经济效率,则可能创造每年超过三千亿美元的超额价值。“数据权”正成为各国、各领域争夺的新资源;大数据的不断渗透对经济发展模式、公共服务模式甚至国家战略规划等提出了新的要求。同时,大数据又是一种资源和工具,我们必须以认可其巨大力量的同时看到其局限的辩证观点来接纳大数据时代的新思维。因此,医疗机构应该正视大数据带来的机遇与挑战,转变思路,积极有效地将数据转换为可用的资源,从而改善医疗服务的质量、提高医疗服务的效率、提升竞争力,从最根本上实现医疗数据的最佳经济效益和社会效益。
2. 搭建智慧医疗数据共享综合平台。数据只有充分流动和共享才是有生命力的数据。而多种数据源的整合能力及新型数据源的分析能力成为搭建综合共享平台的关键能力。综合利用多种数据的全资源分析(All-sourceAnalysis)正是从问题出发,系统化地整合所有相关信息资源来支持医疗决策与研究,利用不同数据资源来评估、揭示、解释事物的发展,最终发现新知识。同时,大数据时代随着网络应用的深入,不断涌现出各种不同的新型媒体形式,而且可以预见随着经济社会的发展和科学技术的不断进步,新型资源将不断涌现,应注重新型数据源的分析,持续加入数据共享平台,不断促进医疗决策与研究的发展。
3. 加强完善医疗信息安全制度建设。完善医疗安全不仅是技术问题,更是管理问题,应该从管理角度和技术上杜绝医疗核心数据和隐私被泄露的漏洞。下文主要从管理角度探讨安全隐私问题,核心是患者隐私(Privacy)保护和信息安全(Security)规划。①法律制度的强制。完善医疗相关的安全条例以保护信息系统的保密性、一致性和可用性:包括管理上的防护,建立和落实安全的管理策略,物理设施上的保护等。建立完善隐私条例涉及个人健康信息的内容可被组织机构所使用的信息标准,并规定个人可以了解和控制他们的信息是如何被使用和披露的 ②规章制度约束。对信息系统和机房设备日常维护工作的建立。包括监控网络(内部信息平台)运行安全、信息的变更管理规定、容灾数据备份方案及各种应急方案等。③人员的遵守。对相关从业人员进行持续的安全防范意识和规范操作的培训;对内部从业人员进行安全评估和认证,并加以强化合法和非法披露意识的培训;最后核心人员应该签订相关保密协议,并完善相关的激励机制制度,防止涉密人员和高级管理人员离职后泄密。
总结
大数据技术在医疗领域的大规模应用尚不完全成熟,但随着高速网络、云计算中心等基础设施建设日趋完善和大数据技术的发展,医学领域发展的趋势,将是推动大数据技术的个性化、创新化,便利化医疗。云计算、移动互联网和物联网技术的快速发展,全球范围内数据增长规模越来越大,大数据将被应用到各行各业,不仅改变了传统的数据管理模式,带来了新的思维、业务转型和管理创新,提高企业和公共部门的生产力和竞争力,也会带来巨大的经济和社会价值。大数据已成为新发明和新服务的来源,是社会新的财富。
参考文献:
[1]李伟.高职院校工学结合实践教学的几点思考[J].教育与职业,2014
(2):155-156
[2]唐建国.招生模式“多元化”背景下的高职院校计算机基础课程分层教学法的研究[J].福建电脑,2013(7):56-58
[3]李丽萍,李凤华.《大学计算机基础》课程分层教学的探索与实践[J],2009(6):137-138
[4]向伟.大学计算机基础分层教学模式的实践研究[J].四川文理学院学报,2010(3):119-120