
作者简介:张建勋(19782),男,河北保定人,讲师,博士,主要研究方向为分布式计算、云计算等(exp lore_zj x@163.co m );古志民(192),男,山西人,教授,博导,主要研究方向为计算机系统结构、分布式计算等;郑超(19792),男,河南安阳人,讲师,硕士,主要研究方向为网络安全.
云计算研究进展综述
张建勋1,2
,古志民1
,郑 超
2
(1.北京理工大学计算机科学技术学院,北京100081;2.天津中医药大学教育技术与信息中心,天津300193)摘 要:对现有的云计算系统进行分析和总结,以期为下一步的研究指明方向。采用文献分析方法简述了云计算的定义、特点和基本结构,介绍了实现云计算的各项相关技术的研究现状,包括虚拟化技术、W eb 服务技术、编
程模型,对已有的几个较有代表性的云计算系统进行了介绍并指出了当前云计算系统亟待解决的问题与下一步的研究方向,可为云计算相关研究提供参考。
关键词:云计算;虚拟化;并行编程模型;W e b 服务与S OA
中图分类号:TP316 文献标志码:A 文章编号:100123695(2010)022*******do:i 10.3969/.j i ssn .100123695.2010.02.007
Survey of research progress on cl oud co mputi ng
Z HANG Jian 2xun 1,2,GU Zhi 2m i n 1,Z H E NG Chao 2
(1.Sc hool of Co m pu ter Scie n ceT ec hnolo gy,Beijing In s tit u t e of Technology,Beiji ng 100081,Ch i na;2.E duc a tion T ec hnology&Infor m a ti on Cen t er ,T ian ji n Universit y o f Trad itional Ch i n es eM e d icine ,T ian ji n 300193,Ch i na )
Ab stract :The goal of this paper i s to gi ve a brief anal ysi s and su mmary of current cl oud co mputi ng syste m i n order to facili 2tate f uture research .This paper ado p ted the literature analysismet hod .F i rs,t presented t he defi n iti on ,character and syste m architect ure of the cl oud co mpu ting .Then ,revie wed the relevant techniques for bu ildi ng the cloud co mputing ,i ncl ud i ng virtu 2ali zati on technolo gy ,W eb service technolo gy and progra mm i ng mode.l F i nall y ,i ntro duced several recentl y pro posed clo ud co mpu ti ng system .It .s an m i portant target t o m i ple men t the i nter 2operation ,QoS ,and availability and securit y of clo ud co m 2pu ting syste m.Researchers of related to p ic can gai n useful i nfor mati on abo ut the cl oud co mputi ng .K ey words :cl oud co mputi ng ;virtualizati on ;parall el pro gra mm i ng mo de;l W eb servi ce and SOA
0 引言
随着互联网时代信息与数据的快速增长,科学、工程和商业计算领域需要处理大规模、海量的数据,对计算能力的需求远远超出自身IT 架构的计算能力,这时就需要不断加大系统硬件投入来实现系统的可扩展性。另外,由于传统并行编程模型应用的局限性,客观上要求一种容易学习、使用、部署的新的并行编程框架。在这种情况下,为了节省成本和实现系统的可扩放性,云计算
[1]
的概念被提了出来。云计算是分布式计算、
并行处理和网格计算的进一步发展,它是基于互联网的计算,能够向各种互联网应用提供硬件服务、基础架构服务、平台服务、软件服务、存储服务的系统。通常云系统由第三方拥有的机制提供服务,用户只关心云所提供的服务。
云计算的思想可以追溯到20世纪60年代,John M cCa r 2t hy [2]曾经提到/计算迟早有一天会变成一种公用基础设施0,这就意味着计算能力可以作为一种商品进行流通,就像煤气、水电一样,取用方便、费用低廉。云计算最大的不同在于它是通过互联网进行传输的。从最根本的意义来说,云计算就是数据存储在云端,应用和服务存储在云端,充分利用数据中心强大的计算能力,实现用户业务系统的自适应性。2007年10月IB M 和Google 宣布在云计算领域的合作后[3],云计算吸引了众多人的关注,并迅速成为产业界和学术界研究的热点。
1 云计算系统简介
111 云计算的定义
目前关于云计算系统没有统一的定义,云计算供应商根据自己企业业务推出相关的云计算战略。H ew i tt [4]认为云计算系统主要是将信息永久地存储在云中的服务器上,在使用信息时只是在客户端进行缓存。客户端可以是桌面机、笔记本、手持设备等。W ang Li 2zhe 等人[5]从云计算系统应该具有的功能角度给出了科学云计算系统的定义,指出计算云系统不仅能够向用户提供硬件服务H aaS(ha rd ware as a service)、软件服务SaaS(soft w are as a servi ce)、数据资源服务DaaS(data as a ser 2vice),而且还能够向用户提供能够配置的平台服务PaaS (plat 2for m as a servi ce)。因此用户可以按需向计算平台提交自己的硬件配置、软件安装、数据访问需求。Buyya 等人[6]从面向市场的角度认为云计算是由一组内部互连的虚拟机组成的并行和分布式计算系统,系统能够根据服务提供商和客户之间协商好的服务等级协议动态提供计算资源。UC Berke ley [7]的观点认为:云是指数据中心的硬件和系统软件,云分为公共云(对公众开放)和私有云(业务组织自己使用)。在公共云的基础上,云计算系统是指终端用户应用软件通过Interne t 以服务的形式由SaaS 提供商交付,云提供商向SaaS 提供商提供数据中
第27卷第2期2010年2月 计算机应用研究Application R esearc h ofCo mputers V o.l 27N o .2
Feb .2010
心的硬件和软件服务。
本文认为云计算系统是以付费使用的形式向用户提供各种服务的分布式计算系统,系统对用户来讲是透明的,其本质是对虚拟化的计算和存储资源池进行动态部署、动态分配/重分配、实时监控的系统,从而向用户提供满足QoS 要求的计算服务、数据存储服务以及平台服务。112 云计算系统的特征
a)支持虚拟化,云计算系统可以看做是一个虚拟资源池。通过在一个服务器上部署多个虚拟机和应用,从而提高资源的利用率;当一个服务器过载时支持负载的迁移。
b)提供服务质量保证(Qo S )。云计算系统能够向用户提供满足QoS 要求的服务,能够根据用户的需求对系统作出调整,如用户需要的硬件配置、网络带宽、存储容量等。
c)高可靠性、可用性和可扩放性。云计算系统必须保证向用户提供可靠的服务,保证用户能够随时随地地访问所需要的服务,并且用户的系统规模变化时,云计算系统能够根据用户的需求自由伸缩。
d)自治性。云计算系统是一个自治系统,系统的管理对用户来讲是透明的,不同的管理任务是自动完成的,系统的硬件、软件、存储能够自动进行配置,从而实现对用户按需提供。113 云计算系统的体系结构
通过对现有的云计算系统进行深入剖析,云计算系统内部可以看做是一组服务的集合。图1为云计算系统
的体系结构。
a)基础设施层。主要包括计算资源和存储资源,整个基础设施也可以作为一种服务向用户提供,即IaaS(i nfrastructure as a se rvice)。IaaS 向用户提供的不仅包括虚拟化的计算资源、存储,同时还要保证用户访问时的网络带宽等。
b)平台层。在基础设施之上的平台层可以认为是整个云计算系统的核心层,主要包括并行程序设计和开发环境、结构化海量数据的分布式存储管理系统、海量数据分布式文件系统以及实现云计算的其他系统管理工具,如云计算的系统中资源的部署、分配、监控管理、安全管理、分布式并发控制等。平台层主要为应用程序开发者设计,开发者不用担心应用运行时所需要的资源,平台层提供应用程序运行及维护所需要的一切平台资源。平台即服务称之为P aaS 。
c)应用层。它是面向用户提供简单的软件应用服务以及用户交互接口等,这一层称为软件即服务,即SaaS 。
2 云计算实现的相关技术及系统分类
211 虚拟化技术
云计算实现的关键技术是虚拟化技术
[8]
。通过虚拟化技术,单个服务器可以支持多个虚拟机运行多个操作系统和应用,从而大大提高服务器的利用率,通过虚拟化为应用提供了灵活可变、可扩展的平台服务。虚拟机技术的核心是H y pervi 2sor(虚拟机监控程序),H ypervisor 在虚拟机和底层硬件之间建立一个抽象层,它可以拦截操作系统对硬件的调用,为驻留在其上的操作系统提供虚拟的CPU 和内存。目前V Mware ESX [9]和C itri x XenSe rver [10]能直接运行在硬件上,虚拟的操作系统又运行在H ypervisor 之上,从而能够按照用户需求提供I T 基础设施。
随着虚拟化技术的应用,对虚拟资源的管理是研究的热点之一。文献[11]提出一种方法将V M 提供模型集成到现有的资源管理框架中,采用两级调度的方法将对V M 的管理集成到批调度器中,向用户提供最大努力的调度服务,但目前不支持虚拟资源的预定服务。
传统的调度器对短期租赁请求调度时,要完成严格的预定资源服务租赁是很困难的。文献[12]提出使用虚拟机的无缝挂起和恢复计算的能力来解决这个问题。对于可用性要求不太严格的批量计算任务,调度器先挂起当前计算任务,然后去完成具有严格可用性要求的作业,如预定资源的作业。
当前的云计算系统如Scientific C l oud [13]、Am azo n EC2[14]
等一般是以虚拟机的形式来满足用户的计算资源需求,但用户需要根据自己的要求将这些虚拟机手动配置成一个工作集群。针对这种情况,文献[15]通过对虚拟集群所需上下文环境的详细分析,如虚拟机的IP 地址、安全信息等,提出了一种在多个虚拟机之间自动、快速部署上下文环境的机制(one 2cli ck vir 2tua l clusters)。另外,虚拟专用网络VPN [16]的发展为用户在访问计算云的资源时提供了一个可以定制的网络环境。目前对于虚拟资源管理的研究,在满足用户对虚拟资源的Qo S 需求及服务等级协议(servi ce level agree m ent ,SL A)方面还有待进一步研究。
212 W eb 服务与SOA
云服务一般是以W eb 服务的形式来实现的。在云中服务的组织和协同可以在面向服务的架构中进行管理。在SOA 架
构下的云服务可以部署在各种分布式平台上,也可以通过网络访问各种服务。近年来S OA 得到了相当广泛的关注,但它并不是一个新概念。早期一些基于网络的S OA 的例子有RPC 、DC O M 和ORBs(object request bro kers)等,近期的网格计算就是基于SOA 的架构和解决方案。
在一个SOA 环境中,终端用户请求一个I T 服务(或一组服务的集合),并希望这些服务满足一定的Qo S 要求,用户请求可以得到即时服务,或在一个特定的延迟后满足。可以预期在未来十年,基于服务的解决方案将是向个人和机构递交信息和其他IT 相关功能的主要手段。例如软件应用、基于W eb 的服务、个人和商业的桌面机计算等。213 并行编程模型
随着W eb 2.0的出现,互联网上的信息呈指数级增长,如搜索引擎、在线事务处理等应用系统处理数据的规模越来越大。云计算系统必须给用户提供一个简单易用的编程模型来并行处理用户的数据,从而更好地利用云计算系统的资源。因此研究者提出了一些分布式系统和并行编程模型来支持大规
模数据处理。
#
430#计算机应用研究 第27卷
Zaharia等人[18]针对M ap R educe模型调度建立在系统同构的假设上对M apR educe模型的调度进行了改进,设计了一种新的调度算法L ATE(l ongest appro xi m ate ti m e t o end),使M ap2 R educe能够在异构环境中高效运行。Li u H uan等人[19]提出了另外一个并行编程模型Gr i dBatch。G ri dBa tch也是一个隐藏并行程序复杂性的并行编程模型,主要用来解决在计算云中大规模数据密集型应用的并行化问题。文献的整个工作与Googl e 的M apR educe模型相似,但是Gr i dBatch主要针对分析型应用,对M apR educe模型作了优化,允许用户控制数据的划分,减少了系统的通信开销。Christopher M oretti等人[20]针对数据密集型云计算应用系统,提出为用户提供一个抽象接口来定义任务的计算和存储需求,并以科学领域中的all2pa i rs问题为例实现了这个抽象接口。
Gu Yun2hong等人[21]提出了不同于M ap R educe的另一种云编程模型sector and sphere。系统主要分为sec t or存储云和sphere计算云。与现有的数据云不同的是,sector存储云不仅支持数据在数据中心内存储,还支持数据跨广域网络存储。Sector存储数据时并不把数据分成块(b l ock)存储在各个节点,而是根据用户要求将大的数据集分成若干文件存储在各个节点上。Sphere是建立在sec t or和一组编程接口之上的计算服务,sphere没有使用M apR educe作为计算模型,而是使用在GPU和多核处理器中常见的流数据处理模型(strea m proces2 si ng paradi g m)。
综上所述,并行编程模型的发展对云计算系统的推广实现具有极大的推动作用,现有的云编程模型均是以M apR educe 编程模型为主,编程模型的适用性方面还存在一定局限性,还需要进一步的研究和完善。
214系统分类
云计算系统可以根据它提供服务的层次进行分类,主要有提供平台服务的系统(P aaS)、提供软件服务的系统(SaaS)和提供基础设施服务(IaaS)的系统。表1对几个代表性的云计算项目进行了比较。
表1几个代表性云平台比较
cl oud syst e m f ocus servi ce t ype S L A&Q o S W e b AP I pro gra mmi ng l anguage
Amaz on EC2Iaa S co mpute st orage none yes Custo m iz abl e G oogle App PaaS W e b appli catio n none yes Python
A pa c he H adoop PaaS W e b appli catio n none yes Java,C++ M i crosoft A z ure PaaS W eb&no n W eb app none yes V isual St ud i o Sc i enti fi c Cl oud Iaa S c o mput e none yes Custo m iz abl e Ope nN e bul a Iaa S c o mput e none yes Custo m iz abl e Euca l ypt us Iaa S c o mput e none yes Custo m iz abl e 3代表性的云计算系统
云计算一经提出便受到了产业界和学术界的广泛关注,目前国外已经有多个云计算的科学研究项目,最有名是Sc ientific C l oud[22]和OpenNebula[23]项目。产业界也在投入巨资部署各自的云计算系统,目前主要的参与者有Goo gle、IB M、M i crosoft、Am azo n等。国内关于云计算的研究刚刚起步,并于2007年启动了国家/9730重点科研项目/计算机系统虚拟化基础理论与方法研究0,取得了阶段性成果。下面讨论几个最具代表性的研究计划。
1)Ama zo n EC2
Am azon EC2[14](elastic co mputi ng c l oud),称为Am azon弹性计算云,是美国Aam zo n.co m公司推出的一项提供弹性计算能力的W eb服务。Am azon EC2向用户提供一个运行在Xen 虚拟化平台上的基于L i nux的虚拟机,从而用户可以在此之上运行基于L i nux的应用程序。使用Am azo n EC2之前,用户首先需要创建一个包含用户应用程序、运行库、数据以及相关配置信息的虚拟运行环境映像,称为A M I(Am azon m ach i ne i m2 age)或者使用A m azon通用的A M I映像。Am azo n同时还提供另外一项W eb服务)))简单存储服务S3(si m ple storage ser2 vice),用来向用户提供快速、安全、可靠的存储服务。用户需要将创建好的A M I映像上传到Am azon提供的简单存储服务S3,然后可以通过Am azon提供的各种W eb服务接口来启动、停止和监控A M I实例的运行。用户只需为自己实际使用的计算能力、存储空间和网络带宽付费。
Ga rfi nkel[24]对A m azon提供的W eb服务进行了评测。评测结果指出,Am azon的W eb服务能达到很好的可用性,但目前Am azon提供的W eb服务缺乏与用户之间的S LA,并且用户关键业务的持续性和数据备份要求是由用户自己来考虑的,如运行关键业务在多个A M I实例上等。
2)Googl e App Eng i ne
Google App Engi ne[25]是Goo gle公司推出的云计算服务,允许用户使用Pyt ho n编程语言编写W eb应用程序在Google 的基础架构上运行。另外,Google App Engine还提供了一组应用程序接口(AP I),主要包括da tastore API、i m ages AP I、m ail AP I、m e m cache API、URL fetch AP I和user AP I。用户可以在应用程序中使用这些接口来访问Goo gle提供的空间、数据库存储、e2ma il和m emcache等服务,用户可以通过Google App En2 gi ne提供的管理控制台管理用户W eb应用程序。
简言之,Goo gle App Engi ne是一个由Python应用服务器群、B ig Tab l e[26]结构化数据分布存储系统及GFS数据储存服务组成的平台,它能为开发者提供一体化的、主机服务器及可自动升级的在线应用服务。Google App Engi ne专为开发者设计,开发者可以将自己编写的在线应用运行于Google的资源上。开发者不用担心应用运行时所需要的资源,Googl e提供应用运行及维护所需要的一切平台资源。这与Am azon提供的类似服务(S3、EC2及Si m pleDB)不同,Am azo n上直接提供一系列资源供用户选择使用。目前,Google APP Engine平台向用户免费提供500MB的存储空间,大约每月500万次页面访问。当前Google只提供了Python一种编程语言的支持,其声称将来会支持多种编程语言。
3)Apache H adoop
#
431
#
第2期张建勋,等:云计算研究进展综述
H adoop [27]最早是作为一个开源搜索引擎项目Nutch [28]的基础平台而开发的,之后H adoo p 从Nutch 项目中出来单独开发,成为开源云计算平台的代表。H ado op 主要实现了GFS 的思想和M apR educe 模型,它作为一个开源的软件平台使得编写和运行处理海量数据的应用程序更加容易。H adoop 主要包括三个部分H adoop 分布式文件系统(HDF S)、M apR educe 实现及HBase(Go ogle B i gtab le 的实现)。HDFS 在存储数据时,将文件按照一定的数据块大小进行切分,各个块在集群中的节点中分布,为了保证可靠性,HDF S 会根据配置为数据块创建多个副本,并放置在集群的计算节点中。M apR educe 将应用分成许多小任务块去执行,每个小任务就对计算节点本地存储的数据块进行处理。目前,H adoop 已经在Yahoo !等公司的集群上成功部署并运行一些商业应用[29]。
4)M icrosoft A z ure
A z ure [30]是微软公司推出的依托于微软数据中心云服务平台,它实际是由一个公共平台上的多种不同服务组成的,主要包括微软的云服务操作系统以及一组为开发人员提供的接口服务。A z ure 平台提供的服务主要有Live Services 、.NET 服务、S QL 服务、SharePoi nt 服务以及动态CRM 服务。开发人员可以用这些服务作为基本组件来构建自己的云应用程序,能够很容易地通过微软的数据中心创建、托管、管理、扩展自己的W eb 和非W eb 应用。同时Azure 平台支持多个In ternet 协议,主要包括HTTP 、REST 、SO AP 和X ML ,从而为用户提供一个开放、标准以及能够互操作的环境。
A z ure 的不同之处在于:Azure 平台除能够提供其自主的A z ure 托管服务外,它也是为运行于本地工作站和企业服务器而设计的。这使得测试应用变得方便,支持企业应用既能运行于公司的内部网也能运行于外部环境。
5)Scien tific C lo ud :N i m bus [12,
22]
Sc i entifi c C loud 是由美国芝加哥大学和佛罗里达大学发起的研究项目,目的是向科研机构提供类似Am azon EC2类型的云服务。该平台通过使用N i m bus 工具对外提供短期的资源租赁服务。N i m bus 工具包原先称为虚拟工作空间服务(virt ua l workspace servi ce),是一组用来提供IaaS 云计算方案的开源工具包,实际上是一个基于G l obus Tool k it 4的虚拟机集群管理系统。N i m bus 工具包主要由以下几部分组成,如图2[22]
所示。
a)W orkspace 服务允许远端用户部署和灵活地管理虚拟机V M,主要由一个W eb 服务前端和基于V M 的资源管理器组成。目前W eb 服务前端支持两种接口:基于网格的W S R F (W eb se rvice reso urce framework)和基于A m azon EC2的W SDL (W eb se rvice descr i pti on language)。
b)W orkspace 资源管理器主要用来完成V M 的部署。c)W orkspace p ilot 程序扩展了本地资源管理器(L RM )的功能,使得本地配置不用作大的更改就能够部署VM 。当本地节点不分配workspace 服务时,节点用于运行正常系统用户的
作业。
d)W orkspace 控制工具主要用来完成启动、停止、暂停V M,实现V M 的重构和管理,连接V M 到网络等功能。
e)IaaS 网关主要用于实现用户持本地PK I 证书访问其他IaaS 基础设施的服务。
f)Co n text broker 主要用来完成用户提交的虚拟机集群的快速部署功能。
使用N i m bus 工具包,用户可以浏览云系统里的V M 映像、提交用户定制的V M 映像、部署虚拟机、查询虚拟机的状态等功能。
6)Open N ebu la
OpenNebula [23]是一个开源的虚拟架构引擎,最初由马德里大学的分布式系统结构研究组开发,后经欧盟发起的R ese r 2voir [31]项目开发人员增强和完善了Open Nebu l a 的功能。Open 2Nebu l a 主要用来在物理资源池上部署、监控和管理虚拟机V M 的运行,其内部结构主要分为三层。其中,内核层是最关键的部分,主要用来完成虚拟机V M 的部署、监控和迁移等功能,同时也提供了一组对物理主机的管理和监控接口;工具层主要是利用内核层提供的接口开发各种管理工具;驱动层使Open 2Nebu l a 内核能够在不同的虚拟化环境上运行,Open N ebu la 并不与具体的环境绑定,驱动层屏蔽掉了不同的虚拟环境和存储,向内核层提供了一个统一的功能接口。
7)Euca l yptus
Euca l yptus [32,33](e l asti c utility co m puti ng arch itecture f or li nk i ng yo ur progra m s to use f u l syste m s)是由美国加利福尼亚大学开发的一个开源的软件基础架构,用于在cluster 上实施云计算,旨在为学术研究团体提供一个云计算系统的实验和研究平台。该平台能够提供计算和存储架构的IaaS 服务,它在接口级与A m azon EC2兼容,可以使用A m azon EC2的Co mm and 2li ne tools 与Euca l yptus 交互。目前只支持L i nux 系统,需要安装Xen 虚拟化平台。
Euca l yptus 的结构采用层次化设计,主要包括CM (clo ud m anager)、G M (gro up m anager)和I M (i nstance m anager)三部分。I M 主要用来控制V M 的执行、停止和状态检查,I M 运行在每个节点,主要用来托管V M 实例;G M 主要用来调度V M 实例在特定I M 上运行,控制实例之间虚拟网络的连接,收集关于I M 的信息;C M 分为三层,主要提供接口服务、数据服务和资源服务。接口服务是整个云系统用户和管理员的访问入口点,并完成用户授权认证、协议转换等功能。数据服务用于存储用户和系统的数据,资源服务主要用于完成资源分配和监控。
4 云计算亟待解决的问题
实现云计算系统面临着诸多挑战,现有的云计算系统的部
署相对分散,各自内部能够实现V M 的自动分配、管理和容错等,但云计算系统之间的交互还没有统一的标准。关于云计算系统的标准化工作还需要更进一步的研究,还有一系列亟待解决的问题。
首先云计算系统中,用户数据存储在云端,如何保证用户的数据不被非法访问和泄露是系统必须要解决的两个重要问题,即数据的安全和隐私问题。同时云计算系统本身的可扩展性、可用性、可靠性、可管理性等都是要重点解决的问题。在服务的层次上,云计算系统必须要解决服务的描述及转换问题,
#432#计算机应用研究
第27卷
在云计算系统的管理方面,云系统之间的互操作是必须要考虑的一个问题。当一个云系统需要使用另外一个云系统的计算资源时,要能够提供跨云的管理策略,从而使得云系统之间能够自动交互。同时为了保证SL A,系统必须能够进行SL A 的监测,当有服务失败时,自动地进行资源的重新分配。在基础设施层次上,云计算系统要能够进行服务的动态迁移,目前的虚拟机只支持共享存储的迁移[9,10],如何将虚拟机迁移到没有共享存储的其他物理主机上也是云计算系统面临的挑战之一。
5结束语
云计算系统已经成为下一代I T的发展趋势,但是关于云系统的安全性、自治性、服务QoS、服务描述发现、云间交互等方面的研究仍显不足,仍需要进一步深入研究。本文介绍了云计算系统的基本概念,并分析了实现云计算系统的相关技术的研究现状,介绍了几个有代表性的云计算系统,展望了进一步的研究方向。
参考文献:
[1]W i k i pedia.Cloud co m pu ti ng[EB/OL].(2007203203)[20082122
20].h ttp://en.w i k i ped i a.org/w i k i/Cl oud_co m puti ng.
[2]W i k i ped i a.J ohn M c Cart hy(co m puter scienti st)[EB/OL].(20082
10207)[2008212210].http://en.w i k i pedia.org/wi k i/John_M cCar2 t hy_(co m puter_scienti st).
[3]IB M.Googl e and I B M announ ced un i versit y i niti ati ve to add ress i nternet2
scale co mputi ng challenges[EB/OL].(2007210208)[2008210215].h t2 t p://w ww203.i bm.co m/press/us/e n/p ressrel ease/22414.wss.
[4]H E W I TT C.ORGs for s cal ab le,robust privacy2fri end l y client cloud
co m pu ti ng[J].I EEE In t e rne t Com p u ti ng,2008,12(5):96299.
[5]WANG Li2z h e,TAO Jie,KUNZE M.Sci en tifi c cl oud co m pu ti ng:
earl y defi n iti on and experience[C]//Proc of t he10t h I EEE Interna2 tional Con f eren ce on H i gh Perf or m ance Co m pu ti ng and Co mmun ica2 tions.2008:8252830.
[6]B UYYA R,YEO C S,VENUGOP AL S.M arket2ori en ted cl oud co m2
pu ti ng:v i s i on,hype,and realit y for deliveri ng I T serv i ces as compu2 ti ng u tilities[C]//Proc of t he10t h IEEE Internati on alConference on
H i gh Perfor m an ce Co mpu ti ng and Com m unicati ons.2008:5213.
[7]AR MB RUS T M,FOX A,GR I FFIT H R,et al.Above the cl ouds:a
Berkel ey vi e w of cloud co m pu ti ng[R/OL].(2009202210)[20092052 15].htt p://ww w.gri d.pku.edu.cn/cloud/Berkeley2abovethecl oud s.
pd.f
[8]J ONE SM T.Cl oud co m pu ti ng w i th L i nux cl oud co mpu ti ng p l atfor m s
and app licati ons[EB/OL].(2008209210)[2008210215].http:// www.i bm.co m/devel oper works/li b rary/l2cloud2co m puti ng/.
[9]V Mware v i rt u aliz ati on technology[EB/OL].[2008212215].http://
www.v mware.com.
[10]B ARHA M P,DRAGOV I C B,FR ASER K,et a l.Xen and t h e art of
v i rt u ali zation[C]//Proc of the19th AC M Sy m pos i um on Operati ng Syste m s Pri n ciples.Ne w York:AC M Press,2003:12177.
[11]FREE MAN T,KEAHEY K.Fl y i ng lo w:s i m ple leases w i th workspace
p ilot[C]//Proc of the14th Inter n ati on alConference on Parall elP ro2 cess i ng.2008:4992509.
[12]S OTOMAYOR B,KEAHEY K,FOS TER L,eta l.En ab li ng cost2ef2
fective resou rce leas es w it h virt ualm ach i nes[C]//Proc of IEEE In2 ternati onal Sympos i u m on H i gh Perf or m ance D istri bu t ed Co m pu ting.
2007.
[13]N i m bu s Project.Science cl oud s[EB/OL].[2008212210].htt p://
workspace.globus.org/cl ouds/.
[14]Am az on elasti c co m pu t e cl oud(Am az on EC2)[EB/OL].[20082
12221].http://a w s.amazon.com/ec2.
[15]KEAHEY K,FREEMAN T.Con text uali zation:p roviding one2click
v i rt u al cl u sters[C]//Proc of t he4th I EEE International Conference on e2Sci en ce.2008:3012308.
[16]GLEES ON B,L I N A,HE I NANEN J,et al.RFC27,A fra m e work
for I P bas ed virtual p ri vate n et wor k s[S].Internet Engi n eeri ng Task Force,2000.
[17]DEAN J,GHEMAWA S.M apReduce:si m p lified data p rocess i ng on
large cl usters[J].Comm u n i ca ti o ns o f t he ACM,2008,51(1):
1072113.
[18]Z AHARI A M,KON W I NS KI A,J OS EP H A D.et al.I m provi ng Map2
Reduce perf or m ance i n heterogeneou s env i ronm ents[C]//Proc of the 8t h US ENIX Sy m posi um on Op erati ng Sys t e m s Des i gn and I m p l e m en2 tati on.2008:29242.
[19]LI U H uan,ORB AN D.Gri dBatch:cl oud co mpu ti ng for l arge2scale
data2i n t en sive batch app licati on[C]//Proc of t h e8t h I EEE Interna2 tional Sympos i u m on Cl u ster Co m puti ng and the G ri d.2008:2952 305.
[20]MORETTI C,B ULOS AN J,T HA I N D,et a l.A ll2pairs:an abstrac2
tion f or data2i n t en si ve cl oud co m puti ng[C]//Proc of I EEE Interna2 tional Sy m pos i um on Parall el and D i s tri buted Proces s i ng.2008:
1211.
[21]GU Yun2hong,GROSS MAN R L.Sect or and sph ere:t h e d es i gn and
i m p l e m en tati on of a h i gh p erf or m ance data cl oud[C]//Proc ofWork2
s hop on Cl oud Co m puti ng and Its App lications.2008:242922445. [22]KEAHEY K,FI GUE IREDO R,F ORTES J,et al.Sci en ce cl ouds:
earl y experi en ces i n cl oud co m puti ng f or sci en tifi c app licati ons[C]// Proc ofW orkshop on Cloud Compu ti ng and its App lications.2008. [23]OpenNebu la proj ect[EB/OL].[2008212231].h tt p://www.open2
nebu la.org/doku.php.
[24]GARFI NKEL S L.An eval uati on of Am azon.s gri d co mpu ti ng serv2
ices:EC2,S3and S QS,TR208207[R].Ca m bri dge:H arvard Un i2 versity,2007.
[25]Google App Engi n e[EB/OL].[2008212215].h ttp://appengine.
googl e.co m.
[26]C HANG F,DEAN J,GHEMA WAT S,et a l.Bi gtab l e:a d i s tri buted
storage s yste m f or structured dat a[C]//Proc of t he7th USEN I X Sy m2 posiu m on Operati ng Syste m s D es i gn and I mp le m entation.2006:2052 218.
[27]H adoop[EB/OL].[2008212216].http://hadoop.ap ache.org/
core/.
[28]Nutch[EB/OL].[2008212216].http://l ucene.apache.org/nutch/.
[29]Scali ng H adoop to4000nod es at Y ahoo![EB/OL].[20082122
15].h ttp://devel oper.yahoo.net/b logs/hadoop/2008/09/scali ng_ hadoop_to_4000_n odes_a.ht m.l
[30]M icrosoft A z u re[EB/OL].[2008212226].http://www.m i cros oft.
co m/az u re/.
[31]Reservoir project[EB/OL].[2008212220].htt p://www.reservo i r2
fp7.eu/ho m e/.
[32]Eu cal yp t u s p roject[EB/OL].[2008212226].h tt p://eucalyp t us.
cs.ucs b.edu/.
[33]NURM I D,WOLS KI R,GRZEGDRCZYK C,et al.The Eucalyp t us
open2source cl oud2co m pu ti ng syste m[C]//Proc of W ork s hop on Cl oud Co m puti ng and its App licati ons.2008.
#
433
#
第2期张建勋,等:云计算研究进展综述
