
一﹑前言
针对用户的应用需求,综合考虑安全可靠、用户现状、业务发展、性能价格比、开放性等诸多因素,特设计本方案。
二、综合说明
A、磁盘阵列柜简述
由于服务器的性能与等级不断的提升,但硬盘的技术并未随着变化作快速调整,致使硬盘及其内含的资料屡受威胁,成为服务器系统最大的弱点。
磁盘阵列柜就硬件而言,它可以成为服务器的得力助手, 因为它提供了以下几个功能:
1. 足够的扩容空间
2. 安全的资料保护(服务器当机或硬盘损毁,资料不流
失)
3. 降低服务器的维护率
4. 维护作业简便
就硬件结构而言,不论是单服务器或多服务器,磁盘阵列被视为一个外设装置,并且各自对应一个或多个储存区间, 因此其结构性是相当简单的,如此的设计方式有几项好处:
1. 简化服务器系统的结构以减少对服务器的影响。
2. 所有复杂的储存,备份,侦错,检查工作,完全
由RAID的控制器负责,不占用服务器的资源,使服务
器达到最高的可利用率。
3. 完全的硬件结构相连接,不需要再另外加装任何驱动程序。
4. 标准接口,安装容易。
RAID
RAID
SCSI
Area 1
Area 2
Area 3
Area 4
磁盘阵列系统除了对硬件及内含资料的保护之外,另外一项功能是“双机容错”,它可以透过一套具有监控,服务器资源管理,资源切换功能的软件“Cluster” 实现双机备援的作业。
Host 1
Host2
Device1-4
Device5-8
Device 1-4
Device 5-8
SCSI Channel
CH 1
CH2
CH3
CH4
CH 3
CH 4
在一般性的应用上,单一服务器在遇到问题造成停顿或当机时,通常作业都必须停止一段时间,以便进行整理或维修,这样的情况在大部分的单位里是不被允许的(根据统计,服务器上最易损坏的配件是硬盘),因此而有了双服务器的应用方案,但双服务器方案容易造成原配置的SCSI通道不够,或资料IN/OUT的时间,位置不统一的状况,此时磁盘阵列柜将可以把上述的问题迎刃而解,因为磁盘阵列柜已准备了双通道,提供给二个以上的服务器使用,同时RAID 透过控制器的切割,可以切割出多个区间提供给不同服务器的需
要。
标准的SCSI CH. 有4个,分别是2个主机通道及2个硬盘通道,每个硬盘通道大约控制4个硬盘,以这种最佳配置可以达到最大使用率及最经济的成本。
在双机容错的方案上,由于Cluster 设计时是针对一般性应用的双主机作的资源分配,故一部阵列机柜如要安装2部以上的服务器又必须达到相互备援的功能时,在结构上只能以2部主机为一组
作Cluster(如为6部服务器需要3套 Cluster)。
B、ROSE HA for Windows双机容错软件
ROSE HA for Win NT/2000双机容错软件分下列解决方案:模式一 双机互备援(Dual Active)
模式二 双机热备份(Hot Standby)
操作系统支持
Win NT/2000 3.5 /Win NT/2000 4.0 /Windows 2000/windows 2003
主要支持的服务器系统
PC级服务器(Intel CPU)
HP, IBM, DEC, Fujitsu, NEC, Compaq, SIEMENS, AST. Acer, LEO,联想服务器,浪潮服 务器,Intel Xeon服务器
系统软件环境
数据库(Data Base Management System)
Windwows SQL Server ,Oracle For NT , Informix For NT, Sybase ,Notes, Progress
通信协议(Protocol)
TCP/IP, NetBEUI, SPX/IPX
通过装在两个服务器中的双机热备份系统软件ROSE HA,使系统具有在线容错的能力,即当处于工作状态的服务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器迅速接管不正常服务器上的业务程序及数据资料,使故障网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务的高可靠性。
ROSE HA是一组高可靠性(High Availibility, HA)的软件系统,它可使联入网络中的两台服务器达到一种近乎无差错的容错级,适用环境为:
·两台服务器通过SCSI连接到一个外部存储系统(例如磁盘阵列系统)
·服务器通过网卡连接并经由SCSI通道和一个网络上的监视器侦测主服务器故障(电压,主机硬件,网络错误,应用软件等)。当故障发生时,备援主机接替故障主机管理磁盘阵列,网络通讯,数据库等,ROSE HA的作用是主副机之间容错切换开关。
·在备援机工作期间,用户只需进行几个简单的操作即可重新恢复系统。
C、ROSE HA工作原理介绍
原理介绍
1. 服务进程
* 双服务器采用TCP/IP网络协议和用户连接。
* 双机后台对于客户——服务器网络用户透明。
· 网络服务:双机后台对于用户一端,由监控软件ROSE HA提供一个逻辑的IP Address,如:170.200.80.99,任一用户上网中需要用到这一地址;当后台有一台服务器出现故障时,另外一台服务器会自动将其网卡的IP Address替换为170.200.80.9;这样,用户一端的网络不会因为一台服务器出现故障面断掉。
·数据库服务:当有一台服务器出现故障时,另外一台服务器会自动接管数据库engine;同时激活数据库和应用程序,便用户数据库可以继续操作,对用户而言不受影响。
2. 监控原理
ROSE HA内部含有SCSI侦测心跳及网络侦测心跳两条线路,结果置于Power磁盘柜上的一个5MB的小区,用于监控(如命名
为ware),此小区一般在机柜逻辑的起始段。
·SCSI侦测
对于某一台服务器而言,将侦测讯息以类似于记录方式写在该小区内,其中每一条记录包括如下内容:
(1) 系统对本机的监测状态信息。
(2) 另一台主机是否看到本机状态的信息。
当一台主机有问题或出现故障时,对等主机的可调变心跳频率不断提高;在最小心跳时间内发现记录内容没有更新,即会调用网络心跳侦测再次确认系统状态;当两组心跳都判断系统故障
时,ROSE HA将故障主机的交易业务在最小安全切换时间内切换到对等主机继续运行,同时修改记录区内容:一般情况切换时间不会超过7秒;根据应用程序的复杂程度,最小安全切换时间不超过30秒。
·网络侦测:
业务主机对网络设备监测,同时配合SCSI心跳侦测,对等监控两台服务器主机的工作状态。当有一台服务器因为网络故障或其它原因引起故障而不能正常处理业务交易时,对等主机的可调变心跳频率不断提高;在最小心跳时间内发现心跳记录内容没有更新,即会调用SCSI心跳侦测再次确认系统状态;当两组心跳都判断系统故障时, ROSE HA将故障主机的交易业务在最小安全切换时间内切换到对等主机继续运行,同时修改记录区内容。
3. 监控对象资源:
数据库运行状态
系统运行状态
·生产机硬件资源·系统网络设备(网卡、网线等)
·对等主机系统运行状态
这种双机容错系统可以有两种工作模式。第一种叫做“双机热备份”(Hot Standby),指备援机始终处于等候主机出错并取而代之的状态;第二种是“双机互备援”(DualActive) 两台主机运行各自应用软件同时监测对方状态,当其中一台发生故障时,另一台主机立即将故障主机的工作接管过来,合二为一。
三、方案设计:
出于双机容错的需要,必需选用两台服务器能共享的公共盘,这里我们选用有容错功能的磁盘阵列,它有两个SCSI通道,分别连接到两台服务器的SCSI卡上,由于用户容量不超过120GB,3颗73GB的硬盘,插在磁盘阵列里面,做一个RAID5,它的有效容量为146GB,在坏一块硬盘情况下,数据不会丢失,有效的保护了数据的安全性,在两台服务器上安装双机容错软件, 设置成双机热备模式,一台主工作机,一台备援机,当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)。当工作机经过维修恢复正常后,它会将其先前的工作自动抓回,恢复以前正常时的工作状态。
经过上述方案设计,可实现数据永不丢失,系统永不停机的高可用性。
四:设备选型
A:磁盘阵列
我们选用有10年设计﹑生产磁盘阵列经验的厂家-----3S
综合考滤:数据容量﹑存储速度﹑价位, 推荐使用的具体型号为:3S9000 JS08UR
优点:
3S提供的3S9000 磁盘阵列柜,是国际专业的数据容错磁盘阵列子系统,它为银行、邮电、通信、企业系统等提供安全冗余数据
存储,保障系统不会因为硬件的原因而故障,确保系统安全的运行,提高系统的高可靠性,本产品具有以下认证资格:
美全协会(FCC商标认证)
德国“CE”商标认证
是美国容错协会RAB会员
中国惠普公司认证
ISO9002体系认证
JS08UR具体参数见附录A
JS08UR客户名单见附录B
B:双机容错软件
我们选用美国ROSE公司提供的ROSE HA双机容错软件.
ROSE HA双机容错系统方案有以下几点优势:
最小停机时间(30s之内切换)
最大的系统利用率(保证系统永不停机)
系统管理时间大大减少
其易于操作的特点使维护费用降至最低
对运行状态可建立在线记录文档
逻辑主机概念,系统运行永不宕机
用户可设定启动顺序
自动数据库启动顺序/引擎
故障书面警告
故障快速恢复
C:硬盘配置
建议选用希捷硬盘
73GB
10000转
80 Pin SCA-II SCSI 接口
320MB/S的传输速度
D:服务器
利用客户已有的两台IBM服务器。
五:网络拓扑图:
RS232
SCSI
SCSI
TCP/IP
五、方案配置清单:
本方案配置,服务器采用客户已有的IBM服务器,,使用3S9000 JS08UR存储系统构成既可广泛扩展,又可方便管理的双机应用环境。
产品编号单价(元)数量描 述
总价(元)
磁盘阵列柜和双机容错软件: 单价
.POWER PC Risc CPU/256MB
Cache Memory
.RAID级别 0,1,3,5,10,3S9000
JS08UR1
30,50,JBOD
.4组Ultra 320 LVD/SE SCSI CH.
(2 for host/2for disk)
.8组热插拔散热硬盘盒(SCA-II)
.2组300W热插拔容错电源/4组高效热插拔风扇
.PW-ENV-1100环境监控器
.数据传输速率为 320Mb/s
ROSE HA
FOR WIN2000
180,00.001双机容错软件
SEAGATE DISK 2,200.003颗 SCIS硬盘73GB 10000转
80 Pin SCA SCSI 接口
总计:74,800
七:附录
附录A----全新3S9000系列JS08UR磁盘阵列
全新的3S9000-JS08UR系列磁盘阵列是我公司最新推出的磁盘阵列系统。是专门为部门级用户关键性应用场合而设计,是服务器和工作站首选的数据存储设备。采用RAID技术和光纤模块可使主机系统具有高速度、大容量和容错性的特征。它是一组结合高可靠性、
可扩充性及高效率于一体的磁盘阵列系统。
可靠性
● 采用PowerPC 750Cxe CPU,主频达到400MHz
● 全面支持0、1、3、5、10、30、50、NRAID
和JBOD
● 通过背光式LED液晶面板实时监控RAID系
统的状态
● 支持逻辑磁盘RAID在线扩容,RAID自动重建,并且RAID重建优先级可调● 可通过控制器面板、RS232串口两种方式设定参数,使维护更
为方便
● 可选Battery Back-up模组保护高速缓存内的数据在断电的情况
下不会丢失
● 内建环境控制板实时监控风扇运转速度、内部温度,超出设定
值时有声音报警,并可随意地设定参数来适应不同的环境
● 全新的3S9000-JS08UR系列全部采用冗余模块化设计,您可以
在系统运行下更换硬盘盒、电源、风扇等模块
先进性
●可选光纤子板使得系统很容易升级到光纤接口
●全新的屏蔽设计使得系统具有更强的抗电磁干扰性
●采用高性能冗余风扇使系统更适合高密度的硬盘集群环境
● 采用导光柱作为电源和硬盘状态信号指示灯增加了美观效果,
减少了故障点
● 支持9.1G、18.2G、36.4G、73G、146G、
300G(10000/15000rpm)等SCSI硬盘
高性能
●全新的3S9000-JS08UR采用 位RISC的POWER PC 处理器
●全新的3S9000-JS08UR采用128M ECC缓存,最大可达1GB
● 全新的3S9000-JS08UR后背板均采用Ultra320SCSI技术使得内部
传输速率达到320M/ S
兼容性
●兼容几乎所有的服务器(如:HP、IBM、SGI、COMPAQ、DELL、APPLE、联想、浪潮、曙光等)
●兼容众多的小型机(如:HP、IBM、SGI、ALPHA等)都可以与我们的3S9000-JS08UR进行无缝连接
●支持所有的操作系统(如:UNIX、WINDOWS NT、
WINDOWS2000、SOLARIS、LINUX、HP UNIX、IBM AIX等)扩充性
●全新的3S9000-JS08UR磁盘阵列系统具有8盘位,标配4个通道均可
设定为主机通道或设备通道,每一通道可以支持多达8个LUN,每一个LUN可以规划使用不同的RAID级别并可以在线扩充硬盘容量。最大限度地满足您对容量的要求。
产品优势:
◼采用PowerPC 750Cxe CPU,IBM PowerPC 750Cxe CPU由于采用了Supper Scalars架构(在一个时钟内执行多个指令),有
效的提高MIPS速度,在实际系统应用中真正达到速度提升,
同时在其CPU内部集成了256KB内部二级缓存,大大缩短了
CPU与Cache的交互时间;
◼控制器采用双ASIC、双PCI总线设计,突破了单PCI总线的瓶颈,系统总线带宽达到了1GB/s;
◼控制器采用硬件XOR(异或逻辑运算)芯片设计,不再占用CPU资源,大大提升可靠性、性能;
◼控制器的高速缓存带有ECC功能,最大可扩充至1GB,总线带宽达到1066MB/s,支持锂电池保护功能;
◼单SCSI主机通道的RAID5读/写性能分别达到了142MB/125MB;
◼最大支持128组逻辑磁盘、32个逻辑卷,每个逻辑磁盘最大支持个分区;
◼每个逻辑磁盘的最大容量突破了2TB的,最大可以支持TB容量;
◼支持每个逻辑磁盘设定不同Stripe Size(4/8/16/32//256KB)功能,最大限度为应用系统提供性
能优化;
◼支持当磁盘阵列电源、风扇等部件出现故障时,高速缓存工作方式自动转为write-through方式,当故障排除后高速缓存工
作方式自动还原;
◼支持在线逻辑磁盘RAID初始化功能,用户无需再经过漫长的逻辑磁盘RAID初始化过程,可以直接使用逻辑磁盘,逻辑
磁盘在使用过程中后台进行初始化;
◼支持智能磁盘扫描功能,最大限度保护用户数据;
智能介质扫描技术
3S系列磁盘阵列具备先进的智能介质扫描技术,介质扫描会检查磁盘,还能检测目前存在的坏块。如果在扫描过程中遇到坏块,这些坏块中的数据将被重新读出并自动的保存到好的扇区中。如果在重建过程中在另一块硬盘中又遇到坏块,该坏块的LBA(逻辑坏块地址)将被显示出,在没有受影响的扇区部分重建继续进行,以挽救绝大部分已存的数据。有计划的执行介质扫描可以保证已经检测过的块的状态并且降低以后数据丢失的可能性。
其他应用:
◼非线性编辑系统;
◼媒体行业播出系统;
◼ VOD视频系统;
◼数字化图书馆存储系统;
◼小型医疗影像系统(PACS);
◼石油地质数据分析采样系统;
◼气象数据存储系统;
◼互联网数据库存储系统;
◼保险业保单数据存储系统;
◼电力行业供电营销高可用系统;
◼铁路客票售票高可用系统;
◼制造业ERP存储系统;
3S9000-JS08UR的配置如下:
RAID处理器位POWER PC高性能RAID处理器
RAID等级NRAID、JBOD、0、1、3、5、10、30、50缓存128MB-1GB高速ECC缓存主机/阵列接口Ultra 3 SCSI兼容Ultra2-Wide SCSI(可选320M/S)每通道传输带宽160MB/S(可选320M/S)
通道4个(可扩)
光纤通道可选
背板Ultra320 SCA-II(LVD)
RS2321
冗余电源300Wx2冗余控制器可选控制器密码保护有
热插拔硬盘盒有
热插拔电源有
冗余风扇有
在线扩充有
通道设置可随意设置
自动报警有
坏扇区重分配有
硬盘热备用有
温备用有
后备电池可选
工作温度0℃-40℃(32℉-122℉)
工作湿度20%-85%
外型规格可装8块3’5寸硬盘
工作电压110~240伏
物理规格塔式或机架式(互选)附录B:最新案例
