第一章 概述 2
一、前言 2
二、系统结构与特性 3
三、GDS组成及说明 4
四、GDS性能 5
五、系统适用环境及规格 7
第二章 GDS的系统规划 8
一、后援对象 8
二、系统组成规划 8
三、系统配置规划 9
四、双机备份方式选择 9
第三章 系统的安装和配置 10
一、硬件安装及配置 10
二、软件安装及配置 10
第四章 系统的配置和运行 14
一、系统的配置 14
二、系统的运行 16
第五章 系统管理 18
一、系统管理界面 18
二、系统管理命令 20
三、系统出错日志 21
第六章 GDS安装后的系统运行测试 22
附录A 23
附录B 26
附录C 27
第一章 概述
一、前言
企业为了提高管理水平和工作效率,降低成本,开发了自己的计算机应用系统,以期达到企业管理和生产自动化的目的,从而获得更大的经济利益。这些计算机应用系统稳定、可靠、有效地运行是保证企业电脑化成功的重要因素。
性能、价格和可靠性是企业电脑化过程中人们关心的三大要素。目前,国内许多行业和企业在电脑化的过程中,都选用了价格低廉而性能高的开放系统平台。这种系统平台给用户带来性能价格比的优势的同时,由于系统的复杂性和开放性以及应用环境的多样化,也给应用系统的运行带来了许多不确定因素。这些不确定因素对于本身的可靠性就不很高的计算机应用系统来说,犹如雪上加霜,严重威胁着应用系统稳定有效地运行,有时甚至会引发系统的瘫痪。
在一般情况下,当系统不能正常运行时,我们需要用人工的方法进行错误的认定、分析、恢复及测试。这些都需要花费很长的时间。在这段时间内,系统必须停顿下来以等待恢复,从而给企业带来难以估计的经济损失。
为了保证计算机应用系统稳定、有效、持续地运行,充分利用企业的电脑资源,必须使用高可靠性的系统。
我们开发的双子星双机容错系统(Gemini Duplex System,简称GDS),是一个高可靠性的容错系统,它通过系统冗余的方法以解决计算机应用系统的可靠性问题。
二、系统结构与特性
1、系统结构
GDS的总体结构如图1-1。
双机容错系统GDS是运行于UNIX环境下的,由系统监控软件GDS、具有双路主机SCSI接口的容错磁盘阵列以及RS232和Ethernet监测线路组成的高可靠性双机容错系统。它保证了数据的可靠性和系统运行的可靠性。GDS的工作原理是:
在两台主机上分别运行应用系统的不同子集,当某台主机上的应用系统子集不能正常工作时,在不中断应用系统正常运行的情况下,不需人工干预,另一台主机通过RS232和Ethernet连接,自动检测出错误,并快速地将原主机的应用系统作业切换到另一台主机上继续运行。从而,保证了主机系统运行的可靠性。
GDS的有机组成部分-容错磁盘阵列具有双路主机SCSI接口,使两台主机能够同时访问共享磁盘阵列,为应用系统作业能够在主机间不中断地切换提供了基础;同时,它的磁盘阵列功能保证了共享资源的数据可靠性。
2、系统特性
GDS之所以能够解决应用系统的可靠性问题是因为它具有以下特性:
降低计算机系统运行时的故障风险,提高系统运行可靠性
如上所述,系统的复杂性、开放性和应用环境的多样化以及应用系统的问题都可能带来计算机系统的不正常运行。GDS可以在计算机系统不能正常运行时,及时侦测到系统的不正常状态,以最短的时间自动地将不能在原主机上正常运行的系统作业转接到另外的正常主机上继续运行。
磁盘阵列技术保证了系统资源的可靠性
容错磁盘阵列的双路主机SCSI接口,保证了后援主机在后援切换后能够访问共享磁盘阵列, 应用系统作业能够在主机间不中断地切换提供了基础;同时,它的磁盘阵列功能RAID 0、1、3、5保证了共享资源的数据可靠性。
GDS能够适应不同的应用系统环境及要求
多种监控方式使GDS能够适用于不同的应用系统环境;灵活配置的作业脚本使GDS能够对特定的应用系统的运行进行监控。
三、GDS组成及说明
GDS采用两套UNIX系统主机,两台主机具有相同的应用系统所需的环境(操作系统、网络、数据库等)。两台主机都与容错磁盘阵列连接。GDS的系统组成如下:
两套UNIX系统主机;
具有双路主机SCSI接口的容错磁盘阵列;
RS232接口及标准连接;
Ethernet网卡及连接;
GDS监控软件:Gemini Duplex Software(简称GDS)。
1、具有双路主机接口的容错磁盘阵列
(1)高可靠性
容错磁盘阵列的内部电子部件都是两套互为备份;同时它支持RAID O、1、3和5。
(2)支持两台主机同时访问
容错磁盘阵列的双路主机SCSI接口,保证了后援主机在后援切换后能够访问共享磁盘阵列,为应用系统作业能够在主机间不中断地切换提供了基础。
(3)在线维护
当容错磁盘阵列中的任一磁盘或电源发生故障时,容错磁盘阵列都会由磁盘显示灯和铃声报警。此时,用户可以在不关机的情况下,在线更换磁盘或电源。
2、GDS监控软件--GDS
GDS的监控线路使用RS232边接和Ethernet连接两条线路。在RS232连接正常连通的情况下,系统监控软件通过RS232连接进行监视和切换工作。在RS232连接不能正常连通时,系统监控软件通过Ethernet连接进行监视和工作。
(1)自动监测错误
GDS通过RS232连接和Ethernet连接两条监测线路监视主机的运行情况。当主机的操作系统、网络、数据库及应用系统不能正常运行时,GDS能够自动快速地侦测到主机的状态。
(2)自动后援切换
GDS侦测到主机的故障状态后,自动快速地将原主机上的作业转接到后援主机上继续动行。
(3)自动检测恢复
故障主机修复后,GDS能够自动或人工地恢复双机同时运行的状态。即将转接到后援主机上运行的作用重新恢复到原主机上运行或修复主机作为备份主机监视另一主机的运行状态。
(4)主机同时运行、互为备份
GDS支持两种监控方式一主从方式和对等方式。主从方式即:一台主机支持应用系统的运行,另一台后援主机处于等待运行状态,后援主机监视应用系统的运行状态,一旦应用系统不能正常运行,后援主机主动接管应用系统,并使之继续运行;对等方式即:应用系统的不同子集分别运行在两台主机上,两台主机分别监视对方的运行状态,一旦一台主机上的应用系统不能正常运行,另一台主机主动接管故障主机上的应用系统作业,并使之继续运行。对等方式可以分散应用系统的作业,提高系统效率,有效地利用系统资源。
四、GDS性能
1、自动监测错误
GDS通过RS232和Ethernet自动监测系统和主机是否处于正常状态。
2、自动快速切换
当某台主机处于非正常状态时,另一台主机将自动监测到这种状态,自动地完成后援切换,后援切换不中断信息系统的正常运行。以上工作系统全部自动完成,完全不用人工干预。侦测时间可由用户修改设置,最大切换时间可在18-50秒范围内选择,以达到快速后援的功能。
3、自动检测恢复
当主机故障排除恢复正常后,系统管理员可以通过重新启动系统和或管理命令重新恢复GDS双主机的正常运行状态。
4、支持多种监控方式
GDS支持两种监控方式:主从方式和对等方式。
5、支持单网卡和双网卡方式的以太网连接
双网卡方式下,每台主机具有两块以太网卡。当一块网卡故障时,另一块网卡可自动替代,不影响主机系统的工作。
6、便于安装设置
GDS系统监控软件以软件包的形式提供,便于用户安装。在安装软件包的过程中,系统将提示用户对有关双机备份系统的环境参数进行设置。用户也可以根据系统使用手册对有关参数进行设置,设置灵活方便。
7、系统管理界面及报警机制
GDS提供系统管理界面,它能够实时显示系统运行状态,还能够进行主机间的切换管理。用户可自行打开此窗口以进行系统管理操作。当某台主机或系统处于非正常状态,GDS还将响铃报警并将错误信息写入出错日志中,用户可以通过系统管理界面和操作系统的显示或编辑命令查看出错日志。
8、可灵活编写的企业控制脚本
GDS为用户提供了可灵活编写的后缓和检测作业脚本。针对不同的应用系统,系统管理员通过后援和检测作业脚本,可以使GDS支持对相应应用系统的实时后援切换和实时监测。
9、容错磁盘阵列
容错磁盘阵列是GDS的硬件特性,它保证了数据的可靠性。GDS支持RAID 0、1、3和5。
10、兼容性
GDS适用于UnixWare V1.x、UnixWare V2.x、UNIX SVR4.2和SCO OpenServer5.x、SCO UnixWare7.x等不同的UNIX环境,与运行于其上的所有应用软件完全兼容。
五、系统适用环境及规格
1、硬件环境
适用于高档微机服务器、工作站和小型机等环境。
2、软件环境
UNIX SVR4.2、UnixWare V1.x、UnixWare V2.x、SCO OpenServer3.x、SCO OpenServer5.x、SCO UnixWare7.x等操作系统环境;
运行于相应UNIX操作系统的关系数据库,如:Informix、Sybase、ORACLE、DB/2等;
UNIX上的TCPIP软件等。
3、规格
系统最大切换时间:18-50秒;用户可以自行设置;
运行模式:主从式运行模式,即:一台主机监视另一台主机的
运行状态;
对等式运行模式,即:两台主机间互相监视对方的
运行状态。
第二章 GDS的系统规划
为了使GDS能够有效运行和充分发挥,需要对系统的组成和配置做完整的规划。系统规划的目的是使应用系统在GDS完成主机后仍能有效地运行。
为了在GDS完成主机切换后,应用系统仍能有效地运行,GDS要求两台主机上的应用系统运行环境(包括操作系统、网络和数据库环境)必须完全一致;同时,必须在容错磁盘阵列中存放应用系统的运行所必需的资源,以使两台主机能够共享。
一、后援对象
为了在GDS完成主机切换后,应用系统仍能有效地运行,GDS要求必须在容错磁盘阵列中存放应用系统的运行所必需的资源,以使应用系统的作业在后援主机上仍能访问这些资源,继续正常运行。这些存放在容错磁盘阵列中的、应用系统的运行所必需的资源即为后援对象。
在完成系统的规划之前,需要确认需要GDS后援的对象。确认后援对象的目的是为了保证将GDS后援的对象建立在容错磁盘阵列中。
一般来说,后援对象是那些由于应用系统的运行改变了的系统资源。例如:如果应用系统的运行需要不断地修改访问数据库空间的数据,那么数据库空间即是后援对象。
二、系统组成规划
在确认了GDS的后援对象之后,除了后援对象以外的操作系统、网络、数据库及应用系统等各部分即构成了两台主机的系统组成;后援对象即构成了容错磁盘阵列的系统组成。
三、系统配置规划
在确认了主机及容错磁盘阵列的系统组成后,根据GDS后援对象的性质,我们需要规划容错磁盘阵列的空间大小配置及RAID级别(RAID 0、1、3、5)等;同时,规划主机系统的操作系统及数据库的系统参数配置,如:容错磁盘阵列的空间划分配置等。
四、双机备份方式选择
GDS支持主从式和对等式两种双机备份方式。用户可根据其应用系统的工作情况进行选择。例如,若应用系统是对一个数据库进行操作的,通常只能选择主从式备份方式;若应用系统是对两个或两个以上数据库进行操作的,则可以配置成对等式备份方式;即将对不同数据库的操作作业分布于两台主机上,从而使两台主机同时工作并互相监控。
主从式双机备份方式下,每台主机系统通常使用一块以太网卡;也可使用两块以太网卡,一块为工作网卡,中一块为备份网卡,当工作网卡故障时,GDS自动备份网卡替换工作网卡,不影响主机系统的正常工作。
对等式双机备份方式下,每台主机必须使用两块以太网卡,一块为工作网卡,另一块为监控网卡。此时,GDS使用RS232连接作监控线路。
第三章 系统的安装和配置
一、硬件安装及配置
GDS的硬件安装配置包括:两台主机的硬件安装配置、容错磁盘阵列安装配置、两台主机之间的RS232连接和网络连接的安装配置等。
GDS要求两台主机的硬件配置虽然不一定完全一样,但都应满足应用系统的运行需求。主机系统的硬件安装配置参照相关计算机安装配置手册。
容错磁盘阵列的安装配置及与两台主机之间的SCSI连接参照容错磁盘阵列的安装配置手册。
两台主机之间的网络连接为标准以太网卡连接。
两台主机之间的RS232连接为标准RS232连接。
其连接线的信号跳转图3-la和图3-lb。
二、软件安装及配置
1、GDS软件组成
GDSV3.1软件由一个软件包组成,存储在一张光盘上,软件包名为:GDSpkg
2、软件包安装前的准备
在安装双机备份系统软件包GDSpkg之前,按照以下顺序安装和配置主机和容错磁盘阵列:
根据主机的系统组成规划,在两台主机上分别安装系统、网络、数据库和应用系统的相应部分,操作系统、网络、数据库和应用系统的安装参照相应产品安装手册;
系统配置规划,对容错磁盘阵列进行初始配置,包括:磁盘阵列配置(RAID 0,1,3,5)、SCSI通道配置等。具体配置操作参照容错磁盘阵列安装配置手册;
根据系统配置规划,配置操作系统、网络、数据库和应用系统,具体配置操作参照相应产品系统管理手册;
根据系统配置规划,在主机上配置安装容错磁盘阵列;
【注意】在两台主机上配置操作系统、网络、数据库和应用系统以及配置安装容错磁盘阵列时,注意不要进行重复配置和安装。参见附录A或附录B。
安装软件需要授权密码(serial number),请向系统代理商申请。如缺少此密码或密码不正确,将无法完成安装步骤;
该软件包需要至少1MB根文件系统空间,请事先保证/dev/root文件系统具有足够空间。
3、软件包的安装
用“pkgadd”命令分别在两台主机上安装GDSpkg软件包。
步骤如下:
# mount /dev/cd0 /mnt (for openserver5.x)
# pkgadd –d /mnt/gdsop5
或
# mount –F cdfs –r /dev/cdrom/cdrom1 /mnt (for unixware7.x)
# pkgadd –d /mnt/gdsuw7
〖说明〗在安装过程中,系统会显示GDSpkg版本,如:
Gemini Duplex System Package for OpenServer5/UnixWare7 (i386) 3.1-s
(表示使用RS232为心跳线)
Gemini Duplex System Package for OpenServer5/UnixWare7 (i386) 3.1-n
(表示使用网卡为心跳线)
在安装过程中,系统会显示一个系统配置的对话序列,需要系统管理员键入一些系统配置信息。即:
Whether your system use single ethernet card or dual ethernet cards?(使用单网卡还是双网卡?)
Input S or D (default:S):(默认为单网卡)
〖说明〗使用单网卡意即每台主机中只有一块网卡,GDS的网络监控线路与应用系统网络线路用同一条线路;使用双网卡意即每台主机中具有两块网卡。如果GDS为对等运行模式,主机系统必须具有两块网卡。如果GDS为主从运行模式,冗余网卡为备份网卡,当一块网卡发生故障时,不影响主机系统的正常工作。
如果使用单网卡,将请您回答下列信息:
Please input the RS232 port name (default:tty00):RS232通信端口名,如:tty00或ttyla(使用RS232为心跳线)
或者:
Please enter the IP address of the peer heart beat :对等机心跳 IP地址,如:194.0.0.2 (使用网卡为心跳线)
Please enter the IP address for the local machine:本地主机的网络IP地址,如:192.0.0.1
Please enter the IP address for the peer machine:对等机的网络IP地址,如:192.0.0.2
Please enter the IP address for the work machine:工作网络IP地址,如:192.0.0.3
Please enter the IP address for the router machine:参考点网络IP地址,如:192.0.0.254
Do you accept these system parameters?(y/n):如果确认这些参数,回答“y”;回答“n”可重新输入参数
〖说明〗工作网络IP地址为应用系统所使用的主机IP地址。该IP地址在两台主机之间漂移,哪一台主机支持应用系统的运行,则其IP地址即为工作网络IP地址。
如果使用双网卡,屏幕上将显示以下信息:
Whether your system use,
1:Master-Slave backup,or
2:Mutual backup
Input 1 or 2 (default:1):
此时,如果您选择主从备份方式,键入“1”,回车;如果您选择互备份方式,键入“2”,回车。
〖说明〗主从备份方式下,GDS只需一个工作网络IP地址;互备份方式下,GDS必须有两个工作网络IP地址。
如果您选择了主从备份方式,GDS将请您回答以下信息:
Please input the RS232 port name(default:tty00):RS232通信端口名,如tty00或ttyla(使用RS232为心跳线)
或者:
Please enter the IP address of the peer heart beat :对等机心跳 IP地址,如:194.0.0.2 (使用网卡为心跳线)
Please enter the first IP address for the local machine:本地主机的第一网络IP地址,如:192.0.0.1
Please enter the second IP address for the local machine:本地主机的第二网络IP地址,如:193.0.0.1
Please enter the first IP address for the peer machine:对等机的第一网络IP地址,如:192.0.0.2
Please enter the second IP address for the peer machine:对等机的第二网络IP地址,如:193.0.0.2
Please enter the IP address for the work machine:工作网络IP地址,如:192.0.0.3
Please enter the IP address for the router machine:参考点网络IP地址,如:192.0.0.254
Do you accept these system parameters?(y/n):如果确认这些参数,回答“y”;回答“n”可重新输入参数
如果您选择了互备份方式,GDS将请您回答以下信息:
Please input the RS232 port name (default:tty00):RS232通信端口名,如tty00或ttyla(使用RS232为心跳线)
或者:
Please enter the IP address of the peer heart beat :对等机心跳 IP地址,如:194.0.0.2 (使用网卡为心跳线)
Please enter the first IP address for the local machine:本地主机的第一网络IP地址,如:192.0.0.1
Please enter the second IP address for the local machine:本地主机的第二网络IP地址,如:193.0.0.1
Please enter the first IP address for the peer machine:对等机的第一网络IP地址,如:193.0.0.2
Please enter the second IP address for the peer machine:对等机的第二网络IP地址,如:192.0.0.2
Please enter the IP address for the local work machine:本地工作网络IP地址,如:192.0.0.3
Please enter the IP address for the peer work machine:对等机工作网络IP地址,如:193.0.0.3
Please enter the IP address for the router machine:参考点网络IP地址,如:192.0.0.254
Do you accept these system parameters?(y/n):如果确认这些参数,回答“y”;回答“n”可重新输入参数
接着,系统提示您输入密码:
Please enter the serial number:(请输入产品的序列号)
Please enter the serial number again:(请再次输入产品的序列号)
系统将返回一个安装密码:
The installation serial number is:GDSxxxxxxxx
4、软件包的卸装
用命令pkgrm可以分别在生产机和备份机上卸下GDSpkg软件包。如在备份机上卸下GDSpkg软件包:
# pkgrm GDSpkg
第四章 系统的配置和运行
一、系统的配置
1、编写系统作业脚本文件和文件系统配置文件
(1)主从式双机备份方式下的系统配置文件
GDS安装完成后,为了使GDS能够支持数据库的应用系统,系统管理员应分别编写GDS的三个作业脚本文件(BACKTASK、TESTTASK、SHUTTASK)和一个文件系统配置文件(mountpath),它们都被放置在目录/etc/dhbs.d/task.d下。
BACKTASK:需要GDS后援的应用系统启动作业。如数据库和应用系统的启动SHELL命令序列;
SHUTTASK:需要GDS后援的应用系统关闭作业。如数据库和应用系统的关闭SHELL命令序列;
TESTTASK:需要GDS支持的应用系统测试作业。如数据库和应用系统的测试SHELL序列。
【注意】TESTTASK作业脚本文件中的命令序列必须有返回值。执行成功:exit 0,失败exit 1。
GDS通过以上三个作业脚本文件,可以完成对相应数据库和应用系统的监视和后援切换,即监视数据库和应用系统的运行情况(TESTTASK),一旦生产机发生故障,GDS在生产机上关闭数据库和应用系统(SHUTTASK),同时,在备份机上启动数据库和应用系统(BACKTASK)。
〖说明〗默认配置情况下,GDS只完成对操作系统和网络的监视和后援切换。
mountpath:如果后援对象为文件系统时,系统管理员需要编写此文件。系统管理员应严格按照文件中给出格式赋予变量DEVICE_PATH:容错磁盘阵列中磁盘设备(文件卷)的全路径设备名;变量MOUNT_POINT:文件系统的安装点的全路径名。
(2)对等式双机备份方式下的系统配置
若GDS对等式双机备份方式,则系统作业脚本和文件系统配置文件被放置在目录/etc/dhbs.d/dctask.d下,其中包括:
LBACDTASK:需要GDS后援的本机工作应用系统启动作业;
LSHUTTASK:需要GDS后援的本机工作应用系统关闭作业;
PBACKTASK:需要GDS后援的对等机工作应用系统启动作业;
PSHUTTASK:需要GDS后援的对等机工作应用系统关闭作业;
TESTTASK:需要GDS支持的应用系统测试作业;
lmountpath:本机工作文件系统配置文件;
pmountpath;对等机工作文件系统配置文件。
以上文件的配置方法与主从式双机备份方式相应文件的配置方法相同。
2、系统的配置
GDS的系统配置大部分在系统安装时完成。
除安装时的系统配置参数外,系统管理员可以配置修改GDS的最大后援切换时间。这个参数存放在/etc/dhbs.d/switchtime文件中。文件中有三个数字,第二和第三个数字分别表示GDS的最大后援切换时间的最小值和最大值,第一个数字表示选定的GDS的最大后援切换时间,这个数字应介于最大后援切换时间的最小值和最大值之间。
【注意】GDS的最大切换时间表示从生产机出现异常到备份机开始后援切换后需的最大时间间隔。这个值取得相对较大,等待切换的时间也较长。最大后援切换时间的选取,应根据系统的负载配制情况决定。一般说来,系统负载较大时,这个值应选得大一些。
3、配置IP地址
编辑/etc/hosts文件,加入本机的网络IP地址、对等机的网络IP地址和工作网络IP地址以及主机名和工作机名。如:
192.0.0.1 hostl ………本机的IP地址和主机名
192.0.0.2 host2 ………对等机的IP地址和主机名
192.0.0.3 work ………工作IP地址和工作机名
二、系统的运行
1、运行前的测试
在GDS运行前,为了保证GDS监控线路的畅通,应分别检测RS232连接和Ethernet连接是否连通。
RS232连接
GDS为用户提供了两条测试命令用于测试RS232连接是否连通:ttyrec和ttysend。将RS232因线分别连到两主机的RS232口上,然后用户分别在两台主机上运行这两条命令即可知道RS232连接是否连通。如:在一台主机上先运行
ttyrec/dev/tty00 (SCO OPENSERVER为/dev/ttyla)
然后马上在另一台主机上运行
ttysend/dev/tty00(SCO OPENSERVER为/dev/ttyla)
如果RS232连接是连通的,屏幕上将显示:
/dev/tty00 is good
否则,屏幕上将显示:
/dev/tty00 may be bad
【注意】GDS运行以后,这两条命令不能测试 RS232连接是否连通。
Ethernet连接
使用系统命令ping即可测试Ethernet连接是否连通。
2、GDS的运行启动
(1)GDS安装后的运行测试
若GDS配置为主从试:
在生产机上键入命令
#/etc/dhbs.d/startsh
在备份机上键入命令
#/etc/dhbs.d/startshbkp
GDS即可启动运行。测试其运行情况,详见第六章。
若GDS配置为对等方式,则在两台主机上先后分别键入命令
#/etc/dhbs.d/startsh
GDS即可启动运行。测试其运行情况,详见第六章。
(2)GDS上线运行
若GDS配置为主从方式,在生产机上键入命令
#cp/etc/dhbs.d/startsh/etc/rc3.d/S99dhbs
在备份机上键入命令
#cp/etc/dhbs.d/startshbkp/etc/rc3.d/S99dhbs
若GDS配置为并行方式,则在两台主机上分别键入命令
#cp/etc/dhbs.d/startsh/etc/rc3.d/S99DHBS
如上操作后,重新启动两台主机,GDS将会自动运行。
【注意】GDS的启动应在系统网络启动运行之后。
第五章 系统管理
一、系统管理界面
GDS为系统管理员提供了一个直观而方便的系统管理界面。系统管理员只需简单地键入命令行gdsadm,便可以得到GDS为您提供了自动监督测、快速切换等各项功能服务。
gdsadm运行之后,在您的主控台上您将会看到我们称之为“双机备份系统管理界面”(下文简称“管理界面”)的整屏画面。
管理界面由外装饰框、软件版本信息、对等机(peer machine)状态窗口、本机(Local machine)状态窗口和反显的功能选择键组成。见图5-1
外装饰框
用来美化界面,绿色的外装饰框给人以静谧、安祥、舒适的感觉,以减少工作的紧张和屏幕黑色给人造成的压迫感。
版本信息
告诉系统管理员正在运行的GDS的现行版本。
对等机状态窗口和本机状态窗口
对等机状态窗口和本机状态窗口边框和窗口内的文字信息组成。它们分别反应了对等机和本机的工作状态。对等机窗口位于本机窗口的上方,这一相对固定的位置在gdsadm运行期间保持不变。
利用窗口边框的颜色来反映对等机和本机的工作状态是gdsadm向系统管理员快速提供机器状态信息的一个重要手段。在您阅读完这一节之后,利用窗口的相对位置及其色彩,对主控台的管理面只需一瞥,就能掌握整个系统的运行状态。
窗口所用的定义如下:
红色: 机器处于脱机(off-line)态,即:没有上网。
粉色: 机器处于不确定的联机(on-line)态,即:已经上网,
但对双机备份系统的监测不确定。
黄色: 机器处于对双机备份系统的监测状态。
蓝色: 机器处于工作机状态。
例1:
当管理界面显示如图5-2时表示:
对等机处于对系统的监测状态,窗口内文字说明:对等机处于联机上网监测状态。
机本处于工作机状态,窗口内文字说明:本机处于联机上网工作状态。
例2:
当管理界面显示如图5-3时表示:
对等机处于不确定的联机状态,即:已经上网,但对双机备份系统的监测不确定,窗口内文字说明:对等机处于联机上网不确定的工作状态。
本机处于对系统的监测状态,窗口内文字说明:对等机处于联机上网监测状态。
在这种情况下,本机将会继续监测对等机的工作状态,若对等机不能恢复生产机状态,本机将会自动切换,进入工作机状态,从而使本机窗口成为蓝色。
反显的功能键
gdsadm为系统管理员提供了交互式的功能管理界面。在管理窗口的最下方有一排反显的功能键,各键位上标有其功能说明,如下图所示:
这些功能键的使用非常方便和简洁,每一个功能键位上都有其功能说明。您只需按下您所需要的功能键。gdsadm便可以为您提供相应的功能服务。
ESC: 退出键,退出gdsadm,返回shell。
Help(F1):帮助键,在屏幕上说明各功能键的功能。
Switch(F2):切换键,它将使作业在工作机与监控机之间进行状态切换。如果本机原先是工作机,则向监控切换。反之,如果本机原先是监控机则向工作机切换。在键入F2之后,gdsadm将提示管理员进行确认。键入“Y”确认切换,键入“N”则放弃。其它键入为非法键入,gdsadm将不予理睬。
【注意】Switch(F2)键将引起本机状态在工作机与监控机之间进行切换,不合时宜的切换将给系统造成无谓的开销,慎用此键。当误击此键时,可在确认阶段键入“N”予以放弃。
ErrLog(F3):错误记录键,它将显示最近几条系统出错记录,供系统管理员参考使用。
IPaddr(F4):IP地址键,它将显示本机、对等机和系统工作地址。
总之,对等机和本机窗口以及反显的功能选择键构成了界面的功能核心。它们反映了在gdsadm监控下的双机备份运行状态,并为系统管理员提供了机器交互的手段。
二、系统管理命令
1、系统启动命令
在/etc/dhbs.d目录下,GDS提供了系统启动命令startsh和startshbkp。两台主机都可以通过键入startsh命令启动GDS。命令startshbkp是专为主从方式下启动备份机而提供的命令。
如果系统管理员希望在系统启动时自动启动GDS,可以键入:
# cp/etc/dhbs.d/startsh/etc/rc3.d/S99dhbs
【注意】GDS的启动应该在系统网络启动运行之后。
2、系统切换命令
在/etc/dhbs.d目录下,GDS提供了系统强制切换命令forceswitch,它可以使两台主机间进行应用系统作业切换。
〖说明〗系统管理员也可以通过系统管理界面进行主机切换操作。
三、系统出错日志
GDS在/etc/dhbs.d/errlog.d目录下放置了系统出错日志文件errlog、neterr.log、rserr.log、taskerr.log。系统管理员通过查询这些文件即可知道GDS所报出的系统出错信息,这四个文件的存放内容如下:
errlog-GDS总的系统出错日志。包括网络连接、RS232连接、应用系统发生的错误类型和时间;
neterr.log-本次启动网络连接系统出错日志。包括网络连接的错误类型和时间;
rserr.log-本次启动RS232连接系统出错日志。包括RS232连接的错误类型和时间;
taskerr.log-本次启动应用系统出错日志。包括应用系统发生的错误类型和时间。
〖说明〗系统管理员也可以通过系统管理界面查询这些系统出错信息。
第六章 GDS安装后的系统运行测试
在GDSpkg软件包安装及脚本配置完成后,分别在两台主机上按次序启动/etc/dhbs.d/startsh和(或)/etc/dhbs.d/startshbkp,即可进行GDS安装后的系统运行测试。
一、GDS启动正确性测试
在一台主机上(若为主从方式,最好在备份机上)执行
# gdsadm
命令,若两个状态窗口的为一蓝一黄或两蓝,主从方式下表示两台主机分别为工作态和监测态,对等方式下,表示两台主机分别为工作态,则GDS启动正确。若两个状态窗口的颜色都为红色,则GDS启动不正常,诊断步骤如下:
1、主机的现用网络IP地址检查
有netstat -in命令,查看两台主机的现用网络IP地址:
主从方式下,工作机现用网络IP地址为虚拟工作机(work)网络IP地址,备份机现用网络IP地址为其本机网络IP地址。
对等方式下,两台主机现用网络IP地址应分别为两个虚似工作机(work)网络IP地址。
若主机的现用网络IP地址与上述不等,请查看文件/etc/dhbs.d/host_name_addr,确定安装GDSpkg软件包时,IP地址输入是否有误。若不正确,直接编辑修改此文件中的IP地址即可,也可先拆卸GDSpkg软件包后再重新安装GDSpkg。
2、磁盘文件卷设置检查
若容错磁盘阵列中某个分区为文件卷,在工作机上用mount命令,查看此文件卷是否被装入指定安装点。若未被安装,查看/etc/dhbs.d/mountpath文件,检查配置是否正确。
二、自动检测和后援测试
关闭工作机(工作机),测试监控机(备份机)是否能检测到工作机的异常并自动完成切换。
三、系统回复测试
将故障修复后的主机(工作机)重新投入运行。主从方式下,修复后主机应自动进入监测状态,监测另一台主机的运行情况;对等方式下,修复后主机应自动接管对等机的部分工作,并进入互相监控状态。
四、双机强制切换测试
运行gdsadm命令进入系统管理界面状态后,使用F2功能键,进行双机间强制切换,测试切换的正确性。
附录A
(for SCO OPENSERVER)
一、有关系统的规划
为了使GDS有效运行和充分发挥作用,在生产机和备份机的网络操作系统环境安装完毕后,需要对系统的组成和配置做完整的规划,从而确认生产机和备份机系统的软件组成和它们的安装位置以及系统的具体配置。
在完成系统的规划之前、需要确认由GDS后援的对象。例如:数据库空间的数据需要后援。确认后援对象的目的是为了保证将GDS后援的对象建立在容错磁盘阵列中。从而
根据GDS后援的对象规划容错磁盘阵列的空间大小配置、空间设备类型和RAID级别,参见容错磁盘阵列用户手册;
确认生产机备份机系统的软件组成和它们的安装位置。
二、生产机和备份机的安装设置
1、生产机的安装设置
(1)首先应该安装UNIX基本系统、业务系统所需要的TCP/IP软件包;
(2)安装完成后,通过命令“mkdev hd”将磁盘柜中的硬盘配置进UNIX系统,作为GDS后援空间。根据GDS后援的对象,通过命令“divvy”划分和配置硬盘空间及设备类型。
例如:如果GDS后援的对象为文件系统,那么就必须在磁盘柜中的硬盘上建立文件系统。如果数据库的空间为裸设备,那么还必须划分磁盘柜中的硬盘,在它上面分别建立文件系统和非文件系统片区;
(3)根据规划在生产机主硬盘中安装所需软件,并进行相应配置;
(4)根据规划在磁盘柜中的硬盘中安装所需内容,并进行相应配置;
(5)根据规划在相应位置(生产机主硬盘或磁盘柜中的硬盘)安装配置业务系统软件;
(6)安装GDSpkg软件包;
(7)根据GDS后援对象的不同编写相应的作为脚本文件(在/etc/dhbs.d/task.d目录下)。
2、备份机的安装设置
(1)首先应该安装UNIX基本系统、业务系统所需的TCP/IP软件包;
(2)安装完成后,通过mkdev使将磁盘柜中的硬盘配置进UNIX系统,不要通过命令divvy重新划分磁盘柜中的硬盘空间,但可重新命名片区,以便与生产机上名称一致;
(3)根据规划在备份机主硬盘中安装所需软件,并进行相应配置。
不要在磁盘柜中的硬盘中安装所需软件,并进行相应配置。
【注意】当数据库安装在备份机主硬盘中时,不要配置数据库,只需将生产机上的数据库配置文件复制到备份机中即可,因为在生产机上已经对数据库进行配置了。例如Informix,只需将生产机上的/opt/informix/etc/onconfig复制到备份机中即可:
(4)根据规划如有必要在备份机主硬盘安装业务系统软件。
【注意】不要根据应用系统软件再对数据库进行初始操作,因为在生产机上已经完成了对它的配置;
(5)最后安装GDSpdg软件包;
(6)根据GDS后援对象的不同编写相应的作业脚本文件。
三、异常主机的恢复运行
1、异常主机的修复、配置
发生异常的主机的修复方法应参照UNIX系统、网络系统、数据库系统以及业务系统有关参考手册。
需要注意的是,修复后主机的操作系统配置、网络系统配置、数据库系统配置以及业务系统配置应与以前的完全一致。应该特别小心的是,在恢复原系统配置时,尽量采用修改系统配置文件的方法,不要盲目使用系统管理命令修改配置。例如需要恢复Informix系统配置,只需恢复配置文件/opt/informix/etc/onconfig,不要使用onmonitor重新配置系统。
通常情况下,用户不要修改主机有关的数据库系统配置。
【注意】用户不要使用divvy一类的命令修改数据库硬盘配置,不要使用onmonitor一类的命令修改数据库配置。
2、主要修复后的愎复运行
在发生异常的生产机修复后,重新启动生产机。重启后,正常情况下生产机处于监视状态、备份机处于工作态。系统管理员在主机上键入命令
#/etc/dhbs.d/forceswitch
使生产机进入运行状态、备份机转入监视状态;
在发生异常的备份机修复后,只需重新启动备份机,备份机自动进入监视态。
附录B
(FOR SCO UnixWare7)
一、生产机和备份机的安装设置
1、生产机的安装设置
(1)首先应该安装UNIX基本系统,业务系统所需要的TCP/IP软件及其它软件包、数据库软件包;
(2)安装完成后,通过命令diskadd将磁盘柜中的硬盘配置进UNIX系统,作为数据库空间。例如将/dev/rdsk/c0b0tld0s0配置UNIX系统,键入下列命令:
# diskadd c0b0tld0s0
系统会提示用户在此硬盘上建立几个片区,片区是否为文件系统。由于数据库空间既可以是原始设备也可以是文件系统,因此,此时既可以选择建立文件系统也可以不建立文件系统,如果不建立文件系统,用户在系统提问时,只需键入“na”即可;
(3)接着,按照数据库的配置步骤进行数据库的初始配置,生成数据库配置文件;
(4)安装业务系统软件;
(5)最后安装GDSpkg软件包。重新引导系统。
2、备份机的安装配置
(1)首先应该安装UNIX基本系统、业务系统所需的TCP/IP软件包及其它软件包、数据库软件包;
(2)安装完成后,不要通过命令diskadd将磁盘柜在的硬盘配置进UNIX系统;
(3)不要配置数据库,只需将生产机上的数据库配置文件复制到备份机中;
(4)安装业务系统软件;
(5)最后安装GDSpkg软件包,重新引导系统。
二、异常主机的恢复运行
1、异常主机的修复及配置
发生异常的主机的修复方法应参照UNIX系统、网络系统、数据库系统以及业务系统有关参考手册。
需要注意的是,修复后主机的操作系统配置、网络系统配置、数据库系统配置以及业务系统配置应与以前的完全一致。应该特别小心的是,在恢复原系统配置时,尽量采用修改系统配置文件的方法,不要盲目使用系统管理命令修改配置。例如需要恢复数据库系统配置,只需要恢复配置文件,不要使用onmonitor重新配置系统。
通常情况下,用户不要修改主机的有关数据库的系统配置。
〖注意〗用户不要使用diskadd一类的命令修改数据库硬盘配置;不要使用数据库配置命令修改数据库配置。
2、主机修复后的恢复运行
在发生异常的生产机修复后,重新启动生产机。重启后,正常情况下生产机处于监视状态,备份机处于工作状态;系统管理员在生产机上键入命令
#/etc/dhbs.d/forceswitch
使生产机进入运行状态、备份机转入监视状态;
在发生异常的备份机修复后,只需要重新启动备份机,备份机自动进入监视态。
附录C
一、GDS的使用流程
GDS若采用对等方式,两台主机的开关次序没有要求。GDS若采用主从方式,系统管理员应严格按照以下步骤进行操作。
1、GDS开机过程
第一步:打开磁盘阵列电源,等待液晶显示器上出现“Ready”等待时间约为二分钟。
第二步:打开生产机电源,启动生产机直到提示“Login:”。
第三步:打开备份机电源,启动备份机。
双机备份系统即可正常工作。
在备份机启动后,可用root用户注册,执行gdsadm命令,启动系统管理界面。
2、GDS关机过程
第一步:使用关机命令关闭备份机。
第二步:使用关机命令关闭生产机。
第三步:关闭磁盘阵列电源。
一、GDS系统命令
1、RS232连接测试命令
ttyrec
ttysend
2、GDS启动命令
/etc/dhbs.d/startsh
/etc/dhbs.d/startshbkp
3、强制切换命令
/etc/dhbs.d/forceswitch
4、系统管理界面
gdsadm
三、GDS系统作业脚本和文件系统配置文件
1、后援启动作业脚本
/etc/dhbs.d/task.d/BACKTASK
2、后援关闭作业脚本
/etc/dhbs.d/task.d/SHUTTASK
3、GDS测试作业脚本
/etc/dhbs.d/task.d/TESTTASK
4、文件系统配置文件
/etc/dhbs.d/task.d/mountpath
四、GDS系统错误日志
1、GDS总的系统错误日志
/etc/dhbs.d/errlog.d/errlog
2、网络连接系统错误日志
/etc/dhbs.d/errlog.d/neterr.log
3、RS232连接系统错误日志
/etc/dhbs.d/errlog.d/rserr.log
4、应用系统系统错误日志
/etc/dhbs.d/errlog.d/taskerr.log
五、系统显示信息
GDS系统显示信息总是显示在系统主屏上。
1、系统启动显示信息
Waiting to GDS start up……
Gemini Duplex System Version 3.1
……Done
2、系统切换显示信息
强制切换
在本地机上显示启动或关闭应用系统的信息。
在对等机上显示:
The tasks on my machine switches over peer machine forcely.
或
The tasks on peer machine switches over my machine forcely.
主机故障切换
在工作机上显示:
Local machine has problem, peer machine working on.
在后援机显示:
Peer machine has problem, local machine working on.