第七章 术语附录

*         节点(Node):运行相同版本操作系统和EterneCluster service的计算机系统,并对外部client提供特定的服务,如 SQL服务和IIS服务等,服务通常可以分为下面两种.

*         首选节点(Preferred Node):指集群中指定的运行资源组的首选的节点,往往配置比较好,该节点一般需要配置:2块网卡, 接上盘阵的SCSI或光纤

*         备份节点(Backup Node ):备份节点硬件配置可以不同于首选(当然也可以相同),但是要求运行相同的操作系统,同时必须安装和主节点上相同的应用,当首选节点出现故障时能够接管其资源组的工作。

首选节点是相对于一个特定的资源组, 如果是多个节点的高可用性方案,就会有多个首选的节点。那么就可能出现这种情况,对一个Resource 资源组1来说A服务器是首选节点,但是对Resource 资源组2来说A服务器可能就是备份节点.

*         浮动IP地址(Floating IP address) 一个服务将其服务通过特定的IP地址来输出,这个IP地址就是浮动IP地址,这个地址将会绑定在提供主服务的服务器的一个正常的公网上,当服务进行切换时,浮动IP地址也将进行切换,这样对外界来说,该IP地址仍然是可以访问的,由于这个IP地址是在多台服务器之间来回变动(如果发生服务不可用等故障时),所以叫做浮动IP地址.

*         主机网络名(Network Name):和上面的浮动IP地址类似,客户端大多是通过主机名字来访问服务的.这样我们就必须提供一个浮动的主机名字,我们将这个名字称为主机别名.当浮动IP地址发生切换时候,主机别名也会相应的进行浮动,但是相对于浮动IP地址来说,这个别名是被捆绑在其上的.

*         心跳(Heart Beat): 是两个组件之间用来判断对方状态的机制,当然也能够通过心跳来交换一些简单的信息.心跳在EterneCluster中主要分成两种

*         监控心跳:(Monitor Heart Beat), 这种心跳是存在于监控(Monitor)和EterneCluster之间的,用于交换Agent信息的

*         EterneCluster心跳(EterneCluster Heart Beat):这种心跳是存在于多个EterneCluster之间的,用来交换EterneCluster间信息和判断对方是否有故障的

*         私网(Private Net):用以交换服务器间心跳的网络。它可通过一条独立的网线来传送心跳。为了避免单点故障,一般是配置2条或者3条私网,太多的私网将不会导致系统消耗更多的资源用于私网的通讯,从这点上说,2条私网是比较合适的

*         公网(Public Net):供客户端访问服务的网络。连接公有网最好的办法是用独立的网线连接,同样为了提高系统的可用性,我们可以配置2条到多条公网,这样当其中一条公网发生故障的时候,我们可以不用进行服务的服务器之间的切换,而只需要进行浮动IP地址的切换(就在原来的这台服务器上的多个公网间切换浮动IP地址。

*         客户端(Client) 是指通过公网访问服务的计算机系统。

*         共享磁盘(Shared Disk):共享磁盘一般为磁盘阵列,可以被所有的服务器访问,上面存放着服务的数据或主程序。当主节点访问时该磁盘时,备份节点将不能访问共享磁盘,即为独占访问模式。备份节点只有在将Resource 资源组切换过来后才能访问该磁盘.

*         应用层服务(Application service):简称为 “应用服务”,这些服务(譬如oracle,Exchange,SQL等)是在指定的主节点上运行,客户端可通过指定的浮动IP 地址来访问,主服务由EterneCluster软件来管理,当主节点出现故障时,在很短的宕机时间内,备份节点会将主服务接管过去。多个主服务也可以分布在多个不同主节点上,也就是说两台服务器都是主节点,但是是不同服务的主节点,当然他们也同时是备份节点(也是针对不同的服务),这样做可以提高系统的可靠性,同时能最大限度的利用硬件资源。

*         应用服务监控(Monitor for application service):简称为 “监控”,用来监测应用层服务的可用性,并把这些信息及时汇报给EterneCluster核心。监控默认3秒(可由策略来设置)汇报给EterneCluster核心,如果联系5次(可由策略来设置),即15秒EterneCluster核心没有收到代理的信息或者代理返回应用已经不可用,那么EterneCluster核心就认为应用已经不可用,EterneCluster核心便会进行相应的处理动作。至于汇报间隔和次数可以通过管理界面进行配置。

*         事件(Event):指系统中出现了有价值的状态变化,如发现硬件和软件方面的改变等等。

*         通知(Notification):是指将符合特定的条件的事件通过不同的方式通知用户,通知讲采用模块化的设计利用回调函数的方式来实现,这样有利于以后的功能扩充,现在通知采用如下几种方式:

*         日志(Log):事件将记录在一个特定的日志文件中(各平台都实现)。

*         系统日志(System Log):对不同的系统将特定级别的事件加入其系统日志中。

*         EterneCluster核心(EterneCluster Core):简称为“核心”,它是软件的核心部分。它完成了绝大部分的工作。

*         监控服务(Monitor Service):简称为“监控”,它的目的是监控EterneCluster核心,当EterneCluster核心出现异常或故障时,监控服务将重新启动EterneCluster核心。该部件是为实现EterneCluster软件本身的高可用性而存在,其设计并不复杂。同时其也被EterneCluster核心监控,一旦发现监控服务异常,其立即重启监控服务。事实上监控服务和核心是相互监控的。

*         资源监控服务(Resource Monitor Service):简称为“资源监控”,它将监控服务器上所有相关的资源,采用外部dll/so方式实现,并把这些信息汇报给EterneCluster核心。

*         管理界面(CONSOLE):提供一个用户友善的界面,这个界面将用JAVA来实现,其通过和EterneCluster Core通讯来取得配置信息和服务器和Resource 资源组的当前状态并且反映在界面上。

*         切换(Failover):是指把发生故障的节点上的Resource 资源组转移到另一节点上。故障切换会在三种不同的情况下发生,人工,自动,或者在特定的时间(由管理软件设定)。自动故障切换包含三个阶段:1、故障发现。2、资源重新定位。3、重新启动应用程序(一般是故障切换过程中最耗费时间的)。切换又分成下面两种:

*         远程切换:(Remote Failover):是由指定Resource 资源组的主节点发起的一个Resource 资源组的切换过程。通常来说,有两种可能会触发此项操作,一、因为某种错误导致Resource 资源组的中断或主节点重起失败。二、主节点需要离线转去执行系统维护工作。

*         本地切换:(Local Failover):在主节点上,如果有多个公网网卡(NIC),那么我们可以设置其他公网网卡作为主节点的备份NIC。当主NIC 出现故障时,EterneCluster将会执行本地切换,本地切换会将浮动IP地址从故障的公网NIC上切换到能正常工作的备份 NIC 上,这样能减少由于应用在多机上切换带来的巨大的时间消耗。

*         故障恢复: (Failback):是故障切换的一种特例,指由主节点启动的一个Resource 资源组的切换过程。当主节点解除故障,正常运行后,如果用户指定自动迁回,它便会要求备份节点在指定的恢复时间窗口内将资源组切换回来运行,否则资源组将保留在当前结点上,等待由管理员在合适的时间进行切换。此操作的主要用途在于:对客户端来说,可以继续使用原来由主节点提供的服务响应级别,这可能是由于原来的主节点的硬件资源好于备份节点,这样能给客户提供更好的服务响应。

*         资源(Resource): 我们将在节点中提供一定功能,使得应用能够正常运行需要的部件都称之为资源。包括物理组件和逻辑组件,例如磁盘、网络名、IP 地址、数据库、Web 站点、应用程序以及任何其他可以联机和脱机的实体。EterneCluster支持如下几种资源:

*         IP地址(IP Address):就是前面说的浮动IP地址。

*         主机网络名(network name):就是前面说的主机别名

*         物理驱动盘(Physical driver):是应用要存放数据的物理磁盘或者分区,就是前面说的共享磁盘。

*         应用(Application):就是前面说的应用,应用是一个十分宽广的概念,可以是Windows下的某些服务或者是一些第三方的应用软件等等

从资源所处的位置来说,我们可以将资源分成下面两类:

*         内部资源(Internal resource):就是这些资源存在于本地资源组上。如前面所说的IP等等

*         资源依赖性(Resource dependencies)是指资源的可用性通常依赖于其它资源的可用性,资源间的依赖关系通过资源依赖树(dependency tree)来描述。资源依赖树描述资源启动的先后序列和哪些资源需要共同切换。资源依赖性仅限内同一个资源组内,不同资源组间不允许有资源依赖关系。

*         资源组(Resource 资源组):是应用和它所依赖的所有资源的组成的一个单元,是进行故障切换(FailOver)的最小单元,一个资源组存在于一个节点上。在EterneCluster中,切换是以Resource 资源组为单位的,切换策略设置是基于资源组为基础的,包括首选节点(Preferred Node), Failback时间等。

*         策略(Policy):我们将可以通过配置文件可以进行更改的部分都称之为策略。如心跳超时判断,服务重启次数定义,服务器之间的优先级定义等

 

Converted from CHM to HTML with chm2web Pro 2.85 (unicode)