快捷搜索:   服务器  安全  linux 安全  MYSQL  dedecms

Microsoft Windows 2003集群攻略(2)

 

图 22. 使用“群集管理器”配置心跳。

4. 单击“确定”。

5. 右击“公用”,然后单击“属性”(如下方图23所示)。

6. 单击选定“针对群集应用启用该网络”复选框。

7. 单击“所有通信(混合网络)”,然后单击“确定”。

 

 

图 23. “公用属性”对话框。

心跳适配器优先化

配置完群集服务如何应用网络适配器的角色后,下一步是对内部群集通信应用进行优先排序。这仅适用于两个或两个以上被配置为节点对节点通信的网络。屏幕右边的优先级箭头指定了群集服务使用各个网络适配器在节点间进行通信的先后顺序。群集服务总是尝试使用列于首位的网络适配器进行节点间的远程过程调用(RPC)通信。只有当群集服务无法使用第一个网络适配器进行通信时,才会使用列表上的下一个网络适配器。

1. 启动“群集管理器”。

2. 在左窗格中,右击群集名称(位于左上角),然后单击“属性”

3. 单击“网络优先级”选项卡,如下方图24所示。

 

 

图 24. “群集管理器”中的“网络优先级”选项卡。

4. 确认“专用”网络列于最顶部。使用“上移”或“下移”按钮,更改优先顺序。

5. 单击“确定”。

配置群集磁盘

· 启动“群集管理器”,右击您想从群集删除的任何磁盘,然后单击“删除”。

注意:默认状态下,所有磁盘并不在相同的总线上,因为系统磁盘将为它们创建物理磁盘资源(Physical Disk Resources),并对其进行群集。因此,如果节点拥有多条总线,可能列出的某些磁盘将无法用作共享存储,例如:内部SCSI驱动器。应该从群集配置删除这些磁盘。如果您计划对某些磁盘实施“卷装载”(Volume Mount)点,您可能要删除这些磁盘的当前磁盘资源,删除驱动器号,然后创建一个未分配驱动器号的新的磁盘资源。

仲裁磁盘配置

“群集配置向导”自动选择将作为仲裁设备的驱动器,并将使用50 MB以上的最小分区。您可能要把自动选择的磁盘更改为您自己专门指派的仲裁磁盘。

配置仲裁磁盘

1. 启动“群集管理器”(CluAdmin.exe)。

2. 右击位于左上角的群集名称,然后单击“属性”。

3. 单击“仲裁”选项卡。

4. 在“仲裁资源”列表框中,选择一个不同的磁盘资源。在下方图25中,“仲裁资源”列表框中所选定的是“磁盘Q”。

 

 

图 25. “仲裁资源”列表框。

5. 如果磁盘拥有的分区不止一个,单击您要在其中保存群集指定数据的分区,然后单击“确定”。

创建一个启动延迟

当出现所有的群集节点均同时启动并尝试附加到仲裁资源的情况时,群集服务可能无法启动。例如:在发生电源故障后,同时对所有节点恢复电力时,可能出现这种情况。要避免这类情况的发生,增加或减少“显示操作系统列表用时”设置。要找到该设置,单击“开始”,指向“我的电脑”并右击鼠标,然后单击“属性”。单击“高级”选项卡,然后在“启动与恢复”下方,单击“设置”。

测试安装:在“安装”程序结束后,有好几种验证群集服务安装的方法。其中包括:

· 群集管理器:如果仅完成了节点1的安装,启动“群集管理器”,然后尝试连接到群集。如果已安装了第二个节点2,在任意一个节点上启动“群集管理器”,然后确认第二个群集显示在列表上。

· “服务”小程序:使用“服务”小程序确认群集服务已显示在列表上并已启动。

· 事件日志:使用“事件查看器”检查系统日志中的“ClusSvc”条目。您会看到有关确认群集服务已经顺利形成或加入一个群集的条目。

· 群集服务注册表项:确认群集服务安装程序将正确的项写入注册表。您可以在HKEY_LOCAL_MACHINE\Cluster下找到许多注册表设置。

· 单击“开始”,单击“运行”,然后键入“虚拟服务”名称。确认您可以连接并看到资源。

测试故障转移(验证资源将执行故障转移)

1. 依次单击“开始”、“程序”和“管理工具”,然后单击“群集管理器”,如下方图26所示。

 

 

图 26. “群集管理器”窗口。

2. 右击“磁盘组1”组,然后单击“移动组”。该组及其所有资源将转移到另一个节点。稍后,“磁盘F:、G:”将在第二个节点上实现联机。在窗口中观察该转移。退出“群集管理器”。

恭喜!您已经完成了所有节点上的群集服务配置。服务器群集已经完成可以运作了。您现在可以准备安装群集资源,比如:文件共享、打印机卷筒、诸如分布式事务协调器(Distributed Transaction Coordinator)、DHCP、WINS等群集识别服务、或者诸如Exchange Server或SQL Server等群集识别程序。

附录 高级测试

现在,您已经配置好了您的群集并验证了基本的功能和故障转移,您可能想执行一系列的故障情境测试,来演示预期的结果,并确保群集在发生故障时会正确地进行响应。并不是在每一次实施时都需要进行这种程度的测试,但是如果您刚开始接触群集技术,而且不熟悉群集的响应方式,或者您正在自己的环境中实施一个新的硬件平台,这将有助于进行深入的了解。所列出的预期结果是针对结合默认设置的干净群集配置,并未考虑任何用户自定义的故障转移逻辑。这不是一个包含所有测试的完整列表,而顺利完成这些测试并不能认为已经得到了“许可”或准备好进行生产运作。

测试:启动“群集管理器”,右击一个资源,然后单击“启动故障”。该资源将进入故障状态,然后将重新启动并在同一节点上回到联机状态。

预期结果:资源将在相同的节点上返回联机状态

测试:在相同的资源上,再执行上方“启动故障”测试三次。在第四次故障时,资源将对群集中的另一个节点执行故障转移。

预期结果:资源将针对群集中的另一个节点实施故障转移

测试:将所有资源转移到一个节点上。启动“计算机管理”,然后单击“服务与应用程序”下方的“服务”,停止群集服务。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。

预期结果:资源将针对群集中的另一个节点实施故障转移

测试:将所有资源转移到一个节点上。在该节点上,单击“启动”,然后单击“关闭”。这将关闭该节点。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。

预期结果:资源将针对群集中的另一个节点实施故障转移

测试:将所有资源转移到一个节点上,然后按服务器前方的电源按钮将其关闭。如果您有一台符合ACPI(高级配置和电源接口)标准的服务器,该服务器将执行“紧急关闭”功能进行关闭。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。

297150 ACPI计算机上的电源按钮可能强制执行紧急关闭(Power Button on ACPI Computer May Force an Emergency Shutdown)

预期结果:资源将针对群集中的另一个节点实施故障转移

警告:执行“紧急关闭”测试可能导致数据遭破坏和丢失。不要在生产服务器上执行该测试。

测试:将所有资源转移到一个节点上,然后拔掉服务器的电源线模仿一个硬故障。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。

预期结果:资源将针对群集中的另一个节点实施故障转移

警告:执行硬故障测试测试可能导致数据遭破坏和丢失。这是一个极端测试。确认您已备份了所有关键数据,然后在您自己的磁盘上执行该测试。不要在生产服务器上执行该测试。

测试: 将所有资源转移到一个节点上,然后拔掉该节点的公用网络电缆。IP地址资源将失效,组将针对群集中的另一个节点执行故障转移附加信息。预期结果:资源将针对群集中的另一个节点实施故障转移

测试:拔掉专用心跳网络的网络电缆。心跳流量将针对公用网络执行故障转移,同时不会执行其它故障转移。如果发生了其它故障转移,请参见本文档前面有关“配置专用网络适配器”的部分。

预期结果:不会进行其它任何故障转移或资源故障转移

SCSI驱动器安装

本附录提供一套针对SCSI驱动器安装的一般性指导说明。如果SCSI硬盘供应商的指导说明与此处的指导说明相冲突,请遵照供应商所提供的指导说明。

硬件要求中所列的SCSI总线必须在安装群集服务器之前予以配置。配置涉及:

· SCSI设备。

· SCSI控制器和硬盘,以便其可以正确地运行于共享SCSI总线。

· 正确端接总线。共享SCSI总线必须在总线的每个终端上均拥有一个端接器。群集的各个节点间可能拥有多条共享SCSI总线。

除了以下几页信息外,请参考您的SCSI设备制造商的文档,或者可以向美国国家标准协会(American National Standards Institute,ANSI)索取SCSI规格说明。ANSI网站包含一个可用于搜索SCSI规格说明的目录。

配置SCSI设备

共享SCSI总线上的每个设备都必须有一个唯一的SCSI标识号(ID)。由于多数SCSI控制器默认为SCSI ID 7,因此配置共享SCSI总线包括将控制器上的SCSI ID号码更改为另一个号码,比如:SCSI ID 6。如果共享SCSI总线上的磁盘不止一个,每个磁盘都必须拥有一个唯一的SCSI ID号码。

端接共享SCSI总线:有几种端接共享SCSI总线的方法,其中包括:

· SCSI控制器

SCSI控制器具有可用于端接总线的内部软端接,但是不推荐对群集服务器使用该方法。如果通过该配置关闭一个节点,SCSI总线将被不正确地端接,而且不能正常地运作。

· 存储盒

存储盒也具有内部端接。如果存储盒位于SCSI总线的末端,其内部端接可用于端接SCSI总线。应该将其关闭。

· Y电缆

Y电缆可用于连接位于SCSI总线末端的设备。外部活动端接器随后可以附加到Y电缆的一个分支,以便端接SCSI总线。该端接方法要求禁用或移除设备可能拥有的任何内部端接器。图 27 描绘应该如何对SCSI群集进行物理连接。

 

 

图 27. SCSI群集硬件配置示意图。

注意:对于任何位于共享总线末端的设备,都必须禁用其内部端接。Y电缆和活动端接连接器均是推荐的端接方法,因为即使节点未联机时,它们也能提供端接。

存储区域网络的考虑事项

在Windows Server 2003服务器群集中,有两种基于光纤通道的存储支持方法:仲裁环和交换架构。 重要:在对这两类光纤通道实施进行评估时,阅读供应商的文档,并确定您了解每种实施的指定特性和限制。

虽然 “Fibre Channel”(光纤通道)这一术语暗示了光纤技术的应用,但是也允许使用铜制同轴电缆进行互连。

仲裁环(FC-AL)

 

 

光纤通道仲裁环(Fibre Channel arbitrated loop,FC-AL)是一套相互连接形成一个单一环路的节点和设备集。FC-AL提供了一个能将多达126个设备连接形为一个单一网络的经济的方法。通过SCSI,结合集线器配置的FC-AL服务器群集最多可支持两个节点。FC-AL如图 错误!未找到引用源。.1所示。

1 FC-AL连接

FC-AL以相对静态的配置为双节点和少量设备提供解决方案。环路上的所有设备共享介质,而且从一个设备传输到另一个设备的任何数据包都必须通过所有中间设备。

如果一个双节点服务器群集可以满足您对可用性的需求,那么FC-AL部署就具有以下几个优势:

· 成本费用相对较低。

· 环路可得到扩展以增加存储(虽然不能添加节点)。

· 环路易于光纤通道供应商进行开发。

环路的劣势是难以在组织中进行部署。由于环路上的每个设备均共享同一个介质,因此群集中的整体带宽变窄了。有些组织还可能受到126个设备上限的限制。

交换架构(FC-SW)

对于任何超过两个节点的群集,光纤通道交换架构(Fibre Channel switched fabric,FC-SW)是唯一受支持的存储技术。在FC-SW中,设备在使用光纤通道交换器的多对多拓扑结构中进行连接(如图 错误!未找到引用源。.2所示)。

2 FC-SW连接

 

 

当一个节点或设备同FC-SW中的另一个节点或设备进行通信时,通信源和通信对象建立起一个点对点连接(类似一个虚拟电路),并直接进行相互通信。架构本身路由选择从通信源到通信对象的数据。在FC-SW中,并不对介质进行共享。任何设备都可以同其它任何设备进行通信,并以最高总线速度实现通讯。这是一个完全可伸缩的企业解决方案,因此强烈建议同服务器群集进行部署。

FC-SW是SAN中所采用的主要技术。FC-SW的其它优势包括:易于部署,可支持数百万个设备,以及提供故障隔离和改换路由的交换机。另外,不存在像FC-AL中的共享介质,允许更快地进行通信。但是,要知道FC-SW对于供应商来说难以开发,而且交换机的价格昂贵。供应商还必须考虑来自不同供应商或制造商的组件间的互操作性问题。

结合服务器群集使用SAN

对于任何大型群集部署,建议您使用存储区域网络(SAN)进行数据存储。虽然较小的SCSI和独立光纤通道存储设备可以随服务器群集一起运作,但是SAN提供高级容错能力。

SAN是一套连接到常规通信和数据传输基础结构(在Windows Server 2003群集中为FC-SW)的相互连接的设备(比如:磁盘和磁带)和服务器。SAN允许多个服务器接入存储池,同时任何服务器都可以在其中潜在地访问任何存储单元。

注意:提供SAN架构组件和软件管理工具的供应商拥有针对构建、配置、监控和管理SAN架构的广泛的工具。联系您的SAN供应商,了解有关针对您的特殊SAN解决方案的详细信息。

SCSI复位

Windows服务器群集的早期版本假定对于共享磁盘的所有通信应作为一个独立的SCSI总线。该做法略具破坏性,并且没有利用光纤通道的更高级的特性来提高仲裁性能和减少通信中断。

Windows Server 2003中的一个关键改进是群集服务发出一个命令用以打断一个RESERVATION,而StorPort驱动程序可以针对光纤通道拓扑结构上的磁盘执行目标或设备复位。在Windows 2000服务器群集中,整个总线范围的SCSI RESET(复位)得到了发布。这导致总线上的所有设备被断开连接。当SCSI RESET被发布时,很多时间被花在复位可能无需进行复位的设备上,比如:CHALLENGER节点可能已经拥有的磁盘。

Windows 2003中的复位按照以下顺序进行:

1. 目标逻辑单元号码( LUN)

2. 目标SCSI ID

3. 整个总线范围的SCSI RESET

注意

目标复位需要主机总线适配器(HBA)驱动程序中的功能。驱动程序必须是针对StorPort而不是SCSIPort编写的。使用SCSIPort的驱动程序将如同在Windows 2000中使用Challenge和Defense一样。联系HBA制造商,确定其是否支持StorPort。

SCSI命令:群集服务使用下列SCSI命令:

SCSI保留:该命令由主机总线适配器或控制器发出,用于维持SCSI设备的所有权。被保留的设备拒绝所有来自其它主机总线适配器的命令,除了最初对其进行保留的主机总线适配器,即发起者。如果发出了一个总线范围的SCSI复位命令,保留将散失。

SCSI释放:该命令由拥有所有权的主机总线适配器发出;释放SCSI设备,以便让其它主机总线适配器对其进行保留。

SCSI复位:该命令中断目标设备上的保留。有时该命令大体上指“总线服务”。 以下部分概述一些直接影响服务器群集部署的SAN概念。

HBA

主机总线适配器(HBA)是将群集节点连接到SAN的接口卡,其连接方法类似于网络适配器将服务器连接到典型的Ethernet网络的方式。但是,HBA并网络适配器更加不容易配置(除非HBA由SAN供应商预配置)。所有节点中的HBA必须是完全一致的,而且必须采用相同的驱动程序和固件版本。

分区和LUN屏蔽

分区和LUN屏蔽是SAN部署的基础,尤其是它们涉及Windows Server 2003群集部署。

分区

许多设备和节点都可以附加到SAN。由于数据保存在一个单一的“cloud”(存储云)或存储实体中,控制哪些主机可以接入特定设备是很重要的。区域划分允许管理员在逻辑卷中对设备进行分区,从而将设备保留在一个卷中以便为服务器群集所用。这意味着,逻辑存储卷中群集节点和设备间的所有交互具备隔离在区域边界内;而其它SAN的非群集成员则不会受群集行为的影响。

3对两个SAN区域进行逻辑描述(A区域和B区域),每个区域均包含一个存储控制器(分别为S1和S2)

3 分区

 

 

在该部署中,节点Node A和节点B可从存储控制器S1访问数据,但节点节点C不可以。节点C可以从存储控制器S2访问数据。

分区需要在硬件层次进行实施(结合控制器或交换机),而不能通过软件来实现。主要的原因是:分区也是一个针对基于SAN的群集的安全机制,因为未经授权的服务器无法访问区域内的设备(访问控制由架构中德交换机来执行,因此主机适配器无法访问未经配置的设备)。如果通过软件形式进行分区,如果软件组件出现故障,群集将无法得到安全保障。

顶(0)
踩(0)

您可能还会对下面的文章感兴趣:

最新评论