Exchange 2003 设计与体系结构 (2)
OTG 成功地部署 Exchange 2003 需要综合许多不同的元素。不仅需要新的 Exchange 服务器软件,而且也需要其它的许多新技术,例如来自第三方资源的服务器、存储硬件和 Microsoft Windows Server 2003 与 Microsoft Office 2003 软件,OTG 才能从部署中获得最大的优点。有关网络设计的注意事项(包括带宽需求和备份与恢复的 SLA 协议)也已考虑到。做出的设计决策所导致的变化也给 OTG 带来了操作变化。
拓扑结构
OTG 以 Windows 2000 Server 上的 Exchange 2000 拓扑结构为基础来设计 Exchange 2003 部署的拓扑结构。Active Directory 在 Exchange 2000 的组织结构和管理需求中是一个关键因素。OTG 能够将现有的 Active Directory 结构用于 Exchange 2003 部署。
当开始最初的 Exchange 2003 部署时,OTG 已经深入地参与了 Windows Server 2003 在其全球网络基础结构中的部署。这一发展非常关键,因为虽然 Exchange 2003 能够在 Windows 2000 Server 上运行,但 Exchange 2000 却不能在 Windows Server 2003 上运行。在 Windows Server 2003 上运行 Exchange 2003 能够给 Exchange 提供许多额外的优点,对此我们将在后面详细讨论。这些优点使得 OTG 能够开始计划实施整合全球通信基础结构中的服务器数量,这促进了 Exchange 2003 拓扑结构的设计。
移动性设计和配置
Microsoft 对移动性的定义已经增长到包括通常与移动技术无关的系统。使用 OTG 移动基础结构的设备不仅包括 Pocket PC 和 Smartphone。使用运行 Outlook 2003 的笔记本电脑或 Tablet PC 的 Microsoft 员工仅使用一条 Internet 连接就能够利用 RPC over HTTP 来访问 Microsoft 企业 Exchange server。任何远程的、可以访问 Internet 的计算机都可以作为 Microsoft 员工的 OWA 客户端。所有这些技术都通过同一个移动基础结构访问 Exchange 2003。
在 Exchange 2003 中的移动性增强使得 OTG 能够利用附加的服务器整合和改良的安全性修改其移动消息基础结构的设计。OTG 中的移动基础结构包括如下的一些服务:OWA、OMA、EAS、RPC over HTTP 以及最新通知。
前端服务器整合
除了邮箱服务器站点与服务器整合工程之外,Exchange 2003 还使得 OTG 能够整合它的移动服务器基础结构(也称为 Exchange 前端服务器)。OTG 不再需要在每个域中部署一个多服务器基础结构来提供移动服务。另一方面,与 Exchange 2000 一起部署 OWA 和 MIS需要一台 OWA 专用的 Exchange 前端服务器和用于 MIS 的独立服务器。使用 Exchange 2003 时,所有的移动通信特性都驻留在一台物理前端服务器上,使得 OTG 能够整合专门支持移动特性的前端服务器的数量。
OTG 将它的服务器数量从 7 台 OWA 服务器和 7 台 MIS 服务器(在 Microsoft 企业网中,每个域一套)减少为 7 个提供 OWA、OMA、EAS 和 RPC over HTTP 服务的 Exchange 前端站点。全球的每个 Exchange 前端站点支持一对非集群的、网络负载平衡的 Exchange 前端服务器。虽然 OTG 在理论上可以整合为一套 Exchange 前端服务器,但由于巨大的地理距离在 Exchange 前端服务器和区域 Exchange 邮箱服务器之间造成的网络延迟,工程团队决定保留多套前端服务器。如果 OTG 整合为一套,用户性能可能会受影响。在那些使用低速 Internet 连接或移动设备的用户中,网络延迟将显得尤其明显。
移动安全性增强
OTG 还将在 Exchange 2003 中用于 OWA 增强的安全性特性用于其前端服务器部署,例如基于时间的注销和基于表单的身份验证。和 Exchange 2000 下的 OWA 不同,当用户导航到一台前端服务器时会出现一个安全的、基于 HTML 表单的身份验证界面而不是基于 NTLM 的对话框。除了登录身份证书之外,该表单还会问两个额外的问题:
1.用户是从一个公共信息亭/共享计算机登录还是从一台私有的家庭计算机登录?
2.用户希望使用基础的还是高级 OWA 用户界面(UI)特性集?(答案通常依赖于连接是快速还是慢速数据链路。)
OWA 登录页面中显示的所有 UI 元素都可以自定义,从而能够包含公司图标、到区域前端服务器的特殊 URL、自定义用途的指令文本,等等。OTG 使用这些特性创建其自定义 OWA 页面。
一旦用户填满表单并单击 Log On,数据就被封装并通过 SSL 连接发送到用户指定的(在他们导航到特定服务器获取身份验证表单时指定的)前端服务器。一旦通过 Web 发出登录证书,本地客户端计算机上会创建一个特殊的超时 cookie。取决于用户是否指示客户端计算机为公用还是私有,该超时 cookie 开始倒计数一个非活动阀值。如果达到阀值时一直没有活动发生,会话连接将自动关闭,如果用户想要再次访问 Exchange 邮箱必须再次进行身份验证。OTG 将超时 cookie 设置为在公用或共享计算机上 15 分钟后关闭非活动会话,而在用户私有的家庭计算机上,非活动会话被设置为在两小时非活动时间后关闭。企业可以对会话超时时期进行自定义以满足任何安全性要求。
为了提供额外的安全性水平,OTG 选择了部署 Internet 安全性与加速(ISA)服务器作为所有 Exchange 前端服务器的反向代理。这就使得 Exchange 2003 的前端服务器能够放在防火墙后面,安全地位于企业网络之内,不用再直接与 Internet 相连。
服务器设计与配置
OTG 为其 Exchange 2003 部署设计服务器平台时,考虑了各种因素。除了一般的系统可靠性和厂家支持等硬件问题之外,关键的技术问题还包括新的处理器技术、集群实施、服务器设计,以及移动性问题。结果,OTG 将其所有的 Exchange 邮箱服务器都转移到集群环境中运行。
处理器
处理器技术不断进步,提高了处理速度,增加了板上集成缓存的数量和大小,还增加了能够并行处理的任务数量。Exchange 2000 基础结构的大部分服务器都基于 Intel Pentium II 和 Pentium III 处理器,频率从 500 到 700 MHz,前端总线(FSB)为 100 或 133 MHz。
鉴于自 OTG 部署 Exchange 2000 之后处理器技术的突飞猛进,OTG 决定在基于采用 400 MHz FSB 的 Intel Xeon Processor MP 超线程(Hyper-Threading)处理器的新系统上部署 Exchange 2003。
超线程使单个处理器能够像两个共享相同的内存总线和缓存的独立处理器那样处理信息。实际上,OTG 实施的四处理器超线程服务器在功能上就像一台虚拟的 8 处理器服务器。但是,一个具备超线程技术的处理器并不能提供与真实的双处理器系统完全相同的性能。因为超线程处理共享相同的板上集成缓存和主内存总线,OTG 测试的结果是超线程处理器与相同块速度的非超线程处理器相比,能够带来大约 25% 的实际 Exchange 性能提升。
集群服务器设计
OTG 购买的所有用于安装 Exchange 2003 邮箱服务器的新服务器都被设置为集群,并且都装备了 Xeon Processor MP 微处理器。
利用 Exchange Server 2003、Windows Server 2003、第三方 SAN 技术、以及更快的服务器,OTG 决定创建一个提供更高的操作可靠性和更低的管理开销的集群服务器设计。他们的设计选择能够给他们带来下面的一些特殊优点:
•通过将活动节点邮箱服务器自动故障转移到非活动节点服务器可以减少服务的停机时间。
•Clustered Exchange Virtual Server(EVS)故障转移达到低于两分钟的性能,不论与 SAN 相连的故障节点内包含的邮箱数据量有多大。
•同时增加了 EVS 的数量和集群内每 EVS 所支持的 SG 数量。每个 SG 都被设置为使用三个 LUN。这些 LUN 使用卷装入点,使所用的驱动器号数量最小化。
•每服务器为更多邮箱提供宿主服务,从而支持了服务器整合。
•通过将 75 个位置的 113 台邮箱服务器整合为 7 个位置的 38 个服务器,减少了管理和维护开销。
•减少了数据库恢复对用户造成的潜在停机时间的影响(原来为每用户六小时或更多)。
•将备份和恢复时间减少为低于一小时。
•服务器可用性达到 99.9%,2004 财政年度的 SLA 目标为达到 99.99%。
•支持实施滚动升级,可以加快服务器操作系统和应用程序升级和安装补丁的速度,同时将服务中断的影响最小化。
•将用户邮箱限制提高了一倍(到 200 MB)
OTG 的设计目标是每 SAN 支持 8,000 邮箱,邮箱容量限制为 200 MB,集群服务器可用性达到 99.99%,以及备份与恢复时间低于每数据库一小时。主企业目录林中的数据中心 EVS 的设计容量达到 4,000 个邮箱。
多节点集群设计
OTG 决定采用使用多个活动(在线)和非活动(离线)节点的多节点集群设计。此设计使得一个故障的活动节点能够立即被一个相同配置的非活动节点代替,并将故障活动节点的资源,例如存储,立即转移给该非活动节点,从而确保故障转移最大限度地减少对终端用户体验的影响。
OTG 实施了两种独立的非活动节点类型: 主要非活动节点和被选非活动节点。主要非活动节点是一个与活动节点服务器配置相同硬件的服务器。这使得活动节点故障转移能够恢复完全的功能。备用非活动节点是一个配备较低性能的硬件的服务器,主要用于将磁盘数据导向磁带之类的任务。它还充当降低性能的故障转移服务器。两种类型的非活动节点都被用于软件的滚动升级。
OTG 的多节点集群设计同时使用主要和备用非活动节点。和主要非活动节点不同,备用非活动节点是一些较小的服务器,主要用于执行磁盘到磁带的备份任务。当需要对操作系统和/或 Exchange 进行滚动升级时,OTG 使用集群中所有的非活动节点。替代了将活动节点故障转移到主要非活动节点、升级离线的活动节点,然后将已升级的节点再恢复为活动状态并对每个活动节点滚动执行这一循环过程,OTG 同时部署主要非活动节点和备用非活动节点的方法加速了该过程。OTG 首先修补所有离线的非活动节点,然后将与可用的非活动节点数量相同的活动节点故障转移。然后并行地升级这些离线节点并在就绪时使它们恢复服务。此过程重复一次以升级剩下的一个活动节点服务器。
OTG 集群设计
OTG 在主企业目录林中为 Exchange 2003 部署实施了两种主要的集群设计: 一个区域设计和一个总部数据中心设计。在 Level B Test 有限使用产品目录林中还部署了一个独立的、可伸缩性的身份验证设计。全都使用多节点、活动/非活动集群设计。表 4 显示了 OTG 的集群配置。
表 4 每个部署的集群设计规格
区域总部Level B Test
四处理器活动节点的数量341
四处理器主要非活动节点的数量111
双处理器备用非活动节点的数量120
每活动节点的 SG 数量444
每活动节点的邮箱数量2,7004,0005,000
每活动节点的数据库数量202020
每数据库的邮箱数量135200250
数据库的最大容量27 GB40 GB50 GB
每集群的邮箱数量8,00016,0005,000
•区域设计。区域集群实施的服务器规格包括每集群一个 SAN 模组,带有三个活动节点、一个主要非活动节点、以及一个备用非活动节点(表示为 AAAPp)。
•总部设计。总部集群实施在设计上是类似的。它包括两个 SAN 模组,四个活动节点,一个主要非活动节点,以及两个备用非活动节点(表示为 AAAAPpp)。
•Level B Test 森林设计. Level B Test 服务器规格与区域集群在设计上类似,但拥有更大的邮箱容量。它包括一个 SAN 模组,一个活动节点,以及一个主要非活动节点(表示为AP)。
为了以最佳的价格获得最好的性能,OTG 将四处理器的 1.9 GHz Intel Xeon Processor MP 服务器作为它的活动和主要非活动集群节点的标准,用于区域和总部数据中心部署。对于备用非活动集群节点,OTG 使用双处理器的 2.4 GHz Intel Xeon Processor MP 服务器。得益于这个新的处理平台,OTG 的 Exchange 2003 基础结构获得了巨大的性能提升。
OTG 的集群设计有力支持了每个 Exchange 服务器的邮箱数量和容量的同时增长。它有助于消除第二阶段的备份过程对用户的性能影响,因为它将该阶段的备份过程交给了集群内的非活动服务器,从而维持了 SLA。
存储设计与配置
OTG 的存储配置的全部设计都是基于有效地管理高峰期的磁盘 I/O 进行的。OTG 研究了其 Exchange 2000 消息存储基础结构的使用趋势,发现高峰期的使用通常发生在星期一的上午。OTG 接受了这一使用数据并将其作为设计 Exchange 2003 SAN 解决方案的基线。OTG 计算了每个邮箱在高峰期平均每秒的磁盘 I/O 数量。他们将邮箱数量乘以 I/O 率的结果作为一个服务器的总 I/O 率。
例如,在一个支持 4,000 个邮箱的服务器上,如果高峰期的 I/O 率是每邮箱每秒 1.2 次,那么该服务器总的 I/O 率等于每秒 4,800 次 I/O。在 Exchange 中每次 I/O 传输的数据量是 4 KB,在这样的 I/O 下,约等于每秒 20 MB 的 I/O。再考虑到在总部数据中心配置中每个 SAN 模组支持两个主机,则 I/O 率倍增为大约每秒 10,000 次 I/O。
在 OTG 为满足这些要求所进行的设计中,OTG 选中的每个 SAN 模组能够支持最高每秒 12,000 次 I/O,这为不寻常的活动高峰提供了边际空间,但是预期对于正常的 I/O 活动高峰时段应该足够了。任何超过这个数字的巨大负载都有可能导致磁盘读写延迟,它将会给连接到该 SAN 的所有邮箱造成负面影响。OTG 系统设计师在综合考虑预期的情况、额外硬件的成本、以及 Microsoft Operations Manager 中的检测与报警改进之后,认为这是一个可以接受的风险。
为了确定任何企业的消息存储需求,必须测量每邮箱用户每秒的平均高峰时段 I/O、邮箱的最大容量、项目在已删除项目保留区内保留的时间长度,以及在一个组织中典型用途的电子邮件模式的流通率。这些是 OTG 在设计其 Exchange 2003 SAN 解决方案时所考虑的因素。
OTG 给每个支持邮箱存储的 LUN 分配了额外的容量,其目的是减少未来出现意外增长时对重新分配大小的需求。LUN 的大小被设置为能够支持 6.5 个“毛边因子(fluff factor)”为 1.4 的生产数据库。
OTG 使用毛边因子来指根据已删除项目保留区、数据库开销、不受限邮箱等在磁盘上为一个给定的邮箱所分配的平均容量。例如,为 Exchange 2000 的用户创建 100 MB 邮箱实际上需要为他们每人保留 140 MB 空间。1.4 这个值是多年来支持 100 MB 邮箱的 Exchange 生产服务器的趋势,并仍然是设计新的支持 200 MB 邮箱的新解决方案的基础。
OTG 的 100 MB 邮箱大小限制是在 Exchange 级上通过策略设置和施行的硬性快速磁盘配额限制,但是如果用户用完了全部 100 MB 的可用空间,这经常是因为他们在后台超过了该数量。这常常在用户从邮箱中删除电子邮件时发生。电子邮件实际上不是从服务器的邮箱数据库中立即删除。而是暂时保留在数据库中一个名为已删除项目保留区的地方。只有在三天之后被删除的电子邮件才真正从邮箱数据库中清除。OTG 在规划它的 Exchange 2003 存储需求时需要考虑该级别的使用开销。
此外,OTG 为每个数据 LUN 分配能够支持六个半数据库的容量,即时他们在生产中只需要支持五个数据库。这使得他们能够在同一个 LUN 上复制单个受损的数据库,然后对它进行完整性检查。这种使用同一个 LUN 的能力使得 OTG 能够对数据库损坏做出最快的响应。
选择一个 SAN
像许多组织一样,OTG 决定干净利落地从本地(基于主机的)直接相连的 SCSI 存储转为 SAN 相连的存储。在过去,服务器存储被认为是一个关键的服务器组件,与服务器硬件紧密相联。SAN 技术使得存储变得更像是一种公共服务;它不再与服务器紧密相关。虽然对这种方案的评价是毁誉参半,但 OTG 仍然选择了 SAN 存储,因为它满足 OTG 对未来的性能、可伸缩性和容量的需求。这些需求是无法通过本地附加存储阵列来满足的。
Exchange 2003 的部署为 OTG 提供了一个机会 - 评估自最新研究以来 SAN 技术是否成熟。OTG 开始了一项检验和测试 SAN 厂商的技术和产品的工程。OTG 要求任何在 Microsoft 实施的新的 SAN 技术标准都必须能够很方便地从远程位置进行支持。OTG 要求存储解决方案易于部署、模块化设计、并且便于远程管理。
在 OTG 使用的每个 HP StorageWorks Enterprise Virtual Array 5000(eva5000)SAN 中有 168 个磁盘。每个 SAN 模组支持大约 8,000 个 200 MB 邮箱。每个 SAN 模组在磁盘延迟不明显的前提下每秒能够处理约 12,000 次 I/O。总部数据中心的每个邮箱将支持 4,000 个邮箱并预期在高峰时段处理每秒 5,000 到 6,000 次 I/O。因此,总部数据中心的一个 SAN 模组支持两台邮箱服务器。区域邮箱服务器将只支持低于 2,700 个邮箱,因此三个区域服务器的高峰时段负载由一个 SAN 模组支持。
使用卷装入点的存储分配
OTG 在 Windows Server 2003 中对卷装入点使用了新的集群支持,从而使驱动器号不再成为阻碍在单个集群中放置多个 Exchange 实例的可伸缩性障碍。选中的设计中每个数据 LUN(每 SG 一个)使用一个驱动器分配,每个集群节点四个数据 LUN(OTG 将每个节点设置为支持一个 Exchange 虚拟服务器)。相应的日志 LUN 被设置为卷装入点集群资源,每个都依赖它的父数据 LUN。在该设计中还包括一个专用的队列 LUN,它也作为一个卷装入点集群资源,依赖于分配给 SG1 的数据 LUN。
利用卷装入点使得 OTG 能够使用四个驱动器号来维护九个物理 LUN,从而配置最佳的磁盘布局。利用这种设计,4 个 Exchange 实例只需使用 16 个驱动器号就能够映射 36 个物理 LUN。
后续的 LUN 用于支持在线备份到磁盘,每个节点每 SG 分配一个磁盘。分配给每个节点的 SG1 的磁盘支持三个额外的卷装入点 LUN 作为 SG2、SG3 和 SG4 的备份目标。备份资源是通过 16 个通过 4 个驱动器号寻址的物理 LUN 设置的。
图 1 描述了第一个节点的驱动器号分配和用于支持在线备份设备的相应分配。

图 1:每节点的驱动器号分配。
注:在图 1 中,VMP 代表一个卷装入点。
总体上,在集群设计中总共 53 个物理 LUN 可以使用 21 个驱动器号来寻址。这使得 OTG 很容易利用通过控制器和光纤信道适配器(FCA)分布的 LUN 对磁盘子系统进行优化,从而确保满足在 Microsoft 生产环境内的高峰磁盘传输要求。
使用 Secure Path 的冗余存储系统路径
OTG 的 SAN 技术部署包括一个 I/O 设计,它不仅提供冗余性而且还使用这种冗余性来优化数据流。
OTG 使用 HP StorageWorks Secure Path for Windows 在它的 SAN 基础结构内提供许多优点。Secure Path 提供了三个关键的优点:
1.消除了支持服务器和 SAN 互连的单点故障的风险。
2.允许 LUN 分配以维持一个忙碌的 Exchange 主机所需要的最优的 I/O,减少高峰时段磁盘读/写延迟并极大地提升到磁盘的在线备份吞吐量。
- 最新评论
