服务器虚拟化项目实施六步曲(上)

日期: 2009-02-04 作者:古月天 来源:TechTarget中国 英文

  毫无疑问,服务器虚拟化已经在IT行业刮起了一场风暴。这项技术为显著减少停机时间、增强灵活性、大幅提高硬件利用效率提供了一种经济高效的方式。

  不过,中小型企业常常发现很难评估虚拟化技术是否适合自己;如果适合,又该如何利用较少的IT人员和有限资金来采用它。大公司拥有水平较高的IT人员,比较容易弄清楚这个问题,但仍面临一定难度。

  无论你是大企业还是小公司,下面这个分六部分的虚拟化案例调查探讨了采用服务器虚拟化时应当考虑的一些主要方面和部署方法。每个部分介绍了虚拟化过程的一个关键阶段,借助虚构的Fergenschmeir公司介绍了任何公司都应当注意的一些问题、潜在错误及实际结果——你不太可能在典型的白皮书或案例调查中看到这些内容。

  下面不妨跟随Fergenschmeir的新基础架构经理Eric Brown、其上司Brad Richter、高层管理班子以及Eric领导的IT团队,看看Fergenschmeir对服务器环境采用虚拟化的过程中,这家公司经历了哪些成功和失败。

  第一个阶段:确定理由。

  在第一个阶段,IT团队探讨了部署服务器虚拟化的必要性。

  好几个方面促使Fergenschmeir考虑把服务器虚拟化部署到生产环境。2007年5月,基础架构经理Eric Brown刚聘用了夏季招来的实习生:Mike Beyer。Mike最初提出的其中一个问题是:“你们的服务器基础架构当中多少采用了虚拟化?”回答当然是没有。虽说软件开发团队一直在使用寥寥几个EMC VMware工作站和服务器来帮助开发过程,但他们之前没有考虑把虚拟化技术部署到生产环境。但是这个实习生提出的简单问题让Eric认真考虑起来。他还进行了一番研究。

  Eric先找自己的团队谈话。他询问了他们之前遇到的问题,看看虚拟化能不能解决这些问题。虚拟化显然有一些优点,比如虚拟访客服务器可灵活移动。另外再也用不着依赖特定的硬件;而且能够整合服务器、减少IT开销。

  一个月后出现了来自业务方面的实际动力。Fergenschmeir的CRM应用软件虽然未得到开发商的支持,却是业务关键型的;运行该应用软件的一台服务器出现了严重崩溃。谁也不知道如何重新安装应用软件,于是整整停机了四天,才让该应用软件恢复运行。虽然造成停机主要归咎于原来那家软件开发商倒闭了,但这次失败让整个IT部门饱受诟病,而Eric因祸得福,开始了在Fergenschmeir辉煌的职业生涯。

  最后促使虚拟化项目上马的却是Fergenschmeir的CEO Bob Tersitan喜欢看IT行业杂志的爱好。这种爱好的结果是,他经常发内容简短的邮件给Brad,可能会是这样“嗨,我刚看了介绍某个门户网站的文章。我们也做吧。下个月如何?我在船上,打我手机。”Brad通常会拖一拖,或者提交一些高得离谱的预算数字,那样Bob会把目光转移到更有成效的其他方面。这回,Bob在《InfoWorld》网站上看到了服务器虚拟化案例调查,于是发来邮件,要求实施服务器虚拟化,以解决Fergenschmeir长期遇到的问题。太好了!Eric已经完成了研究,现在又得到了高层的批准。这次失败因而成了一次机遇。

  第二个阶段:核查现状。
 
  在第二个阶段,IT团队进行了一番试运行,看看VMware果真能不能胜任。

  Fergenschmeir的基础架构经理Eric Brown很清楚服务器虚拟化如何有助于改善灾难恢复和利用率问题,于是他被委以重任。

  但Eric有些担心,因为自己的团队在虚拟化方面几乎没什么实战经验。实习生Mike Beyer是Eric身边最合适的人选,但是他从来没有从头开始设计过新的虚拟化架构,只是偶尔管理过而已。

  Eric还遇到了员工的阻力。Eric的两名服务器管理员Ed Blum和Mary Edgerton之前用过VMware服务器和微软虚拟服务器,觉得它们的性能不怎么样。首席数据库管理员Paul Marcos表示,他不愿意把数据库服务器部署到虚拟平台上,因为他看过声称虚拟磁盘I/O速率很低的文章。

  Eric和首席技术官(CTO)Brad Richter早已向CEO Bob Tersitan保证一个月内会拿出方案,于是尽管面临重重障碍,他们还是上路了。他们先阅读了介绍其他公司如何构建虚拟化系统的各种资料。Eric让Mike使用VMware ESX平台的试用版构建一个测试平台,因为选择这种平台在IT博客圈似乎很流行。

  没过几天,Mike建好了一台ESX服务器,上面运行着几个测试虚拟机。大家马上发现,虚拟化平台对硬件的要求与普通服务器不一样。测试服务器上的4GB内存不够用,无法同时运行三四个访客服务器;两个板上网络接口提供的网络带宽也不足以满足更多虚拟服务器的要求。

  但是即使存在这些局限,他们部署的测试虚拟机还是运行稳定,性能大大高于Eric团队之前的预期。连原先持怀疑态度的Paul都惊叹于磁盘的吞吐速率之高。他得出结论,许多工作组应用软件可能非常适合虚拟化,尽管他对要不要让虚拟机运行任务关键型数据库服务器并无把握。

  测试完毕后,Brad和Eric都很有信心,觉得能够在几周内把方案交给Bob。现在他们要做关键的规划工作。
 
  第三个阶段:规划容量。

  在第三个阶段,IT团队发现,服务器虚拟化规划并非易事。

  测试了服务器虚拟化软件、了解是否满足性能要求后,Fergenschmeir的几位IT主管随后要进行详细的部署规划。基础架构经理Eric Brown和CTO Brad Richter需要解决规划阶段的两个基本问题:首先,他们希望服务器扮演哪些角色?其次,可以对哪些服务器进行虚拟化处理?

  Brad先让他的团队给出一份清单,列出每个基于服务器的应用软件以及安装了应用软件的每台服务器。Eric由此画出了一份依赖关系树(dependency tree),表明哪些服务器和应用系统依赖对方。

  • 评估服务器角色

  Eric在画依赖关系树时清楚地发现,他们可不想为服务器分配与原来同样的应用软件。在数据中心的约60台服务器当中,只有4台直接负责约20个应用软件的连续运行。这主要是由于几台SQL数据库服务器被当作了“垃圾倾倒地”,许多不同应用软件的数据库都在上面,有时迫使某应用软件使用比它支持的更新或更旧的SQL版本。

  此外还存在有风险的依赖关系。比方说,五个重要的应用软件都安装在一台服务器上。反过来,Eric和Brad也发现存在效率很低的现象,比如五台服务器都用于部门级文件共享,纯属多余。

  Eric认为部署的虚拟化系统要避免这些缺陷,于是新架构必须消除不必要的冗余,同时把任务关键型应用软件分配到多台物理服务器上,尽量降低任何一台服务器出现故障的风险。这就意味着服务器数量从60台增至72台,服务器许可证的数量也相应增加。

  • 确定适合使用虚拟化的对象

  由于现已确定了架构,Eric要弄清楚哪些服务器可以使用虚拟化、哪些保持原状。弄清楚这个问题比他起先预料的来得困难。

  一个关键问题就是每台服务器的负荷,这个关键因素决定了需要多少个物理虚拟化主机。很明显,没有必要对正在充分利用硬件平台的应用负荷采用虚拟化。最初的测试表明,VMware虚拟机管理程序占用主机服务器约10%的原始性能,所以任何虚拟化主机的实际功能只有专用、非虚拟化物理主机的90%。利用率超过90%的任何应用软件都可能出现性能下降,也不适合服务器整合。

  但是获得利用率方面的这些数字并非易事。虽然在Windows系统上使用Perfmon系统监视器,或者在Linux系统上使用SAR等工具,很容易显示某服务器在自己的小环境中有多繁忙,但要表明这个小环境与另一个小环境有怎样的关系就不那么容易了。

  比方说,Thanatos(运行该公司医疗赔偿和福利管理软件的服务器)是时钟频率为2.8GHz的双插座、单核英特尔奔腾4系统,负荷平均只有4%。同时,Hermes(语音邮件系统)运行在时钟频率为2.2GHz的双插座、双核AMD皓龙275系统上,负荷平均为12%。这不但是两种完全不同的处理器架构,Hermes的处理器核心数量还是Thanatos的两倍。让问题更复杂的是,处理器的利用率不是惟一需要考虑的基本资源;在规划虚拟化基础架构时,内存、磁盘和网络的利用率显然同样重要。

  Eric很快明白,这就是为什么市面上有那么多的软件用于进行容量评估。如果他只有一二十台服务器要考虑,可能比较简单,他只要打开Excel、自己分析即可。那样他可以逐步对负荷进行虚拟化处理,看看实际利用率如何。但他知道,如果拿不出确切的预算方案,CEO Bob Tersitan和CFO Craig Windham不会有兴趣。

  于是经过一番研究后,Eric向Brad建议从外面请一家咨询公司来进行容量规划。Eric请当地的一个VMware合作伙伴进行评估,结果得知需要一两个月才能完成评估。咨询顾问表示,如果对服务器不进行至少一个月的监测,不可能得出服务器利用率方面完整而准确的分析结果。不然,分析结果将无法体现并非总是活动的流程(比如周末和月末的报告分析)的负荷。

  这样的延迟完全有必要,但这确实意味着Eric和Brad无法赶在Bob给实施方案所定的最后期限之前。幸好,Craig觉得有必要让方案尽可能准确,于是他的支持最终让Bob对延迟表示了理解。

  结果证明,这次延迟对Eric和 Bob有利无弊,因为还有其他许多规划任务根本没有完成,比如选择系统运行所需的软硬件。这段分析时期让他们有了喘息之机,可设法弄清楚自己不知道的方面。

  一段时间后最初的容量规划分析终于完成后,结果表明Fergenschmeir的应用服务器利用率大多数在10%或以下,这样可以对预计部署的72台服务器进行大规模整合。合理的配置需要八九个双插座、四核ESX主机,以便从容运行现有的应用软件,留出一定的增长空间,并且控制某个主机出现故障时的停机时间。

  在本文的下半部分中,我们将继续分析剩余的三个阶段,包括如何选择合适的虚拟化平台和如何部署虚拟化服务器。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐