本篇文章3154字,读完约8分钟
近年来,随着分布式计算的日益普及,横向扩展的分布式应用架构如雨后春笋般涌现。从大数据平台架构到前端应用程序架构,基于横向扩展的架构似乎是与时俱进的高级架构。
分布式架构的优势显而易见。一方面,横向扩展架构可以分解大型计算任务,并将它们分布到不同的计算节点,这自然降低了每个计算节点的计算能力需求;另一方面,横向扩展架构可以平衡多个节点的计算负载,任何节点的中断都不会影响最终结果的实现。换句话说,降低了每个计算节点的可靠性要求。那么,横向扩展真的需要多个节点和少量计算来实现最完美的体系结构吗?让我们仔细分析一下什么样的横向扩展体系结构能够最有效地满足分布式计算的特点。
分布式=物理分布还是逻辑分布?
让我们来看看中国科技信息研究所对分布式计算的权威定义:分布式计算是一种新的计算方式。所谓分布式计算是指两个或两个以上的软件相互共享信息,这些软件可以在同一台计算机上运行,也可以在通过网络连接的多台计算机上运行。从这个定义中,我们可以看出:首先,分布式计算被定义为软件分布式,即逻辑分布式,而不是硬件分布式,即物理分布式;其次,硬件平台的选择是根据实际情况将程序放在最合适的计算机上运行。换句话说,分布式体系结构指的是逻辑分布,而不是强调多机部署,有必要根据实际情况选择合适的部署体系结构。
逻辑分布是指多个逻辑计算节点一起运行相同的计算任务。这些节点可以通过虚拟化部署在多个物理节点或少量物理节点上。在一个或几个物理节点上部署多个逻辑节点的部署模式称为逻辑分布和物理集中。
逻辑分布、物理集中部署是软件部署级别的完整横向扩展体系结构,它具有硬件部署级别的集中部署优势。可以说,它结合了分布式和集中式部署的优点,同时摒弃了两者的缺点,并具有以下优点:
1.高可靠性和容错性。一个节点的系统崩溃不会影响其他服务器;
2.高度可扩展。您可以根据计算能力的需要添加更多的计算节点或提高一些节点的性能;
3.灵活性。易于实施,同时支持新应用程序的快速启动;
4.高性能。多个节点共同提供计算能力,以满足实际业务需求;
5.易于管理,降低了操作和维护的复杂性。物理集中部署模式可以减少实际物理机的数量和整体运维复杂度,从而大大降低运维人员的工作量;
6.节能减排。随着物理机数量的减少,机柜位置减少,功耗降低,空的制冷需求降低,从而节能减排,实现绿色数据中心的需求。
逻辑分布和物理集中意味着在物理集中部署的机器应该承担多个逻辑计算节点,因此在这种部署模式下对硬件平台选择的要求如下:
1.高可靠性和稳定性。装鸡蛋的篮子越来越少,这意味着篮子应该足够坚固,以确保鸡蛋的安全。
2.高度可扩展。为了满足逻辑节点横向扩展的需求,物理集中的机器需要有很强的纵向扩展能力,能够满足应用节点的横向扩展需求。
3.高性能。如果仅仅是计算能力的积累,那么物理学实际上并没有减少。为了实现更高密度的集成,在物理上集中部署的机器需要具有强大的性能,并以更少的资源集成更多的计算节点。
4.开放。我们知道分布式计算通常是基于开放系统的,这就要求服务器具有很强的开放性,并且能够兼容商业或开放平台软件,从而更好地支持分布式部署架构。
金融业大规模负荷集成项目的实践
一家大型金融机构希望建立一个异地灾难恢复数据中心。在选择应用服务器的灾难恢复体系结构时,客户希望选择一套基础架构来承担生产数据中心中1400多套应用服务器节点。如果生产数据中心保持相同的体系结构,灾难恢复数据中心需要200台4路x86服务器进行虚拟化,其要求和困难大致如下:
1.由于灾难恢复数据中心需要在生产数据中心不可用时全面承担生产任务,从性能角度来看,灾难恢复数据中心的应用服务器平台必须具有与生产数据中心相同的处理能力,相当于200台4路10核x86服务器的处理能力;
2.灾难恢复数据中心距离生产数据中心近1000公里,其it人员都在生产中心工作。灾难恢复中心的维护力量尤其薄弱。如果采用200个x86架构,根据2017年国投调查统计,每个平台的非计划停机时间(见下图),预计每年会有10%左右的非计划停机时间,维护压力很大,因此灾难恢复中心可能需要增加人力来应对。
3.灾难恢复数据中心机房空机房的资源紧张。虽然现阶段可以满足200台服务器的建设需求,但随着未来业务的发展,容灾数据中心的资源瓶颈将日益明显;
根据该金融机构对灾难恢复数据中心建设的需求,客户在基础设施选择上面临两种选择。首先,他们将继续在灾难恢复中心使用基于x86的现有生产中心的物理分布式体系结构,但他们将面临灾难恢复中心运营和维护力量不足、空机房不足甚至电力不足的问题;第二,灾难恢复中心选择物理集中式和逻辑分布式架构,减少物理服务器数量,降低维护压力,在保证清理同等处理能力的同时,减少空机房的占用和功耗。
在详细了解了linuxone的平台特性后,这家金融机构立即与ibm合作推出了一个针对linuxone的功能和性能测试。一方面,验证了linuxone的集成能力,即在相同的工作负载下,linuxone和x86所需的配置;另一方面,验证了linuxone对于分布式平台的灵活性,如虚拟机承载能力和瞬时扩展能力。最后,实验证明,两种Linux操作系统能够完全承受金融机构的应用服务器负载,Linux操作系统平台具有较好的可扩展性和灵活性。特别是在容量扩展方面,linuxone的瞬时微码激活能力可以在几秒钟内提供更多的计算资源。当遇到性能瓶颈时,可以通过添加分布式节点和增加一个或一些节点的处理能力来扩展它,这样它就可以在不增加节点的情况下轻松应对负载峰值。
用户最终选择linuxone作为灾难恢复数据中心应用服务器的承载平台,并采用了两个linuxone作为灾难恢复数据中心的应用服务器平台。共部署了1,400多台虚拟机,并集成到现有的ico云平台中进行统一管理,充分展示了linuxone强大的集成能力、无与伦比的性能和广泛的兼容性。
在本项目的建设中,linuxone表现出了很强的集成能力和性能。同时,linuxone具有业内最强的可靠性和稳定性,完全满足金融机构快速稳定的双速it建设需求。
通过采用2个linuxone而不是200个4路x86体系结构,在机房、空机房、功耗和商业软件许可方面节省的资源如下:
linuxone大规模负载集成的成本分析
Linuxone可以提供多达8,000个虚拟机和200万个容器。从tco的角度来看,它可以通过逻辑分散和物理集中部署实现高密度集成,这可以节省大量的功耗、机房空机房和空机房。同时,由于服务器的数量已经大大减少,linuxone是一个高度可靠和稳定的服务器,具有完全冗余的体系结构,并且它还可以升级全在线微码和更换部件,因此操作和维护变得愉快,这不再是一件劳动密集型的事情。对于操作和维护部门缺乏人力或不打算投入太多人力的灾难恢复数据中心,linuxone无疑是最佳选择。
It趋势、长期集成、长期集成,随着各行业业务类型和业务量的增加,各行业可能会面临很多问题,如服务器数量多、故障点多、运行维护压力大、功耗大、商业软件的合规成本高等。以上分享了基于linuxone实现大规模负载集成的实践经验,希望能为同行提供参考。
作者简介:王力,拥有12年it行业经验和7年ibm系统事业部工作经验,一直致力于金融业基础设施研究和项目管理,积累了丰富的金融业架构经验。目前,作为ibm大中华区系统部的linuxone Architect,他主要负责金融行业和医疗行业的基础设施设计和技术支持。
了解更多关于IBM/it-基础设施/cn-zh/linuxone/home
工业控制系统正在开放。你想出如何采取安全预防措施了吗?
来源:搜狐微门户
标题:哪种Scale out架构能更有效满足分布式计算?
地址:http://www.shwmhw.com/shxw/52965.html