本篇文章2429字,读完约6分钟
来自网络服务器频道4月24日的消息(Text/Li):近年来,各行各业都开始采用internet plus,并使用云计算、大数据等技术来提高生产效率,这与企业it系统日益复杂的情况有关。it系统规模越来越大,运维管理精细化要求越来越高,运维采集指标越来越多,响应时间越来越短。面对大量的运维数据和实时二级数据分析处理的需求,传统的it系统和模型越来越难以满足当前的运维需求。
过去,it资源是手动管理的,这需要一个漫长的过程来手动定义系统网络架构、配置和克隆虚拟机、配置操作系统、安装数据库等。在它们被使用之前。在部署过程中,手动操作容易出错。传统的操作和维护面临着巨大的压力,因此有必要寻求变革,走向自动化、平台化和智能化。
在it服务管理中,itsm和自动化技术可以有效提高管理效率。itsm中的自动化工具有助于企业更高效地改进管理任务,大大缩短应用发布流程,提高it效率,提高对it需求的响应速度,并有效节省操作和维护以及开发人员的工作时间。
在it运营和维护方面,docker、openstack、puppet等技术的普及,以及微服务、ci/cd、devops等概念。,迎来了自动化操作和维护发展的小高潮。总体而言,自动化运维平台有助于提高运维效率,减少因人工疏忽和流程操作失误导致的运维故障。
重新定义it运营和维护随着企业加快基于互联网的业务流程,新的业务和场景不断出现,这要求企业调整其it架构,对需求实现提出了更多的发展要求。企业的数字化程度越高,管理运营和维护就越困难。
面向服务的软件体系结构和连续交付过程逐渐诞生于技术领域。同时,随着业务量的迅速扩大,服务带来的应用管理、持续交付、监控、稳定和成本控制等大量非功能系统的建设和保障需要专门的团队,运维需求也在悄然变化。
在这个过程中,云计算的发展改变了it资源的供给模式,同时也对运维管理提出了新的要求。网络、硬件和系统维护的传统职责逐渐弱化,也迫使运维重点从底层转移到应用和业务层面,现有的操作系统和人员角色需要重新定位。
随着人工智能时代的到来,我们工作和生活中的一切都被重新定义。企业正试图通过人工智能技术提高运营和维护服务的有效性和可预测性,同时降低成本并实现业务转型。
2016年,gartner提出了aiops的概念,并预测到2020年aiops的采用率将达到50%。简而言之,aiops希望进一步解决基于现有操作和维护数据(日志、监控信息、应用信息等)的it操作和维护自动化无法解决的问题。)和通过机器学习。
aiops作为一种将算法集成到工具中的新的操作和维护方法,可以帮助企业最大限度地简化操作和维护工作,摆脱耗时和易出错的过程。传统的it运营和维护管理工具更注重紧急情况(即警报)、配置和性能,而aiops则更注重问题、分析和预测,它们相辅相成,取长补短。
使用aiops,当存在隐患时,运行维护人员不需要等待系统发出故障报警,通过内置的机器学习算法和大数据技术,可以自动发现系统的各种异常,从而从异常中判断故障的可能性、严重性和影响,并依靠机器对数据的分析结果来判断最佳的响应方案。
只有当数据全面时,才能做出科学的决策。在许多情况下,如果日志不完整或获得的监测数据不准确,在做出决定时肯定会草率行事。例如,如果数据中心的业务链接有问题,是否要切换?数据仍然一致吗?此时,在没有明确的数据支持你的决策之前,你会感到不安和犹豫。
目前,百度、搜狗、阿里巴巴等国内互联网厂商已经探索和尝试了aiops,并取得了良好的效果。通过支持aiops功能,该平台可以提供更强的分析、调整和自我修复能力,并进一步提高it效率。
如何从复杂的运行维护监测数据中获取我们所需要的信息和结果,是需要区分和提炼的。同时,确保业务和sla的服务水平,及时响应问题,自动分析和优化问题,简化和有效地组合处理流程,将问题与正确的场景匹配,找到合适的人,并在第一时间正确处理问题。
机器学习需要大量的数据来训练,故障的形式是多种多样的。对故障历史数据进行分类和标注,利用模式识别和数据训练机器进行识别和分析,从而使机器能够自动、准确地进行判断。
基于数据和模型提高事件处理能力。一些工程师很快处理许多事件,而不熟悉这个故障的人可能要花很长时间。因此,有必要建立一个政策知识库,供他人参考和学习,并提高在类似情况下的事件处理能力。
我们以数据中心的管理、运营和维护为例。数据中心的运行和维护主要包括配置管理和监控。操作和维护人员每天都要进行大量的模块维护操作,这个过程中的大部分程序都是通过手工操作来完成的。一方面,人的精力是有限的,所以不可能及时发现所有的错误;另一方面,在这个过程中,人为失误的可能性是不可避免的。将人工智能应用于数据中心的管理和控制,通过机器学习模型进行精细化管理,可以达到智能运行和维护的目的。
谷歌可以说是第一个在数据中心管理中使用人工智能技术的代表。它利用人工神经网络来分析大型数据中心的运行情况,收集和汇总数据(如数据中心基础设施的耗电量和达到一定冷却效果所用的水量),通过人工智能计算模型来分析和评价数据中心的运行效率,并提出相应的解决方案来提高数据中心的运行效率。
结论人工智能环境下信息技术运行维护的目标是减少对人的依赖,逐步信任机器,实现机器的自我判断、自我决定和自我决定。技术在不断进步,人工智能技术可以解决一些需要大量人力和时间才能解决的问题。然而,人工智能不是一项非常纯粹的技术,它还需要与特定的企业场景和业务相结合,由计算和数据驱动,以生产出真正可用的产品。
人工智能下企业it运维的落地不是一蹴而就的,而是一个渐进和价值普及的过程。目前,it运营和维护已处于变革之窗。可以预见,经过更高效、更平台的实践,aiops将为整个it领域注入更多新鲜和活力,在未来发展壮大,成为引领潮流的重要力量!
工业控制系统正在开放。你想出如何采取安全预防措施了吗?
来源:搜狐微门户
标题:企业纷纷上云 IT运维如何借力AI实现智能化
地址:http://www.shwmhw.com/shxw/45864.html