大家好,今天小编关注到一个比较有意思的话题,就是关于网络运营运维总结的问题,于是小编就整理了1个相关介绍网络运营运维总结的解答,让我们一起看看吧。
如何解决运维方式过于分散,相关责任方协调困难的现状?
大家好,我是IT老手。本人曾经担任过跨国公司IT系统运维经理的工作,简单谈一下我的经验。
运维分散的原因
运维方式分散,一般是由于企业在不断发展壮大的过程中遗留的各种系统,硬件设施,种类繁多,互不兼容,从而导致运维人员过多,而且无法互相Backup。公司IT资源浪费,而且管理困难。有些公司是由于在不断并购重组其他公司过程中,没有及时替换原公司的IT硬件,系统,从而导致多个运维团队的存在。
如何解决?
要解决这个问题,首先就要对公司的所软硬件设施进行到底盘点,梳理,评估。进而整理成报告,做一个全面的未来一体化整合方案,该淘汰的淘汰,该替换的替换。然后制定长期的运维升级优化策略,同时要考虑集团公司的整体业务发展规划。
共享和外包是出路
然后逐步实现运维的共享化,建立共享服务中心。能远程维护的,将服务人员全部放在共享中心,每个现场只放一两个IT硬件及核心系统维护人员。这样既可以提高效率,又可以为公司节省成本,还可以实现人员的相互Backup。
【总结】
当然,除了内在共享建设,还可以选择将部分维护工作外包给专业的运维服务公司,同样可以达到集中管理,提高效率,节省成本的目的。欢迎关注@IT老手 ,一起探讨共享建设及IT外包运作的话题。
运维方式过于分散,责任不清晰,是我们运维管理不到位。要改变现状需要通过系统的方法来改善
增加统一资产管理工具
我们运维的对象就是我们的IT资产。IT资产如果没有统一管理,而是分散在不同部门或者不同的运维单位。就很容易出现运维分散。而且出现故障,就容易出现扯皮。所以你需要一个统一的资产管理软件工具,现在这个工具都被集成在运维管理软件里面(后面就都以运维管理软件来说)。
运维管理软件内置的监控软件,可以自动发现单位内的所有的IT资产,并实时监控IT资产的运行状况。而作为单位IT管理来说,你只需要查看运维管理软件的资产报表。你就知道所有资产的运行情况,故障情况。
引入ITIL服务管理
ITIL是全球公认的一系列信息技术服务管理的最佳实践。这个最佳实践的管理方式可以解决运维过程的产生各类问题,包括运维分散的问题。当然ITIL这个服务管理非常庞大,单位要想应用的比较好。还的结合自身实际来进行删减改进。
一般企业单位都会引用ITIL里面的五大服务管理流程:
1、事件管理
事件管理:是一个被动性的任务。就是告诉我们当发生故障或者降低IT服务质量时,我们应该怎么做。一般情况下流程是这样的:
我们会设立服务台作为我们的报障中心,所有事件报障都统一归口到服务台。服务台收到请求后会将事件记录在运维管理软件里以便持续跟踪。同时按照最快的途径派单给一线工程师,然后一线工程师接单到场解决故障,如果一线工程师无法解决,则升级到二线工程师。在故障解决之前,可以持续升级。最高可升级到原厂支持。
2、问题管理
问题管理:是一个主动性的任务。主要是为了减少同类事件重复发生。这项任务主要由二线工程师来负责。他应该定期在运维管理软件里分析所有的事件。并分析事件发生的真正的原因、全部原因。然后将找到的解决方法,对全体工程师发布。
3、变更管理
变更管理:非常重要的任务。就是当我们的IT资产、配置、服务发生变更时,不能随意变更。而是需要走变更审批流程。让变更不仅得到审批还记录在案,同时也不会让错误的变更导致灾难。
我们在IT运维过程中,经常会碰到上一个工程师更换了什么东西,下一个工程师完全不知道。这就是不走变更流程带来的后果。所以,在IT服务过程中,无论是服务范围、资产对象、配置等任何东西发生变更都必须走变更流程。
4、发布管理
发布管理:是紧跟着变更管理的一个重要流程。当一个被审核通过的流程,需要发布出来。并同步更新到运维管理软件,让全体参与运维的人员知道。这样可以提高运维效率。如果一个审核通过的变更,没有发布。那和没有变更时一样的。
5、配置管理
配置管理:通俗点讲就是资产管理的升级版。它负责定义配置项,记录配置项,更新删除配置项。它就是一个数据库。是我们运维管理的核心数据库。我们可以根据自己的需要来定义配置项的颗粒度。颗粒度越细,则配置项越多,也越精细。消耗的时间也会越多。比如:你定义硬件配置的颗粒度到板卡级别,那一台机器的所有板卡都是一个配置项。你需要收集这许多信息。那是得花不少时间的。
当然配置库不仅仅记录资产,还记录服务过程,服务经验。可以生成知识库。方便加快我们工程师处理故障的速度。
结束语
总之,运维出现分散,责任不清推诿。并不是单个人的问题,而是服务管理的问题。我们应该系统化考虑。可以引进ITIL的管理方法并结合运维管理工具来改变现状。
如果对回到有不同见解,欢迎关注讨论!
到此,以上就是小编对于网络运营运维总结的问题就介绍到这了,希望介绍关于网络运营运维总结的1点解答对大家有用。