[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放
在日新月异的IT科技领域,每一款产品都承载着一定的理念,代表了一种先进的思想。好的产品总会让我们感觉直观清晰,主旨鲜明,易用实用,IT运维管理产品同样如此。
但在IT运维管理的实际工作中,运维管理人员经常遇到的问题是:在品牌数量众多、性能参差不齐的网络管理行业,如何寻找到适合企业的运维管理产品来解决问题?如何把独立分散的功能通过内部的产品设计理念贯穿起来应用,从而达到科学而有效的管理目标呢?答案其实很简单,不是需要功能的多少,而是从产品本身所诠释的科学的管理思路来实现。因此,我们需要了解运维管理产品所传达给我们的管理思路是什么?
科学的管理思路是一个抽象的概念,其表现在产品中,是通过流程化来体现的。只有做到这一点,才可以让我们的IT运维人员找到明确的管理方向,采用科学的管理方式,从而达到科学的网络运维管理的目标。
万变不离其宗,在开发网络运维系统的过程当中,必须树立一定的理念和思想,只有这样,IT运维产品才不会被看成是网管工具的组合。好的运维管理产品在开发之初,就应认识到科学的管理理念和先进的设计思想的重要性,为了让客户更方便的使用并帮助客户解决实际问题,自始至终都需要遵循以下的设计理念和管理思路对网络进行运维管理,按先后顺序分为以下五个流程:
1、发现,自动锁定目标
指发现网络拓扑的意思。这里要强调的是,所发现的网络拓扑是通过物理拓扑图的方式呈现。
相信物理拓扑和逻辑拓扑大家并不陌生,前者强调物理,即真实网络的动态反映;后者强调逻辑,即宏观网络静态反映。之所以在发现结果上采用了物流拓扑图,并不是因为逻拓扑不重要。而是因为从绝大多数的客户角度出发,物理拓扑所能提供的价值要远大于逻辑拓扑。物理拓扑图是作为运维系统的最基本也是最直接的一种发现问题机制,具有举足轻重的地位。
物理拓扑图从全局的角度出发,帮助运维管理人员实时了解整个网络当前的运行状况,通过预警和设置,提示网络中存在的各种情况和状态。通过拓扑图,我们可以了解到:网络架构是否合理?有无网络瓶颈?有没有非法外接设备等?当然,实际所能带给我们的远不止这些。物理拓扑图可以显示网络设备的真实连接,设备和链路的实时情况。进而实时反映网络的健康状况。
2、分类,便于快速寻找
指对所发现的设备类型进行分门别类。可以让每种类型的设备均有各自相应的标识,以便于快速查找每个设备在物理拓扑图中的物理位置。
运维系统在分类种类中,充分考虑到各种复杂网络的实际情况,将多种设备的类型元素集于一体,方便客户准确查找。同时,系统还支持自定义和添加个人喜好的设备类型标识。
3、监控,实时兼顾效率
指对所发现的物理网络和设备涉及到的参数进行实时监控,通过各种参数的实时查看和分析结果,为我们的技术人员提供解决问题的思路和方法。
多年的网络运维经验告诉我们,对参数的监控不是越多越好。在运维管理系统中,对各种不同参数的监控有所取舍,即根据实际网络运维管理需要的裁剪,保留了对客户真正有参考价值的重要参数。通过此举,告诉我们的技术人员在日常的运维管理过程中,我们应该关注什么,我们需要关注什么。
4、预警,变被动为主动
指对所监控的物理网络和设备的参数进行阀值设定,并可以自定义告警级别和方式,通过灵活多洋的告警方式主动告诉网管人员当前问题。
IT运维管理产品所涵盖的告警类型全面,从网络设备到服务器再到UPS设备,应有尽有。总而言之,机房里只要是支持网管的设备就可以在运维管理产品中找到各自的安全地带。通过系统智能主动的告警方式,可以使技术人员时刻对机房设备运行情况了如指掌,而不用在被动的去查找可能出现的问题。
考虑到技术人员不可能经常守在机房,运维管理系统在告警的同时,可以执行多种关联动作,以防在技术人员还没有来得及切断故障源的前提下,使网络威胁自动被排除在外。为技术人员争取了解决问题的时间,保障网络的正常运维。
5、报表,量化手头工作
指对日常运维的性能参数设定历史纪录,并通过报表的方式反映出来。运维管理人员在确保网络正常运行的前提下,需要有一个量化的东西来证明我们的工作成绩,而不再是通过领导和同事的口头认可来证明自己的价值。这就是报表的价值所在。一般来说,报表分析应该具有以下几方面作用:
1)网络设备性能的历史纪录,可以定期提供各项性能参数的历史纪录,以便随时调阅。
2)网络规划和改造的依据:我们可以以此作为网络规划和改造依据,用量化的东西替代口头的陈述,这样更有说服力。
3)为拓扑颜色参数的设置提供依据。
简而言之,IT运维管理流程就十个字:发现——分类——监控——告警——报表。借助将运维管理流程化的思想,可以帮助我们找到真正适合自己的运维管理系统,为解决各种问题提供科学的分析思路,协助我们更好的展开工作。
文章来源:CIO时代
|