热线电话:13928782616

电子邮箱:Tim@91lewei.com

典型案例
您现在的位置:首页 > 典型案例 > 某移动实现业务平台运维自动化

某移动实现业务平台运维自动化

发布时间:2017/09/30 典型案例 浏览次数:759

某移动业务平台含有基础平台类(iap、uap、业务类平台的主机和套装软件等)、承载了业务运营支撑类(营销支撑、业务辅助办理、业务辅助管理、欠费追缴、家宽政企业务流程运营等)、稽核审计类(数据稽核、业务稽核、相关审计等)等IT系统

客户需求

主机、网络设备、存储监控需求。

对约500台主机实现无代理监控方式,基础指标包括cpu,内存,是否ping通等。实现对防火墙,交换机,f5等约400台网络设备的监控,基础指标包括端口流量,端口状态,连通性等。实现对约30套存储设备存储IO等性能的监控,根据情况给出硬件相关告警信息;

工单系统对接需求

和某地市的ITSP工单系统对接,自动生成告警工单,与监控告警联调;

数据库、WEB、文件等的个性化业务监控需求

实现对自由充业务、网站业务、OCE业务、BOSS业务、ABOSS业务等业务的监控,并能支持远程脚本调用功能。实现Web监控的模拟登陆。实现对Oracle、DB2、My SQL、MS SQL Server 数据库监控;

资产管理需求

管理包括主机,网络设备,存储等设备的基础信息,并且实现可分业务系统、设备类型、负责人等多种维度查询的功能。实现IP段内存活主机自动扫描功能,并且确保能为新增设备添加监控;

自动运维与操作管控需求

实现网络设备配置文件自动备份、自动化巡检、自动化部署等功能。实现基于安全需求的接入及维护登录操作管控和安全审计等功能

解决方案

       根据客户业务情况,需求有统一的监控平台,能够及时发现告警并通知到系统负责人,确保系统的稳定运行。 提供日常咨询及远程协助处理服务,需赶赴现场处理重大故障,提供每月及重大节假日巡检及隐患清除。

主机、网络设备、存储监控:

  • 针对主机CPU、内存等进行实时监测,发现CPU占用率过高或内存不足等异常情况时,5分钟之内生成告警;
  • 针对防火墙,交换机,f5等网络设备进行实现监测,发现网络设备故障、端口流量、状态或断开连接等异常情况时,5分钟之内生成告警;
  • 针对存储设备进行监测,发现存储空间不足或存储设备故障等异常情况时,5分钟之内生成告警;
  • 按照指定格式生成监控报表;

工单系统对接:

  • 当异常情况发生时,和某地市的itsp工单系统对接,自动生成告警工单;

数据库、WEB、文件等的个性化业务监控:

  • 针对个性化业务的实时监测,发现个性化业务无法办理或是系统奔溃等异常情况,5分钟之内生成告警;
  • 针对web监测,实现网络拨测,发现异常情况,5分钟之内生成告警;
  • 针对数据库的实时监测,记录对数据库尤其是敏感数据的操作,发现数据库操作异常或数据库出问题时,5分钟之内生成告警;

资产管理:

  • 按照指定格式生成资产信息表,维护设备信息;
  • 定期更新资产信息表并且保存旧的资产信息表,以便核对;
  • 实现可分业务系统、设备类型、负责人等多种维度查询的功能;
  • 定期对IP地址进行扫描和维护IP列表,生成IP段内存活主机列表,为未添加监控的机器添加监控;

自动运维与操作管控:

  • 应能实现业务支撑系统密码的集中管理,定期自动更改、加密保存、自动备份;
  • 对网络设备配置文件的定期自动备份,提供自动化巡检和自动化部署等功能;
  • 实现业务支撑系统后台维护操作所有行为的全日志记录;
  • 日志可实现关键字全文检索,并可根据需要自动生成审计报表;
  • 对密码尝试、关键指令、关键数据库表sql语句等敏感操作实现安全事件的用户定义;
  • 对已定义的事件可实现及时告警、阻断操作、集中审计等功能;

客户收益

乐维监控方案的实施,某移动做到将网络故障防患于未然,实现了故障5分钟报警并启动解决。通过对主机、网络设备、存储监控,让故障无所遁形,切实地把好网络运营第一关。工单系统的对接,实现了监控告警联调,极大的提高了IT运维的工作效率。自动运维实现了对业务自动化巡检和自动化部署等功能,定期检查和保障业务,将 IT 基础设施错误引起的事故和问题对业务的负面影响减到最小,并防止与这些错误相关的事故再度发生。某移动各项IT基础设施实现了稳定高效的运转,实现了为各项的业务服务保驾护航。