it运维整体解决方案介绍.pptx
IT运维整体解决方案介绍,IT运维整体解决方案 经验总结,IT运维体系使客户实现“三个放心”,IT安全运维——越复杂环境越需要简单管理手段,ITIL: 以流程为中心的IT管理行业标准 ISO20000: ITIL 的国际标准认证,,IT运维项目建设步骤,IT运维平台设计原则,综合考虑到项目的成本、资源、执行时间以及流程的可操作性,建议采用以下流程设计的原则:,,,,,,知识库,IT服务台,,配置库,综合报表系统,其它管理系统,,外包服务人员,,,,IT运维平台的设计,,其他部门,服务人员—角色与岗位定义,按服务划分 热线,一线,二线(专家)…… 按技能划分 系统、应用、网络、安全、桌面…… 按职能划分 技术人员、技术管理人员、项目管理人员、领导层、合同管理员、供应商、外包商……,确定标准,,与客户交互方式,,,,IT运维体系—各种事件的处理流程,,,,,,服 务 台,,事件管理,问题管理,变更管理,发布管理,配置管理,服务请求,网管事件 设备故障,,应用软件 业务系统故障,。。。,其他,,,,,,,,,,,,业务需求生成 业务需求审批,产品发布管理,需求变更管理,软件缺陷追踪,软件测试管理,,,NOC AMS,项目进度管理,服 务 台 事 件 整 合,,软件配置管理,资产管理,安全资产管理,终端资产管理/AD,补丁、软件分发,终端设置变更,终端事件,终端远程协助,预发布管理 (打包),,,SOC TOC,安全事件 病毒防护 网络漏洞 网络堵塞,,网管事件 分类处理,问题控制 主动问题管理,安全事件 关联过滤,变更评审 实施,外包管理,知识库,,安全问题处理,变更安全策略,,,IT运维平台,,资产管理子系统,,采购管理,,个人工作台,综合监控,应急管理,安全管理,服务管理,IT运维统一访问门户 ITSM Portal,系统配置,报表,统一资产配置库(IB),监控数据库,流程支撑库,综合监控子系统,网络设备监控,链路监控,服务监控,环境监控,应用监控,自动发现,拓扑管理,告警管理,桌面安全,,数据总线,,,库存管理,资产管理,调拨管理,合同管理,文档管理,调拨管理,大修管理,报废管理,资产清理,台帐管理,卡片管理,智能分析,巡检管理,服务请求,问题管理,变更管理,知识库,值班管理,绩效管理,SLA管理,配置管理,厂商管理,报表管理,流量分析,流程管控,受理请求,创建工单,处理工单,分派工单,监督工单,关闭工单,,,,,,,,,Portal总线,,访问门户Portal平台,个人工作台:个性定制个人主页。 综合监控:集成综合监控系统。 服务管理:集成流程平台。 应急管理:提供应急预案的管理。 安全管理:提供安全管理,用户远程对设备的管理。 系统配置:组织结构管理。 报表:在门户中展示相关报表。 单点登录:实现对资产子系统,监控子系统,流程子系统等的统一鉴权,避免多次登录和记忆许多系统的帐户和密码信息。,,个人工作台,,根据角色配置不同的菜单 根据管理要求制定主页显示内容,,集中监控,,集中展示系统所有故障信息 集中处理故障 集中监控系统 大屏幕 个人终端,统一故障处理告警平台,告警通知方式: 手机短信 电子邮件 RTX即时通信平台告警 页面弹出 告警内容: 告警来源、类型、级别、发生时间、接收时间、责任人、告警详细描述等 告警处理方式: 告警压缩; 告警关联性分析; 告警影响范围分析; 告警定位; 告警类型重定义; 告警过滤; 告警取消; 转发工单(自动、手动),,安全管理,,单点登录,安全鉴权,CA接入 提供快捷方式登录相关的业务系统和设备。,,,,,一般事件管理流程,接收 记录 分类 确定优先级,服务台人员,用户,网管,KEDB,B,PDB,异常,KDB,审计,SLM,一线,二线,问题管理,工单,变更管理,匹配,回访 关闭,分析 调查 解决,通知,投诉,咨询、请求、需求、投诉等,故障管理流程,,应急管理流程,现场支持人员: 第一时间响应故障 第一时间处理故障 第一时间上报故障 易耗部件更换,现场负责制,多线协同作战,集团支持人员: 协助判断解决故障远程协助 协调专家支持 备品备件调用 现场解决 合同管理人员,,,,事件管理,规则接口,manager,问题分析组,B,事故单,工单,KEDB,,根本原因,工作组,已知错误,事故管理,解决方案,变更管理,KDB,问题管理流程,记录 关联分类优先级 分派,调查 解决,变更请求,关闭,关闭,通知 升级,变更管理,,记录建立变更请求 直接录入、事件管理模块产生、问题管理模块产生 评审、变更请求 分类和确定优先级 制定变更实施计划 变更管理在规划、构建、测试 变更实施 根据资源和其它情况确定实施日期,分配相应资源 提供沟通、监视功能,并在必要时进行协调 评价和终止变更 当变更完成后,问题、事件和配置元素应当自动或手动随之更新,配置管理,,计量IT资产和配置项、成本 有效对IT环境管理,快速评估故障对业务产生的影响 属性扩展方便 通过变更确保配置信息的更新和准确 追踪系统软硬件变化,配置管理数据库,方便其他流程直接调用、管理 配置关系管理 配置巡检,配置管理数据库,配置视图分类: 关系类视图 物理视图 业务视图 位置视图 个体视图 基本信息视图 生命周期视图 全日志视图,个性配置视图,服务水平管理,优先级+时间 明确客户的业务需求及相应的IT服务需求; 确保以合理的成本提供约定的IT服务级别; 确保实际的IT服务级别达到约定的服务级别的要求; 改善客户关系和提高客户满意度。 丰富的通知方式:短信、窗口、RTX、邮件,知识共享平台,记录:提供知识评论,收藏夹,点击排行等功能 检索:提供关键字检索,知识点检索,分类检索等,支持全文索引 运用:支持知识相关性匹配,自动按知识点收集和发布,支持专栏设置和展示,支持知识订阅 更新:记录知识更新历史日志,提供知识版本管理,支持版本对比和恢复 统计:提供知识分类统计,来源,点击率,使用率统计,提供知识价值分析 管理:对知识发表观点;将用户感兴趣的知识加入收藏夹;根据知识的浏览次数进行排行,,排班,交接班,手动排班,自动排班,有排班表方式,无排班表方式,值班日历,值班报告(巡检),值班管理,建议: 总部24小时值班 现场值班5*8第一时间处理故障 定期备份 日常巡检 机房管理,任务计划管理,巡检任务 安全管理任务 维护任务 其他任务,,报表引擎,SLM监控数据,员工工单完成情况考核,团队工单完成情况考核,IT资源可用性评估,IT资源故障统计,供应商UC执行情况评估,员工OLA执行情况评估,团队OLA执行情况评估,…………,供应商资产故障率,…………,…………,业务流程数据,B,组织绩效考核工具,绩效管理,网络设备管理,自动生成网络拓扑 主动式网络管理 设备性能监控 事件收集及过滤 阀值控制及告警 性能分析 实时性能监测 快速故障定位 与第三方系统集成,支持网络中Cisco/H3C/华为/ZTE等多厂商的网络设备,服务器管理,性能监控:监控UNIX服务器、各类PC服务器的性能指标(CPU、内存、硬盘的使用率等),根据预先定义好的阀值进行报警,并且把性能数据存储到标准的数据库或者数据仓库中,以便对其进行数据分析; 日志监控:日志文件的变化情况,可跟踪操作系统、数据库及用户应用系统的日志文件,根据日志中出现的特定信息进行报警或自动执行用户预定义的动作: 进程监控:能够实时监控进程的运行情况,以及子进程、进程对CPU/内存的占用情况等等。 监控方式 Agent代理 Telnet/SSH、SNMP,