安全运维服务规范
安全运维服务规范安全运维服务规范 一、总则. 2 二、部门职责. 2 三、行为规范. 2 3.1 运维规范 . 2 3.1.1 各项内容常规检查规范 . 2 3.1.2 网络及安全设备日常操作规范 . 3 3.1.3 操作系统、应用系统日常操作规范 . 3 3.1.4 内部运维规范 . 3 3.1.5 巡检管理规范 . 4 3.1.6 监控告警规范 . 4 3.1.7 运维审计规范 . 4 3.2 运维流程 . 5 3.2.1 事件管理 . 5 3.2.2 问题管理 . 5 3.2.3 变更管理 . 6 3.3 现场服务支持规范 . 6 3.4 问题记录规范 . 6 四、运维服务质量指标规范. 8 五、应急服务响应措施. 8 5.1 应急基本流程 . 8 5.2 预防措施 . 8 六、突发事件应急策略. 9 1 一、总则一、总则 为了规范本公司所从事的运维管理工作,使得相关工作具有持续改善性及相互协作 性,能够支撑公司相关业务的健康可靠的运行,由此制定本规范。 本规范适用于公司技术部所有人员。 二、部门职责二、部门职责 (1)负责对甲方信息化基础设施的技术保障,包括网络、电话、机房、服务器系 统、数据安全等技术支持; (2)负责对甲方所有服务器操作系统的技术运维工作; (3)负责对甲方应用系统数据库的性能调优及技术运维工作; (4)负责对甲方各种网络及安全设备的技术运维保障工作。 三、行为规范三、行为规范 (1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。 (2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持 工作。 (3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。 (4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要 文明礼貌,语言清晰明了,语气和善。 (5)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、 核心参数、业务数据等负有保密责任,不得随意复制和传播。 3.13.1 运维规范运维规范 3.1.13.1.1 各项内容常规检查规范各项内容常规检查规范 运行环境检查:对设备运行环境检查,包括温度、湿度、清洁度。查看中央空调运行是 否正常,温度、湿度显示是否正常,空调有无报警;查看电源配电柜是否有报警,电源电压 输出是否正常;每日两次(早、晚)对设备运行环境检查、记录。常规硬件检查:每天检查 重要服务器的运行状态、 有无故障报警、 操作系统和应用系统是否正常, 每日进行两次 (早、 晚)检查、记录;每周一次对重要设备全面检查、填写运行记录;每 2 周一次对所有服务器 设备检查、记录。对检查后发现的故障及时处理, 对损坏设备及时维修或更换,对缺乏备件 的设备要提交设备购买申请报告。 操作系统的安全设置按照服务器操作系统安全设置文档对 2 操作系统进行设置,确定文件、目录等的访问权限,将服务器对外权限降到可以正常使用的 最低状态,及时安装防杀病毒软件。 同时应由专门人员定期修改服务器密码、 下载更新补丁 等;各应用服务器系统数据上传、更新的安全保障,后台系统的使用和更新进行安全管理; 各服务器定期全面更新系统补丁;定期全面更新病毒库、 查杀病毒;定期更新系统密码。数 据备份:网络中心内所有数据必须保持完整备份, 重要数据至少需要保存 3 到 4 个备份;重 要备份数据除在网络中心内SAN 存储上即时备份, 同时还需要在外存上进行定期保存; 每个 月末需对重要数据进行全面备份。 3.1.23.1.2 网络及安全设备日常操作规范网络及安全设备日常操作规范 交换路由类外观检查:每天早晨检查核心交换机电源、 端口等指示灯是否正常, 是否有 报警声, 根据外观检查判断网络运行是否正常。 防火墙: 每天早晨监看外观指示灯是否正常; 登陆防火墙监看防火墙使用日志、运行状态(CPU、内存等);查看各接口流量是否正常; 定期下载配置信息,保证最新的配置可以有效使用; 对防火墙所进行的修改要有记录, 如是 临时调整,使用完毕应立即恢复到原状态。 IPS、防杀病毒软件:每天监看 IPS、防杀病毒软 件防范入侵、检查网络入侵拦截日志、 客户端病毒查杀统计日志, 根据日志进行相关策略调 整;定期检查病毒库是否更新,保持本地病毒库是最新状态。 3.1.33.1.3 操作系统、应用系统日常操作规范操作系统、应用系统日常操作规范 服务器维护: 按照重点服务器设备运行维护方案对服务器进行维护, 根据维护方案按月 填写运行维护报告,分析系统运行各项指标、 对系统安全性和稳定性进行评估, 对存在隐患 进行总结和分析。对运行存在的问题给出合理化处理建议。操作系统、 应用系统维护:按照 应用系统运行维护方案对主要应用系统进行维护, 重点应用系统包括教学管理平台及其数据 库系统、WEB 及后台数据库系统、mysql 系统的数据库系统。维护范围包括操作系统和应用 系统以及数据库的运行稳定性和安全性, 数据库的安全性包含数据库的自动备份和还原处理 是否正常。根据维护方案按月填写运行维护报告,对存在隐患进行总结和分析。 3.1.43.1.4 内部运维规范内部运维规范 (1)运维工程师,负责岗位职责内相应的IT 设施的《维护手册》的制定和完善、并 按照本运维规范执行维护管理工作和巡检工作。 (2)运维工程师应当依据运维过程收集的记录信息,每月整理出当月的《月度运维 报告》提报部门经理,报告中要重点关注IT 设施的问题和改进分析,并提出改进措施和建 议。 3 (3)部门经理,负责保障运维管理体系的有效执行,包括本运维管理规范的制定和 完善,督导维护工程师完善各设施维护手册。 (4)部门经理在月度工作会议上就当月各个运维工作报告与团队沟通共识出整改措 施,并形成新的工作计划,推动落实执行。 3.1.53.1.5 巡检管理规范巡检管理规范 (1)巡检对象:机房、数据备份、网络、服务器、系统的运行状态。 (2)巡检周期:每日、每周、每月。 (3)每位运维工程师依据各自维护设施,按时对检核内容进行检查。每日:当日下 班前要把当天检查情况填报检核表。 (4)部门经理将不定期检查巡检的完成情况。 (5)巡检期间,如果发现设备或系统异常,应立即上报部门经理并展开调查,确认 故障的应立即进入故障处理环节。 3.1.63.1.6 监控告警规范监控告警规范 (1)监控中心提供在线监控、流量分析、故障告警; (2)设定告警阀值:磁盘阀值95%,非数据库系统内存阀值70%,CPU 阀值 70%。 (3)告警:达到阀值或系统中断时,平台通过短信通知到运维工程师,运维工程师 收到告警后,应该立即检查系统的健康状况,并在应急预案规定时间内恢复正常; (4)根据公司《应急预案》的要求,在规定时限内进行故障恢复; (5)故障发生时,运维工程师在无法锁定问题根源时,应该立即启动应急机制,在 规定时间内先恢复业务使用,并在非工作时间进行详细的故障排查; (6)经过排查仍然无法解决时,应立即向部门经理汇报,并寻求外部资源直至问题 解决。 3.1.73.1.7 运维审计规范运维审计规范 (1)三权分立:角色分为审计员、设备管理员、运维人员,审计员仅能进行审计工 作,对设备管理员和运维人员的行