重要活动应急保障方案-修改
重要活动应急通信保障方案重要活动应急通信保障方案 一、应急保障分类一、应急保障分类 恰当的应急分类是指导应急方案制定和实施的重要一环, 明确应急保障分类, 是分析应 急保障事件特征的重要工具, 进而明确保障的重点和难点, 明确制约应急保障的主因和次因, 并制定针对性的保障方案。 一般应急保障分为常规性通信保障、突发事件通信保障、重大事件通信保障。 通信应急保障 分类 常规性通信保障突发事件通信保障重大事件(活动)通 信保障 针对通信网络建设中和日常优化针对通信网络建设中和日常优化 运营中的各种风险,如设备故障、运营中的各种风险,如设备故障、 网元负荷、传输、动力等网元负荷、传输、动力等 通信事故、通信事故、突发政治事件、突发政治事件、公共安公共安 全事件、自然灾害事件等全事件、自然灾害事件等 重要通信保障任务重要通信保障任务(重大活动、(重大活动、国国 事会议、大型体育运动会等)事会议、大型体育运动会等) 、军、军 事演习等重要通信保障活动事演习等重要通信保障活动 二、重大事件应急保障流程二、重大事件应急保障流程 针对重大事件应急保障,一般分事前、事中、事后保障三个阶段。 应急保障应急保障 事前事前 信息采集信息采集 保障方案确定、应急预案制定保障方案确定、应急预案制定 责任分工,落实实施责任分工,落实实施 关键时间点控制关键时间点控制 保障人员落实保障人员落实 事中事中 现场测试保障、现场动态反馈现场测试保障、现场动态反馈 应急处理流程待命应急处理流程待命 现场故障处理、实时参数调整现场故障处理、实时参数调整 机房数据告警监控,定时发送机房数据告警监控,定时发送 事后事后 应急数据删除、网格恢复应急数据删除、网格恢复 保障期间数据提取及分析保障期间数据提取及分析 总结经验、输出总结报告总结经验、输出总结报告 三、应急保障举例三、应急保障举例 东荷体育馆许巍演唱会应急保障方案 1 1、信息采集(保障时间、地点及范围)、信息采集(保障时间、地点及范围) 据演唱会官方发布, 许巍将于 11月 29日于东荷体育馆举行巡回演唱会, 为满足界时大 量突发通信需求,济南移动提前进行通信测试保障,具体测试安排如下: 1)1)活动时间活动时间: 2014年 11月 25日至 29日 2)2)测试设备:测试设备:MIFI终端及 D2测试手机 3)3)测试范围测试范围: 活动范围为济南东荷体育馆, 重点保障区域为 1-4层看台及走廊人员聚集区域及三楼包 厢区域。 2 2、演唱会测试保障方案、演唱会测试保障方案 测试前注意事项测试前注意事项: : 1)确认测试区域:确认测试区域: 活动进行前提前模清体育馆现场建筑结构, 各 RRU布放位置及覆盖范 围,确保各 RRU运行正常。 2)测试人员提前到位:测试人员提前到位:由于早忙时堵车严重,要求测试人员提前进入场馆进行通信保障。 3)风险点规避:风险点规避: 活动期间设备故障及大话务带来的拥塞等指标恶化, 需要提前协调应急通 信车及工程设备 RRU备件,避免打不通电话引起的大量投诉。 4)测试范围站点状态监控:测试范围站点状态监控:后台人员测试前提前到位, 提取现网各站点运行、 告警及话务 量状态,如发现问题及时报保障人员,及时进行有效规避处理。 5)关键配置检查关键配置检查 ------修改 TDD SRS配置方式为接入优先。 ------打开 SRI资源自动调整开关。 ------关闭 DRX 开关。 ------扩双载波并配置负载均衡。 ------保证周围邻区关系完整。 活动保障方案实施施活动保障方案实施施 1)提前进行话务分析,预估话务需求提前进行话务分析,预估话务需求。分析活动现场占用小区情况,针对活动现场人员情 况对相应小区进行扩容处理,提前协调应急通信车到现场进行保障 2)对重点人物入场路线及重点场所进行模底保障。对重点人物入场路线及重点场所进行模底保障。对活动周边道路进行遍历测试及重点区 域的 CQT拨测,确保目标人物的通信体验。 3)加强设备监控力度加强设备监控力度. .加大话统分析和告警监控力度,对每日指标性能最差小区进行分析, 拿出解决方案,及时解决。每小区发出告警及话务监控信息, 抄送全体保障组人员,准备相 关应急板件, 保障基站稳定运行, 预留部份重要的备品备件以便能及时处理重要基站的故障 4)应对突发事件通信保障应对突发事件通信保障 突发事件的一个突出现象就是某个特定区域内短时间话务激增, 出现高拥塞现象, 为很好的 应对此类事件,我们从以下5个方面做好应急保障工作: A、应急小区预安装:应急小区数据、装传输电路及基站数据预先制作并调试完成,根据活 动需要随时可以开启应急。 B、专项应急设备:仓库常年备存 BBU\RRU等相关设备,同时有配套的天馈系统和其它配 套设施,作为应急通信的专项备品备件。 C、专项车辆配备:网优中心配有应急通信车辆1台,承担应对突发事件的开站、扩容、测 试和故障处理工作。 D、专项人员配备:各个专业有专门处理突发事件的应急人员 3 3、应急预案、应急预案 一般情况下, 通过活动前巡检, 不会出现如上告警。 但是一旦出现如上告警, 轻则影响性能, 重则业务中断。请按照如下原则进行处理: 1) 首先按照告警帮助进行处理(重启和换板措施在本步骤先不考虑) ; 2) 若不能消除告警,尝试重启; 3) 若仍然不能解决问题,尝试更换单板。 (需要提前准备好备板) RRCRRC 建立成功率急剧恶化应急处理建立成功率急剧恶化应急处理 【入口条件】 通过实时监控或15分钟话统发现RRC建立成功率已经急剧恶化 (恶化程度已经超过客户 预期) ,且 通过15分钟话统看到指标100,且 通过15分钟粒度话统看到CPU峰值超过预设门限的次数()超过5%。假如话统周期是 15分钟,那么每个话统周期共检测15*60=900次。如果这个counter值超过45,就认为满 足过载条件。 【应急措施】 应急方案 启动 AC BAR,降低导频功率,缩少覆盖范围。 参数回退 上述方案影响用户体验, 尤其是 AC BAR。因此当从 15分钟话统中看到 CPU最大占有 率低于 70%后,需要将上述措施依次回退。每回退一个,观察15分钟。 CELLACBAR时间因子回退到70; 取消CELLACBAR; UE不活动定时器恢复为初始值; 回退过程中如果又出现CPU过载,则取消上一步回退。 4 4、测试保障团队人员职责、测试保障团队人员职责 济南济南 LTELTE网络网络 ATUATU 测试保障团队人员职责测试保障团队人员职责 分组分组人员人员 李长安(华为) 王献永(华为) 王根(华为) 赵鹏(华为) 测试维 护保障 组 杨永亮(华为) 职责职责 华为服务经理;协调人员、资源 华为网优负责人; 对各模块之间的沟通, 测试华为保障人员进 行工作协调安排、 测试全程保障 前场电话联系,现场问题处理协调 话务、告警、干扰监控/15分钟,告警站点、不可用小区及时 告知,协调处理 现场测试保障工作, 对现场各区域测试并反馈测试情况, 结合 现场情况提出合理处理建议 现场测试保障工作, 对现场各区域测试并反馈测试情况, 结合 现场情况提出合理处理建议 崔亮(华为) 5