职位描述
1、负责 CTP 主席 / 次席交易系统、行情转发系统及配套组件的全生命周期运维,制定并落地系统 SLI与 SLO,定期输出系统服务运营报告。
2、建立全链路监控体系,覆盖 CTP 接口状态、交易可用性、交易链路连通性、服务器资源、数据库性能、网络延迟等维度,通过工具实现监控可视化与智能告警,优化告警策略(降噪、分级),缩短故障发现时间。
3、主导 CTP 系统运维流程的自动化落地, 开发自动化脚本或工具,实现系统部署、配置管理、版本升级、补丁推送、日志清理等重复操作的自动化,降低人为操作风险,提升运维效率。
4、建立分级故障响应机制,主导 CTP 系统突发故障的快速定位与处置,记录故障根因分析(RCA)报告,推动 “无指责事后复盘”,输出可落地的改进措施,缩短故障恢复时间。
5、设计并执行 CTP 系统混沌工程实验,验证系统容错能力,提前发现潜在风险点;完善灾备体系,定期开展主备切换演练。
6、基于 CTP 系统历史运行数据(如峰值交易量、行情并发量)与业务增长预测,开展容量规划,合理分配服务器、网络带宽、数据库资源,避免资源瓶颈;针对交割日、新品种上线等特殊场景,制定资源扩容预案。
7、联合开发团队开展系统性能调优,通过工具分析 CTP 接口延迟、内核参数瓶颈、数据库慢查询等问题,提出优化方案,持续提升系统处理能力。
8、落实金融监管要求(如穿透式监管、数据安全法),定期开展 CTP 系统安全巡检(漏洞扫描、权限审计),确保系统合规性;沉淀运维知识库、自动化脚本库、故障处理手册,形成可复用的运维保障资产。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕