岗位职责:
1、负责公司平台级核心服务的运维,提升业务的稳定性、可靠性与工程效率;
2.、主导应用上线评审、发布交付、配置变更、状态监控、容量管理、故障响应等关键流程;
3、参与核心服务的高可用性设计、性能优化和容量规划,确保业务平滑扩展与高效迭代;
4、主导线上重大问题排查、故障恢复与复盘优化,推动故障演练、应急预案与SOP建设;
5、负责容器化环境下高可用管理,包括限流、降级、容错、容灾等方案制定与落地;
6、推动运维流程标准化、文档化、平台化与自动化建设,提升整个团队的运维交付效率与安全保障能力。
任职要求:
35岁,本科以上学历,计算机、通信、电子类相关专业
1、熟悉微服务架构、分布式系统部署、两地三中心、业务多活等架构模型;
2、精通 Kubernetes 生态及其组件运行原理,具备大规模生产环境下的使用、排错和性能调优经验;有强系统架构思维,具备技术推进、流程优化和DevOps平台工程化能力;
3、熟练掌握 Python / Go / Shell 等脚本语言,能独立开发运维工具或服务;有 PostgreSQL / Mysql / Kafka / Nacos 等组件运维经验,具备 Service Mesh 实战(如 Istio)、Sidecar 模型理解;熟悉并应用过 SRE 运维体系(如 SLO/SLA、Error Budget、可观测性、自动化响应);
4、深入理解主流网络安全架构设计与部署原则,熟悉常见的网络攻击技术与防御方案,熟悉具备CISSP、CISM、CCSP、OSCP等安全领域高级认证者优先;熟悉防火墙、DDoS防护、IDS/IPS、WAF、堡垒机等主流安全产品及其应用场景,具备解决方案设计能力;掌握漏洞扫描、权限管理、入侵分析、渗透测试、恶意代码防范等关键技术,具备一定的漏洞挖掘与分析能力;具备日志、流量分析能力,能够快速分析攻击信息;具备一定的代码审计或逆向能力.
5、有良好的沟通能力,注重团队协作,责任心强;