岗位职责:
1、负责将现有的运维经验服务化,并实现服务编排,实现运维自动化、智能化;
2、负责AIOps的算法研究并落地,推动运维产品向自动化、智能化方向发展;
3、负责基于日志、监控等,应用机器学习等技术,构建AIOps运维平台,包括趋势分析、故障预警、异常检测、根由分析、故障自愈及自动运维知识图谱等产品能力的建设。
任职资格:
1、硕士研究生及以上学历,计算机、信息通信、密码学、信息安全等相关专业优先;
2、具有良好的代码能力,熟练掌握至少一门编程语言;
3、具备快速阅读深度学习相关论文并理解算法的能力,熟悉至少一个机器学习框架和常用的机器学习算法,熟悉Agent编写,有DeepSeek/ChatGPT/Copilot等工具实战经验;
4、6年以上IT经验,3年以上智能运维平台和工具开发经验,熟悉大型运维平台的架构设计,并参与研发落地;
5、具备趋势分析、异常检测、故障定位、根因分析、自动自愈等场景解决方案的设计能力;
6、熟悉DevOps工具链和云原生技术栈,如Jenkins、K8S和Terraform等IaC工具;
7、具有较好沟通协调能力、抗压能力强,有开源项目贡献经历者优先。