岗位职责:
1.系统软件实施与运维:负责人工智能相关系统软件的实施工作,保障系统稳定运行,及时处理系统软件在使用过程中出现的各类问题,确保系统能够满足业务正常开展的需求;
2.云平台全流程管理:负责云平台的部署、升级以及日常运维。包括对云平台组件资源进行合理规划与高效管理,定期开展服务器巡检,及时发现并解决云平台及服务器存在的潜在风险,保障云平台的安全性、稳定性和高效性;
3.其他工作任务:积极配合团队工作,高效完成领导交代的其他与技术运维相关的任务,助力团队整体工作目标的实现。
任职要求:
1.网络技术能力:具备扎实的网络技术运维能力,熟悉各类网络设备的工作原理,能够熟练掌握常见网络故障的诊断与处理方法,可快速定位并解决网络问题,保障网络环境的顺畅;
2.数据库操作能力:拥有良好的数据库操作能力,深入掌握数据库相关知识,包括数据库的安装、配置、备份、恢复以及性能优化等,能够熟练运用 SQL 语句进行数据查询、更新等操作,确保数据库的稳定运行与数据安全;
3.容器技术运维能力:精通 Docker 与 Kubernetes 运维技术,能够独立完成 Kubernetes 集群的配置、部署、扩展工作,具备对集群进行实时监控、快速故障排查以及性能优化的能力,保障容器化应用的稳定运行;
4.自动化脚本编写能力:具备较强的自动化与脚本编写能力,能够熟练运用 shell、python 等脚本语言编写自动化脚本,实现运维工作的自动化处理,有效提高运维效率,减少人工操作失误;
5.行业经验要求:拥有云平台或电网行业人工智能相关运维经验者优先,熟悉相关行业的业务流程、技术规范以及运维需求,能够更快地适应岗位工作,为业务发展提供有力的技术支持;
6.综合素养要求:具有良好的沟通能力与团队协作精神,能够清晰、准确地与团队成员及业务部门进行沟通交流,协调解决工作中的问题;
7.具备强烈的责任心与敬业精神,对工作认真负责,积极主动承担工作任务;拥有较强的学习能力与自我提升意识,能够及时关注行业新技术、新动态,不断学习掌握新的运维技术与方法,提升自身专业技能;能够熟练编写各类技术文档,包括运维手册、故障报告、技术方案等,确保技术信息的规范记录与有效传递。