职位描述
岗位职责:
1. 负责公司对外项目的部署维护故障处理,负责大模型、应用系统的架构设计及维护;
2. 负责突发事件处理、问题跟踪与管理,能够运用各类工具进行分析和问题处理;
3. 负责日常运维相关的自动化工具或系统以及基础设施的开发维护,践行DevOps,全面提升运维效率;
4. 负责各类运维文档及相关工作技术文档的撰写;
5. 完成上级领导交办的其他工作。
任职要求:
1. 大学本科及以上学历,计算机及相关专业优先,具备良好的计算机体系结构知识;
2. 5年及以上工作经验,具备私有云或阿里云、华为云等常见云厂商的运维经验;
3. 精通 Linux 操作系统,精通计算机网络、有丰富的部署和排查故障经验;
4. 熟悉 Shell/Python/Go 等任意一项编程语言技术,有强烈的自动化意识,可以熟练使用脚本完成日常工作 ;
5. 熟悉常见运维相关的系统和工具,熟悉主流高可用架构、虚拟化、容器化、微服务、服务网格等技术;
6. 熟悉主流数据库(MySQL)部署及运维;熟悉微服务架构,具备Docker容器化、Kuberneter容器编排经验;
7. 了解常用中间件和工具的安装部署调试故障处理,如:Redis、Nginx、ES、Zookeeper、Kafka、日志系统等;
8. 学习能力强,极强的执行力和沟通能力,具备良好的职业道德和技术前瞻性;
9.加分项:GPU运维经验、国产化信创适配相关经验、Ansible、Slurm相关技术、大模型运维相关经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕