职位描述
岗位职责:
1.国产服务器日常运维,包括欧拉服务器系统的安装、配置、升级、监控及故障排除,同时承担高斯数据库的日常管理与维护,进行数据备份、恢复、性能优化及安全防护;记录运维数据和问题处理情况并形成报告,配合相关部门完成一体机功能测试和升级。
2.国产 AI 服务器(鲲鹏 + 昇腾)的日常运维工作,涵盖服务器的安装、配置、监控、故障诊断及修复;负责大模型的部署、调试、运行监控及性能优化,保障大模型稳定高效运行;完成 AI 开发平台的安装、部署、配置及维护,解决平台运行中的技术问题;制定服务器及相关平台的运维管理制度和应急预案并组织实施,对团队运维人员进行技术指导和培训。
3.负责各类软件系统的日常运维,包括软件的安装、部署、升级、监控及故障处理;对软件系统进行性能监控和分析,提出并实施性能优化建议;处理用户反馈的软件问题,排查解决后记录处理过程;编写软件运维文档(如操作手册、故障处理手册等)。
任职资格:
1.学历:
本科及以上学历,计算机科学与技术、人工智能、软件工程等相关专业。
2.经验:
具有 3 年以上综合运维经验,需同时具备服务器系统、数据库、国产 AI 服务器(鲲鹏 + 昇腾)及软件系统的运维经历;有欧拉服务器系统、高斯数据库运维经验,以及大模型、AI 开发平台安装部署经验者优先。
3.技能:
①熟悉欧拉服务器系统架构和操作,掌握高斯数据库原理和操作,能进行系统及数据库的安装、配置、故障排查、备份恢复、性能调优及安全管理;了解疾控传染病一体机基本原理和结构,能进行简单硬件故障判断和处理。
②深入了解鲲鹏和昇腾处理器架构和特性,熟悉基于鲲鹏 + 昇腾平台的服务器硬件和软件环境;掌握大模型部署方法和运行机制,能进行性能调优和故障处理;熟悉 AI 开发平台架构和功能,可独立完成平台的安装、部署、配置及维护。
③熟悉 Linux 操作系统,能熟练操作和管理;熟悉软件测试和部署流程。
④具备 Shell 脚本编程能力,能编写自动化运维脚本;具备良好网络知识,熟悉 TCP/IP 协议,能进行网络故障排查;具有一定脚本编程能力(如 Python、Shell 等),可编写简单自动化运维脚本。
⑤具备良好的问题分析和解决能力,能快速响应并处理各类运维突发事件。
素质:
工作认真负责、严谨细致,具有较强的学习能力和创新精神,能快速掌握新技术和新工具;具备良好的沟通协调能力和团队合作精神,能承受一定的工作压力,工作积极主动有责任心。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕