职位描述
职位描述
1、负责大型模型推理服务以及大模型相关应用的私有化部署和维护工作,确保模型在客户环境中的高效运行。
2、根据业务需求开发定制的推理服务功能,并设计相应的部署实施方案。
3、解决现场客户遇到的各类技术问题,包括但不限于硬件服务器、机房网络和软件部署等相关问题。
4、负责服务器上架、入网等基础设施搭建工作,确保部署环境的正常运行。
5、升级和维护已部署的推理服务,确保系统稳定性和安全性。
6、整理各类交付文档,总结并沉淀部署经验,为团队提供技术积累和知识分享。
职位要求
本科或研究生以上学历,拥有3年及以上相关工作经验,具备良好的故障排除能力和解决问题的技巧。
1、 熟悉网络设备(如路由器、交换机、防火墙等)的配置和管理。
2、精通Python,熟悉Java开发,了解TypeScript和C编程语言,能够编写自动化脚本和工具,提高运维效率和一致性,
3、熟悉Transformer、PyTorch等主流深度学习框架,了解TensorFlow、BERT等热门大型模型框架。
4、熟练使用Linux操作系统,掌握Shell脚本编写,具备Docker、Kubernetes等容器技术的使用经验。
5、具备良好的沟通表达技能和团队协作能力。
加分项:
具备生成式大型模型能力的了解及应用场景实践经验。
拥有大数据处理、数据分析、机器学习等相关领域的工作经验。
在相关领域有开源项目或技术博客等展示性成果。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕