职位描述
岗位职责:
1.模型部署,负责将预训练模型部署到生产环境中,确保模型在实际应用中的性能和稳定性,包括基于国产化硬件的环境;
2.模型优化:对大规模预训练模型进行微调以适应特定任务或领域,实施量化技术减少模型大小,提高推理速度而不大幅影响准确率,应用模型蒸馏技术将大型模型的知识迁移到小型模型中,提升效率;
3.国产化算力测试:负责在国产化算力平台(包含但不限于昇腾、寒武纪等)上进行模型的性能测试与评估,分析并解决在国产硬件上部署和运行模型时遇到的问题;
4.跟踪和研究前沿的AI技术,不限于深度学习、机器学习及大模型算法研究等,可以针对特定业务需求设计算法解决方案,并将其应用到实际项目中;
5.持续监控与维护:监控部署后的模型性能,并根据反馈进行必要的调整和优化
技能要求:
1.5年以上相关领域工作经验,有在知名AI公司或能源、通讯、金融、互联网等工作经验者优先;
2.熟练掌握Python,具备良好的代码编写习惯;
3.熟悉至少一种主流深度学习框架(如TensorFlow, PyTorch),有在国产硬件上使用这些框架的经验;
4.在国产化算力平台(如昇腾、寒武纪)上有实际操作和测试经验;
5.了解Docker、Kubernetes等容器化技术;熟悉Linux操作系统,熟悉ollama、vllm、xinference、mindie等框架。有使用过针对国产硬件的开发工具或SDK经验者优先考虑;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕