职位描述
岗位职责:
1)负责需求场景下小模型、大模型的训练与推理部署全流程工作,包括数据预处理、模型选型、训练调优、推理部署等;
2)参与模型训练框架、推理引擎的选型与优化,结合业务场景搭建高性能、可扩展的训推一体化平台;
3)深入理解业务需求,将实际场景诉求转化为技术方案,协同产品、技术团队完成模型效果验证;
4)跟踪大模型、小模型及训推技术前沿动态,及时跟进行业先进技术与方法。
任职要求
1)本科及以上学历,计算机科学、人工智能、深度学习等相关专业,3年及以上模型训推相关工作经验;
2)精通至少一种深度学习框架(如PyTorch、TensorFlow),熟练掌握模型训练、微调、压缩、量化、推理部署等核心技术,具备独立完成端到端训推项目的能力;
3)熟悉常见大模型(如Deepseek、Qwen、LLaMA等)、具有小模型(如Yolo、Resnet、Slam等)的训推落地项目经验,能够根据业务需求选择合适模型并进行针对性优化;
4)具备扎实的编程基础,熟练掌握Python/C++等编程语言,熟悉Linux系统操作,了解分布式训练、容器化部署(Docker、K8s)相关技术;
5)具备良好的问题分析与解决能力、跨团队沟通协作能力,能够快速响应业务需求。
优先条件
1)熟悉具身智能相关业务,有具身机器人、智能硬件等场景下模型训推落地经验,了解具身感知、决策、执行链路的技术逻辑;
2)熟悉多模态感知算法者优先;
3)具有多行业模型应用项目落地经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕