职位描述
【职责描述】:
1.人工智能应用开发:负责大模型智能体应用在业务场景中的开发工作,将大模型的能力与实际业务需求相结合,并结合视觉、语音、OCR等机器学习算法,构建构建智能体应用,负责智能体应用功能选代和优化,确保产品的技术领先性和用户体验;
2.模型开发与优化:主导AI大模型及其他模型(大语言模型/视觉-语言模型)的训练调优及部署落地,针对业务场景优化模型性能(推理速度、内存占用等),实现模型轻量化(如量化、剪枝、蒸馏),探索前沿技术(如MOE、RLHF、长上下文建模)提升模型效果;负责大模型的预训练、微调及迁移学习,结合业务需求进行模型定制化开发,提升模型在特定场景下的表现;
3.工程化支持:搭建高可用数据处理Pipeline(清洗、标注、增强),开发模型服务框架,支持高并发推理及动态扩缩容;与产品团队协作,推动算法在业务场景中的落地,确保模型的高效部署和稳定运行;
4.算法研究与落地:研发核心算法(如预训练、提示工程、模型对齐),解决实际业务中的技术瓶颈,设计高效的分布式训练方案(数据/模型并行),提升千亿级参数模型的训练效率;构建自动化评估体系,量化模型在垂类场景中的表现,推动算法在搜索、推荐、对话等场景的落地;
5.技术前瞻性探索:跟踪LLM、Agent、AIGC等领域最新进展,主导技术选型,参与开源社区贡献,推动内部技术成果转化;探索大模型与AI应用开发的前沿技术,推动技术创新和业务场景的结合。
【任职要求】:
1.学历要求:本科及以上学历,计算机科学、数学、电子工程、人工智能等相关专业;
2.工作经验:具备3年以上大模型实战经验(需提供项目细节,如模型参数量、数据规模、性能指标),有完整参与从0到1的大模型训练或产品算法落地案例;具备大规模分布式训练经验,熟悉数据并行、模型并行等训练策略,能够优化千亿级参数模型的训练效率;
3.专业技能:精通Python编程语言,熟练使用PyTorch、PaddlePaddle等深度学习框架,具备CUDA优化经验;深入理解Transformer、Diffusion等模型原理及实现细节,熟悉Megatron-LM、DeepSpeed、HuggingFace等开源生态;熟悉大模型的训练、微调及部署流程,具备模型轻量化(如量化、剪枝、蒸馏)经验。
4.其他要求:具备技术抽象能力,能将业务问题转化为可建模的算法问题,对技术敏感度高,能快速验证新技术可行性;具备跨团队协作经验,能清晰传递技术价值至非技术人员,推动技术成果在业务场景中的落地。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕