岗位职责:
1、负责基于大模型(语言、图像、多模态)、机器学习、深度学习技术构建,优化场景化AI Agent应用效果,确保其最佳性能、稳定性及可扩展性;
2、负责将AI应用功能开发并集成到现有工作流系统中,使能现有业务变革。
3、跟踪研究AI技术前沿进展,提升团队在AI Agent、大模型推理加速等方面的技术积累。
专业知识:
1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业;
2. 深入理解主流大模型架构及核心原理,熟悉其应用场景,具备丰富的模型应用开发与调优经验;
3. 有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等);
业务要求:
1. 拥有 2 年以上自然语言处理(NLP)、智能问答、文本生成、人机对话等相关领域开发经验;
2. 具有较强的工程实现能力,熟练掌握C/C++,Python等至少一种语言,熟悉LangChain、LangGraph等大模型应用开发框架;
3.熟悉分布式训练框架(DeepSpeed、Megatron),熟悉大模型训练微调中模型并行、数据并行、Pipeline等训练微调技术。
4. 具备强烈的进取心、自驱力及团队合作精神,热衷于追求技术创新。