职位描述
岗位职责:
1、制定公司大模型及AI底层技术的研发战略,明确技术路线图与发展目标;
2、跟踪全球AI技术前沿(如大模型训练优化、多模态学习、分布式计算等),推动技术创新与落地;
3、评估技术投入与产出,确保研发资源高效配置。
4、主导大模型的研发与优化,包括模型架构设训练加速、推理优化等;
5、负责AI底层技术栈(如深度学习框架、分布式训练平台、高性能计算)的开发与维护;
6、解决大模型训练与部署中的核心技术难题(如数据效率、模型泛化、算力成本等)。
7、搭建并管理高水平的技术团队,包括算法工程师、研发工程师、架构师等;
8、制定团队技术能力提升计划,培养核心人才,打造高效协作的研发文化;
9、设计技术团队的绩效考核与激励机制,确保团队目标与公司战略一致。
10、与产品、业务团队紧密合作,推动大模型技术在垂直场景(如气象、医疗、教育等)的落地;
11、为售前团队提供技术支持,参与客户技术交流与方案设计;
任职资格
1.、本科及以上学历,计算机科学、人工智能、数据科学等相关专业优先。
2、5年以上AI领域研发经验,至少3年大模型或AI底层技术开发经验;具备技术团队管理经验,曾带领30人以上研发团队。
3、深入掌握大模型训练与优化技术(如Transformer架构、分布式训练、模型压缩等);
4、熟悉深度学习框架(如PyTorch、TensorFlow)及高性能计算技术(如CUDA、RDMA);
5、具备大规模系统开发经验,熟悉分布式计算、云计算及边缘计算技术栈。
6、 能快速掌握新技术与新趋势,保持技术敏锐度;
7、 能高效对接技术团队与业务团队,推动技术落地。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕