2-3万
海鹰路6号院12号楼
岗位职责:
大模型研发与优化:
1、负责大模型(如Deepseek、Qwen、Llama等)的训练、微调、蒸馏、优化与调参工作,确保模型在业务场景中的高性能和可扩展性。
2、持续跟踪学术界和工业界的大模型前沿技术,结合公司业务需求,引入先进算法并进行创新性改进。
场景落地与定制化开发:
1、针对客户的具体业务场景,进行大模型的定制化开发和场景落地,确保模型能够有效解决客户的痛点问题。
2、设计并开发基于大模型的智能化解决方案,提升客户业务效率。
系统集成与部署:
1、负责大模型与现有业务系统的集成与部署,确保模型能够无缝嵌入到客户的生产环境中。
2、优化模型推理性能,确保模型在高并发、大规模数据场景下的高效运行。
数据处理与特征工程:
1、处理大规模、多源异构数据,进行数据清洗、特征提取和特征工程,提升模型的预测能力。
2、设计并实现高效的数据处理流程,确保数据质量和可用性。
团队协作与技术指导:
1、与产品经理、AI应用工程师、算法工程师、开发工程师等跨部门协作,确保项目按期交付。
2、指导其他工程师,分享技术经验,提升团队整体技术水平。
文档撰写与知识沉淀:
1、撰写技术文档和开发手册,确保项目的可维护性和可扩展性。
2、定期进行技术分享,总结经验教训,推动团队技术能力的持续提升。
任职要求:
1、教育背景:计算机科学、人工智能、机器学习、数据科学等相关领域的硕士或博士学历,具备扎实的理论基础。
2、技术经验:5年以上大模型或深度学习相关研发经验,具备丰富的模型训练、优化和调参经验。
3、熟悉主流的大模型架构(如Deepseek、Qwen、BERT、Transformer等),具备实际项目落地经验。
4、熟练使用深度学习框架(如PyTorch、TensorFlow等),具备大规模分布式训练经验者为佳。
5、数据处理能力:具备大规模数据处理经验,熟悉数据清洗、特征工程、数据扩增等技术。熟悉主流数据库和大数据处理工具(如Hadoop、Spark等)者为佳。
6、编程能力:精通Python,熟悉C++、Java等编程语言,具备良好的代码编写和调试能力。
7、具备大型软件项目开发经验,熟悉软件开发流程和工具(如Git、CI/CD等)。
8、业务理解:具备较强的业务理解能力,能够快速理解央企的业务需求,并将其转化为技术解决方案。
9、有采购领域相关项目背景者为佳。
10、软技能:具备良好的沟通能力和团队协作精神,能够与不同背景的团队成员有效合作。具备较强的学习能力和创新意识,能够快速掌握新技术并将其应用到实际项目中。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕