职位详情
资深大模型研发工程师
2.5-3.5万
中资检验认证有限公司
北京
5-10年
硕士
04-16
工作地址

海鹰路6号院12号楼

职位描述

岗位职责:


大模型研发与优化:

1、负责大模型(如Deepseek、Qwen、Llama等)的训练、微调、蒸馏、优化与调参工作,确保模型在业务场景中的高性能和可扩展性。

2、持续跟踪学术界和工业界的大模型前沿技术,结合公司业务需求,引入先进算法并进行创新性改进。


场景落地与定制化开发:

1、针对客户的具体业务场景,进行大模型的定制化开发和场景落地,确保模型能够有效解决客户的痛点问题。

2、设计并开发基于大模型的智能化解决方案,提升客户业务效率。


系统集成与部署:

1、负责大模型与现有业务系统的集成与部署,确保模型能够无缝嵌入到客户的生产环境中。

2、优化模型推理性能,确保模型在高并发、大规模数据场景下的高效运行。


数据处理与特征工程:

1、处理大规模、多源异构数据,进行数据清洗、特征提取和特征工程,提升模型的预测能力。

2、设计并实现高效的数据处理流程,确保数据质量和可用性。


团队协作与技术指导:

1、与产品经理、AI应用工程师、算法工程师、开发工程师等跨部门协作,确保项目按期交付。

2、指导其他工程师,分享技术经验,提升团队整体技术水平。


文档撰写与知识沉淀:

1、撰写技术文档和开发手册,确保项目的可维护性和可扩展性。

2、定期进行技术分享,总结经验教训,推动团队技术能力的持续提升。



任职要求:


1、教育背景:计算机科学、人工智能、机器学习、数据科学等相关领域的硕士或博士学历,具备扎实的理论基础。

2、技术经验:5年以上大模型或深度学习相关研发经验,具备丰富的模型训练、优化和调参经验。

3、熟悉主流的大模型架构(如Deepseek、Qwen、BERT、Transformer等),具备实际项目落地经验。

4、熟练使用深度学习框架(如PyTorch、TensorFlow等),具备大规模分布式训练经验者为佳。

5、数据处理能力:具备大规模数据处理经验,熟悉数据清洗、特征工程、数据扩增等技术。熟悉主流数据库和大数据处理工具(如Hadoop、Spark等)者为佳。

6、编程能力:精通Python,熟悉C++、Java等编程语言,具备良好的代码编写和调试能力。

7、具备大型软件项目开发经验,熟悉软件开发流程和工具(如Git、CI/CD等)。

8、业务理解:具备较强的业务理解能力,能够快速理解央企的业务需求,并将其转化为技术解决方案。

9、有采购领域相关项目背景者为佳。

10、软技能:具备良好的沟通能力和团队协作精神,能够与不同背景的团队成员有效合作。具备较强的学习能力和创新意识,能够快速掌握新技术并将其应用到实际项目中。


以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请