职位详情
多模态基础大模型的研究与开发
2-4万·15薪
启元实验室
北京
不限
硕士
09-22
工作地址

银桦路58号院-2号楼

职位描述
我们正在寻找热爱技术、有经验的大模型算法和训练的研究员和工程师加入我们的团队,参与由优秀科研人员带领的团队,研究、设计和训练万亿级参数规模的多模态基础大模型。作为专注于多模态基础大模型的优秀技术团队,我们致力于推动大模型技术边界,并在相关领域内发挥重要作用。
岗位职责:
1. 面向人工智能、科学计算与大数据处理融合的智能体系结构,开展大规模预训练模型相关研究。包括但不限于数据清洗、算法设计、训练推理、模型压缩等研究方向。
2. 与团队成员协同工作,设计实现各种模块或功能,并进行性能调优;解决大规模预训练模型研发过程中遇到的算法问题,如缓解模型灾难性遗忘、进行模型评测、缓解模型幻觉等。
3. 探索创新:积极探索新方法、不断提升工作效率及团队协调开发能力。
4. 涵盖NLP、多模态算法岗位,模型优化与加速岗位,模型训练与数据平台开发岗位,数据处理与分析岗位等。
任职要求:
1. 硕士及以上学历,计算机相关专业,国内外重点院校;
2. 有大模型训练工作经历优先;
3. 良好的数学基础,能够理解复杂的模型算法和技术;
4. 掌握深度学习基础知识,至少熟悉一种深度学习编程框架,如PyTorch、Tensorflow、Paddle、MindSpore等,有模型开发、部署、微调经验,有GPU编程或高性能计算研发经历优先;
5. 具有良好的编程风格与文档撰写能力,有多人协作开发及 Code Review 经验,对代码有严格的质量要求;熟悉常见开发规范,熟悉git等开发工具,熟悉代码库的创建与维护操作;
6. 对Transformer、预训练模型有一定深度的理解和经验,能根据论文复现相关算法,有大规模预训练模型研发和训练经验者优先;
7. 具备大型数据仓库架构设计、模型设计和性能调优等相关经验优先;
8. 具有大规模数据开发经验优先,如数据清洗策略与算法制定、数据去重算法、数据质量评估等;
9. 能够独立完成基于机器学习算法的数据处理及模型部署的工作优先;
10. 具有RAG/检索增强生成开发经验优先;
11. 高质量相关论文ACL,EMNLP,COLING,NAACL作者优先;
12. 对大模型技术范式有深度理解并信仰该技术趋势优先。
如果您是一位热爱技术、富有创造力的研究员或者开发工程师,并且想要加入一个充满活力和创新精神的团队,欢迎您投递简历。期待与您共同探索基础大模型领域的无限可能!

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请