岗位职责:
1. 面向人工智能、科学计算与大数据处理融合的智能体系结构,开展大规模预训练模型相关研究。包括但不限于数据清洗、算法设计、训练推理、模型压缩等研究方向。
2. 与团队成员协同工作,设计实现各种模块或功能,并进行性能调优;解决大规模预训练模型研发过程中遇到的算法问题,如进行模型评测、缓解模型幻觉等。
3. 探索创新:积极探索新方法、不断提升工作效率及团队协调开发能力。
任职要求:
1.硕士及以上学历,计算机科学与技术专业优先, 计算机/人工智能/大数据/知识工程/电子信息/通信等相关专业优先。
2.良好的编程风格与文档撰写能力,有多人协作开发及 Code Review 经验,对代码有严格的质量要求;熟悉常见开发规范,熟悉git等开发工具,熟悉代码库的创建与维护操作。
3.掌握深度学习基础知识,至少熟悉一种深度学习编程框架,如PyTorch、Tensorflow、Paddle、MindSpore等,有模型开发、部署、微调经验。
4. 对Transformer、深度学习有一定深度的理解和经验,能根据论文复现相关算法,有大规模预训练模型研发和训练经验者优先;高质量相关论文ACL,EMNLP,COLING,NAACL作者优先。