(一)岗位职责
1.跟踪前沿的大模型和Agent技术,推动研究及工程实现,包括且不限于大模型微调训练、RAG系统研制、业务智能体研制;
2.针对算法任务进行文本数据的筛选和清洗;
3.利用自然语言处理、深度学习等技术,针对项目需求设计算法模型,完成算法的实现和优化,进行算法项目的在线部署、效果评估等工作;
4.参与撰写科研任务相关的发明专利、科研论文以及技术研究报告。
(二)岗位要求
1.硕士研究生以上学历,计算机、电子工程、自动化、数学等相关专业优先;
2.熟练掌握python/shell等编程语言,熟悉SQL语言,熟悉Linux平台,有较强的编程能力;
3.熟练掌握深度学习算法开发和主流NLP算法,包括且不限于CNN、RNN、LSTM、transformer等。能够熟练使用pytorch/tensorflow等深度学习工具,能够对算法框架进行特定的改进;
4.有大模型训练微调、强化学习训练等经验者优先;
5.熟悉dify平台,有rag系统和agent相关研发经验者优先;
6.具备优秀的逻辑思维能力,善于分析问题和解决问题,有强烈的上进心和求知欲,较强的沟通能力和学习能力。