职位描述
工作职责:
1、负责大型自然语言处理和深度学习模型的技术研发和优化,强化学习相关技术栈及算法的预研和选型,模型微调、训练、量化处理及性能和准确性优化;
2、负责深度学习框架(如TensorFlow,PyTorch)的算法优化,提升大模型的运行效率和性能;
3、构建服务于大模型应用的知识库技术和工程能力,包括但不限于知识图谱、多模态集成、模型预训练、微调、RAG、Agent、智能体协同、大模型部署等;
4、与产品和业务团队紧密合作,深刻理解并转化业务需求,将最新的AI技术应用到实际产品中;
5、负责基于业务场景,设计并实施适用的模型调优策略,完成深度学习及机器学习相关算法的开发、应用及优化;
6、负责大模型提示工程、提示增强、提示模板、思维链、意图理解等模块研发,向与自然人口语化沟通方向上提升自然语言人机交互体验;
7、跟踪AIGC等前沿技术领域的最新研究成果,探索工业领域落地可行性,负责大模型与搜索推荐算法结合、大模型生成内容安全等方向技术预研,持续提升算法应用效果;
8、参与算法模型的评测,持续优化模型效果并保证其在实际环境中的稳定性。
任职要求:
1、博士学历,人工智能、计算机、数学、自动化等相关专业;
2、计算机基础扎实,深入理解数据结构,jvm优化,熟悉IO、多线程、集合等基础框架,熟悉分布式、缓存、消息等机制;
3、具有扎实的算法理论基础,熟练掌握自然语言主要算法模型,如意图识别、知识抽取、内容理解等,对常见的大模型如DeepSeek/ChatGLM/Qwen/LLaMa等模型原理有深入理解;
4、具备扎实的编程功底,熟练使用Pytorch、HF transformer、vLLM、LangChain等大语言模型相关框架,熟悉掌握Java、Python其中至少一种开发语言,熟悉Linux、容器等开发环境,精通两种语言者优先;
5、熟悉大语言模型预训练过程理论,包括相关技术细节和优化策略,熟悉各类深度学习网络和注意力机制,训练和推理模型调试、调优,有大语言模型优化及工程应用实践经验优先;
6、在自然语言处理或机器学习顶会(ACL,EMNLP,NAACL,ICML,NeurIPS, ICLR等) 有发表过相关优秀论文者优先,有参与过AI竞赛并获得优秀成绩者优先;
7、有良好的学习能力和创新思维,能够与团队良好合作和沟通,积极主动,自驱力强。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕