岗位职责:
1、结合实际业务场景,规划设计AI产品中智能语言理解交互的技术方案;
2、负责大语言模型及多模态大模型的研发与优化,包括但不限于模型训练调优、推理加速等工作,提升模型在政务相关场景的性能;
3、负责跟进领域最新进展,探索将前沿的算法应用于实际业务,包括不仅限于Agent、多轮对话、图像识别的研发落地工作。
岗位要求:
1、本科及以上学历,三年以上工作经验,计算机相关专业,深刻理解计算机原理,有良好的数据结构和算法基础,有扎实的编程能力;
2、对传统和前沿的NLP/LLM、机器学习、数据挖掘等相关技术都有深刻的了解和相关项目经验(包括但不限于Transformer、BERT、GPT等),对DeepSeek-R1所使用技术有较深理解或者实践者优先;
3、对CV领域有深入的理解,在多模态模型(LLaVa、InternVL、Qwen2.5-VL等)有深入的研究经历者优先;
4、具有在大模型训练、微调方面的实战经验,熟练使用Python或者C++等编程语言,熟悉主流深度学习框架(如PyTorch、TensorFlow等),具有较强的算法工程落地能力和经验;
5、有大模型推理加速经验者优先,包括但不限于vLLM、SGLang等;
6、熟悉Al Agent的原理和应用,有相关项目开发经验者优先;
7、学习能力强,逻辑思维清晰,较强的文献阅读能力,有较强的自我驱动力和问题解决能力,有软件工程能力者优先;
8、要求抗压能力强,乐于主动分享和沟通技术。