岗位职责:
1.负责大语言模型(如Deepseek、Qwen、GLM等)的微调、训练及性能优化,提升模型在特定场景下的表现。
2.构建行业垂直领域的专用模型与知识库系统,推动业务场景的智能化解决方案落地。
3.协同研发团队完成智能应用产品的设计、开发与部署,包括但不限于对话系统、知识推理等方向。
4.跟踪前沿技术进展,探索大语言模型与行业需求结合的技术创新点。
任职要求:
1.本科及以上学历,计算机科学、人工智能、数学或相关专业,2年以上人工智能开发经验者优先。
2.熟练掌握PyTorch/TensorFlow等深度学习框架,熟悉Transformer架构及NLP领域核心技术(如预训练、微调、Prompt工程)。
3.具备大语言模型实战经验,包括分布式训练、模型压缩、推理加速等技术,熟悉LangChain、Hugging Face等工具链。
4.扎实的编程能力,精通Python,熟悉Linux开发环境及CUDA加速,有工程落地经验者优先。
5.逻辑清晰,具备跨团队协作能力,对AI技术商业化有强烈兴趣。
6.加分项:拥有Deepseek、Qwen、LAMM、GLM等模型的实际项目经验或开源贡献。