职位描述
工作职责:
开展大模型算法研究,包括但不限于单模态和多模态大模型的微调(如LoRA、Qlora)、强化学习方法的应用、模型量化技术以及分布式部署算法的设计与实现。
为团队提供支持,解决大模型在特定垂直领域的实际落地问题,确保模型能够有效适应业务场景的需求。
针对大模型在可控性、可信度及推理效率方面存在的不足之处提出解决方案,克服业务实施过程中遇到的技术障碍
与跨部门的技术和业务团队紧密合作,共同推进项目进展,达成既定的技术和商业目标。
持续跟踪领域内最新的技术发展趋势和学术研究成果,领导创新活动,并基于此提出提升模型性能和效率的新思路或改进措施。
展现独立思考能力和创新能力,在面对来自不同行业或应用场景中的复杂技术挑战时,能够提出独到见解并找到有效的解决办法。
岗位要求:
计算机科学、人工智能或相关领域硕士及以上学位;
至少3年以上从事深度学习项目经验,具备丰富的模型微调实战经历;
精通Python编程及主流深度学习框架PyTorch的使用;
对自然语言处理/计算机视觉等领域内的一种或多种技术有着深刻的理解;
对主流大模型(例如deepseek/Qwen/LLaMA/GLM/T5等)的原理、性能、差异有深入理解;
对模型有量化及部署有深入了解和实战经验;
具备较强的工程能力,熟悉Linux环境下的软件开发流程;
了解常用的数据结构与算法,能高效地解决实际问题;
英语水平良好,能够无障碍阅读英文资料;
加分项:
在NLP/CV顶级会议上有论文发表记录;
有过成功的开源项目贡献经历;
熟悉Docker容器技术和Kubernetes编排工具;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕