1.5-2万
新棕北大厦4B13
岗位职责:
Ø 参与大模型(LLM)的设计、训练、优化及部署,推动算法在业务场景落地。
Ø 负责大模型关键技术研发,包括预训练、微调(如LoRA、P-Tuning)、模型压缩(蒸馏/量化)等。
Ø 解决大模型开发中的复杂问题,如性能优化、多模态融合、Agent/RAG架构应用。
Ø 跟踪学术界与工业界前沿技术(如Transformer架构、自注意力机制),推动团队技术迭代。
任职要求:
核心技能:
1.教育背景:
Ø 本科及以上学历,计算机科学、人工智能、数学或相关专业;
Ø 优秀应届毕业生,需证明极强的学习能力与技术深度。
2.技术能力:
Ø 编程基础:精通Python,熟悉C++/Linux,具备工程化部署能力;
Ø 深度学习框架:熟练使用PyTorch/TensorFlow,独立完成模型构建、训练及优化;
Ø 大模型核心技术:深入理解Transformer、自注意力机制、Prompt工程;掌握主流大模型(如LLaMA、ChatGLM、GPT系列)原理与应用;精通至少一种微调技术(LoRA、Adapter、P-Tuning等)及模型压缩方法。
Ø 算法理论:扎实的机器学习/深度学习基础,掌握NLP/CV多模态技术者优先。
3.项目经验:
Ø 具备大模型从0到1构建、优化或落地经验(如预训练、垂直领域微调、模型蒸馏;
Ø 有模型部署实践经验(边缘端/C++部署为加分项);
Ø 熟悉大模型生态工具链(LangChain、HuggingFace等)。
综合素质:
Ø 学习与创新:能快速理解业务逻辑,跟进前沿技术并提出创新方案;
Ø 问题解决:独立定位并解决模型开发中的技术难题;
Ø 团队协作:具备跨团队沟通能力,推动项目高效落地;
Ø 责任感:对交付结果负责,具备极强时间管理能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕