1.5-2万
新棕北大厦4B13
岗位职责:
Ø 参与大模型(LLM)的设计、训练、优化及部署,推动算法在业务场景落地。
Ø 负责大模型关键技术研发,包括预训练、微调(如LoRA、P-Tuning)、模型压缩(蒸馏/量化)等。
Ø 解决大模型开发中的复杂问题,如性能优化、多模态融合、Agent/RAG架构应用。
Ø 跟踪学术界与工业界前沿技术(如Transformer架构、自注意力机制),推动团队技术迭代。
任职要求:
核心技能:
1.教育背景:
Ø 本科及以上学历,计算机科学、人工智能、数学或相关专业;
三年以上工作经验
2.技术能力:
Ø 编程基础:精通Python,熟悉C++/Linux,具备工程化部署能力;
Ø 深度学习框架:熟练使用PyTorch/TensorFlow;
Ø 大模型核心技术:深入理解Transformer、自注意力机制、Prompt工程;掌握主流大模型(如LLaMA、ChatGLM、GPT系列)原理与应用;精通至少一种微调技术(LoRA、Adapter、P-Tuning等)及模型压缩方法。
Ø 算法理论:扎实的机器学习/深度学习基础,掌握NLP/CV多模态技术者(clip、vit)优先。
掌握mcp、functioncalling、a2a、向量数据库(faiss、qdrant)、强化学习(qmix)技术优先
3.项目经验:
Ø 具备大模型从0到1构建、优化或落地经验(如预训练、垂直领域微调、模型蒸馏;
Ø 有模型部署实践经验(vllm);
Ø 熟悉大模型生态工具链(LangChain、HuggingFace、llamaindex、modelscope等)。
熟练掌握llamafactory、unsloth等微调工具
4.综合素质:
Ø 学习与创新:能快速理解业务逻辑,跟进前沿技术并提出创新方案;
Ø 问题解决:独立定位并解决模型开发中的技术难题;
Ø 团队协作:具备跨团队沟通能力,推动项目高效落地;
Ø 责任感:对交付结果负责,具备极强时间管理能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕