岗位职责:
1. 负责大模型(如LLM、多模态模型)的算法研发、优化及工程化落地,包括模型架构设计、预训练、指令微调、对齐优化等关键技术环节。
2. 针对业务场景(如NLP、搜索推荐、对话系统、AIGC等)设计大模型应用方案,提升模型效果与性能。
3. 探索大模型的高效训练与推理技术,包括分布式训练、模型压缩、量化部署、低资源适配等方向。
4. 利用LLM前沿技术方向,负责AI内容生成和编辑(prompt设计、大模型SFT和预训练,大模型强化学习等)、内容理解和质量识别(质量分级、内容结构化、智能标签/摘要等)、场景应用(需求理解、用户刻画、个性化推荐)等
任职要求
1. 本科以上学历,5年以上工作经验,2年以上机器学习,深度学习,NLP,图像识别等相关开发经验,1年以上大模型(参数量≥10B)相关项目经验。。
2. 扎实的机器学习和深度学习基础,熟悉主流大模型架构(如Transformer、BERT、GPT、LLaMA、DeepSeek、Diffusion等)。
3. 精通PyTorch/TensorFlow等框架,具备大模型训练调优经验(数据清洗、Prompt工程、LoRA/QLoRA等微调技术)。
4. 熟悉大模型相关技术链:分布式训练(DeepSpeed、Megatron)、推理加速(vLLM、TensorRT)、评估对齐(RLHF、DPO)等。
5. 具备优秀编码能力,熟练掌握Python/C++,熟悉Linux开发环境及高性能计算优化。
6. 具备大模型应用开发经验(Agent、RAG、知识库增强等)。
加分技能:
1) 熟悉大模型生态工具链(LangChain、LangGraph、HuggingFace、LlamaIndex等),或有开源项目贡献经验。
2) 掌握CUDA编程、模型量化(INT8/FP16)、服务化部署(Docker、Kubernetes)等技术
简历投递邮箱:*****************
联系人:张经理