职位描述
职位描述
1、负责大模型训练与优化:主导模型的分布式训练、显存优化(DeepSpeed等框架),提升训练效率与资源利用率;
2、智能对话系统开发:设计并落地高可用对话机器人、智能客服系统,涵盖意图识别、多轮对话管理、响应生成等核心模块;
3、技术前沿探索:跟进MoE、RAG、Agent等新技术趋势,推动大模型在企业级场景(如知识问答、文档分析)的规模化应用;
4、跨团队协作:与产品、工程团队紧密配合,平衡模型效果、推理延迟与部署成本。
任职要求
1、本科及以上学历,计算机/数学相关专业,扎实的编码能力(Python/C++);
2、熟悉Transformer、LoRA/P-Tuning等微调技术;
3、精通NLP核心技术:文本生成、对话状态跟踪、实体识别,熟悉LangChain/LLamaIndex等应用框架;
4、掌握分布式训练、显存优化(ZeRO、Offload)、混合精度训练等关键技能。
加分项:
1、具备智能客服、虚拟助手等对话系统全链路开发经验;
2、熟悉vLLM、TensorRT-LLM等推理加速框架,或有多模态对话系统开发经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕