2-3万
北京市-海淀区-北四环中路辅路229号1741
核心职责要求
1. 技术开发与优化
· 主导垂类大模型(如金融、房产、广电领域)的预训练、微调(SFT)、强化学习(RLHF)全流程开发
· 设计Prompt工程模板,优化模型在RAG(检索增强生成)、Agent任务编排等场景的性能
· 开发分布式训练框架(如DeepSpeed/Megatron-LM),优化大模型训练/推理效率(如GPU资源调度、CUDA加速)
2. 前沿技术落地
· 探索多模态大模型(图文生成、语音对话)技术突破,推动生成式AI在智能客服、内容创作等场景的商业化
· 构建行业大模型生产体系(如数据采集、模型评估迭代),支持智能推荐、用户画像等业务需求
3. 工程与协作能力
· 主导模型部署与性能调优,解决工程化难题(如模型压缩、内存优化)
· 协同产品经理完成需求分析,制定技术方案并推动跨团队协作
任职资格
1. 教育背景
· 硕士及以上学历,计算机科学、NLP、机器学习相关专业(部分企业放宽至本科+3年经验)
2. 技术能力
· 编程基础:精通Python/C++,熟悉Shell脚本和Linux开发环境,熟练使用AI代码助手(如GitHub Copilot)
· 框架工具:深入掌握PyTorch/TensorFlow,熟悉Hugging Face Transformers、LangChain等生态工具
· 算法理解:透彻掌握Transformer架构、注意力机制、LoRA/P-Tuning等高效微调技术
3. 项目经验
· 具备大模型全流程开发经验(从数据处理到模型上线),至少参与过1个千万参数级模型的落地项目
· 有跨场景应用经验者优先(如智能对话系统、代码生成、AIGC内容生产)
4. 加分项
· 发表过顶会论文(NeurIPS/ACL等)或参与开源社区贡献
· 熟悉CUDA编程、NCCL通信库及分布式训练优化
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕