职位详情
ai大模型算法工程师
2-3万
北京智视数策科技发展有限公司
北京
3-5年
硕士
04-03
工作地址

北京市-海淀区-北四环中路辅路229号1741

职位描述

核心职责要求

1. ​技术开发与优化

· 主导垂类大模型(如金融、房产、广电领域)的预训练、微调(SFT)、强化学习(RLHF)全流程开发

· 设计Prompt工程模板,优化模型在RAG(检索增强生成)、Agent任务编排等场景的性能

· 开发分布式训练框架(如DeepSpeed/Megatron-LM),优化大模型训练/推理效率(如GPU资源调度、CUDA加速)

2. ​前沿技术落地

· 探索多模态大模型(图文生成、语音对话)技术突破,推动生成式AI在智能客服、内容创作等场景的商业化

· 构建行业大模型生产体系(如数据采集、模型评估迭代),支持智能推荐、用户画像等业务需求

3. ​工程与协作能力

· 主导模型部署与性能调优,解决工程化难题(如模型压缩、内存优化)

· 协同产品经理完成需求分析,制定技术方案并推动跨团队协作

​任职资格

1. ​教育背景

· 硕士及以上学历,计算机科学、NLP、机器学习相关专业(部分企业放宽至本科+3年经验)

2. ​技术能力

· ​编程基础:精通Python/C++,熟悉Shell脚本和Linux开发环境,熟练使用AI代码助手(如GitHub Copilot)

· ​框架工具:深入掌握PyTorch/TensorFlow,熟悉Hugging Face Transformers、LangChain等生态工具

· ​算法理解:透彻掌握Transformer架构、注意力机制、LoRA/P-Tuning等高效微调技术

3. ​项目经验

· 具备大模型全流程开发经验(从数据处理到模型上线),至少参与过1个千万参数级模型的落地项目

· 有跨场景应用经验者优先(如智能对话系统、代码生成、AIGC内容生产)

4. ​加分项

· 发表过顶会论文(NeurIPS/ACL等)或参与开源社区贡献

· 熟悉CUDA编程、NCCL通信库及分布式训练优化

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请