职位详情
AI应用开发工程师
2-3万
北京联合永道软件股份有限公司
北京
5-10年
本科
04-14
工作地址

华控大厦6楼601

职位描述
【岗位职责】——公司内部岗位,非外包
1. 大模型开发与应用:
• 基于主流大模型(如DeepSeek、Qwen、GPT、LLaMA)进行领域适配开发,设计并实现高效微调、Prompt工程及RAG(检索增强生成)方案;
• 优化模型推理性能,包括模型压缩(量化/剪枝)、分布式推理加速(vLLM/TensorRT-LLM)及显存优化;
• 构建多模态(文本/图像/音视频)大模型应用,支持业务场景的端到端落地。
2. 数据构建与标注:
• 主导领域数据集的构建,设计数据采集、清洗、去噪及增强方案,解决数据稀疏性与噪声问题;
• 搭建高效标注流程,开发自动化标注工具(如基于规则/弱监督/Active Learning),提升标注效率;
• 设计数据质量评估体系,制定标注规范与校验机制,确保数据一致性(如标注者间一致性>95%)。
3. 模型训练与调优:
• 实现大模型全流程训练方案,包括分布式训练(Deepspeed/Megatron-LM)、混合精度训练及超参数调优;
• 开发模型评估工具,监控训练过程(如Loss曲线/梯度异常),分析模型偏差与可解释性问题;
• 探索高效微调技术(如LoRA/P-Tuning/Adapter),降低训练成本并提升模型领域适应能力。

任职要求
1. 技术要求:
•熟练掌握Python及主流深度学习框架(PyTorch/TensorFlow),熟悉Hugging Face生态工具链;深入理解大模型技术栈:预训练/微调/蒸馏、注意力机制优化、显存管理(FlashAttention/Checkpointing);
•具备数据工程经验:熟悉数据标注工具(Label Studio/Prodigy)、数据版本控制(DVC)及数据闭环构建;
•熟悉多模态数据处理(CLIP/Whisper/Stable Diffusion)或模型压缩技术(量化感知训练/知识蒸馏);
•熟悉至少一种模型部署方案(Qwen2.5 VL/Deepseek R1/OpenAI API),了解模型监控(Prometheus/MLflow)。
2. 领域经验:
• 独立完成过百亿token级数据集的构建与清洗,或主导过1万+条标注数据的项目管理;
• 有垂直领域大模型(金融/医疗/教育等)训练调优经验,显著提升指标(如任务准确率提升
>15%);
• 熟悉大模型评估方法(MMLU/C-Eval/HumanEval)及安全对齐技术(RLHF/DPO)。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请