职位详情
AI工程师
1-2万
航科院(北京)科技发展有限公司
北京
3-5年
硕士
01-14
工作地址

北京市朝阳区光熙门北里甲31号

职位描述
岗位职责:
• 负责主流大语言模型(LLaMA、Qwen、ChatGLM等)、多模态模型的研究与应用落地,主导从技术预研、模型微调优化到工程化部署的全流程链路。
• 针对具体业务场景(如智能交互、行业知识库、AI助手等),设计并实施高效的模型微调方案,包括指令微调(SFT)、LoRA/QLoRA等参数高效微调技术的实践与优化。
• 结合业务需求构建检索增强生成(RAG)系统、智能体(Agent)等大模型应用,负责核心模块开发与性能调优,保障系统的高可用性与低延迟。
• 跟踪AI领域前沿技术动态,开展技术预研(如多模态融合、推理加速等),将新技术、新方法快速转化为业务解决方案,提升产品技术竞争力。
• 搭建并优化模型训练与推理环境,熟悉多GPU分布式训练、模型量化(INT8/FP16)、推理框架(vLLM、TensorRT等)的应用,提升模型训练与运行效率。
• 协同产品、研发等跨职能团队,将业务需求转化为清晰的技术实现路径,推动AI能力在实际项目中落地并产生业务价值。

任职要求:
• 硕士及以上学历,计算机科学、人工智能、数学等相关专业,3年以上AI领域相关工作经验,具备完整的大模型微调与落地项目经验者优先。
• 精通Python编程语言,熟练掌握至少一种主流深度学习框架(PyTorch优先),深入理解Hugging Face生态(Transformers、PEFT、Accelerate等库)的使用。
• 具备扎实的机器学习、深度学习理论基础,深入理解Transformer架构,熟悉大模型训练、微调的核心原理与关键技术,能独立解决模型调优过程中的复杂问题。
• 具备良好的工程化能力,熟悉Linux系统操作、Shell脚本开发,了解云原生(Docker、K8s)或分布式计算技术,能完成模型的工程化部署与运维。
• 具备优秀的分析与解决问题能力、跨团队沟通协作能力,对技术充满热情,有较强的学习能力和抗压能力,能快速响应业务需求并推进项目落地。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请