2-3.5万
中航工业南航大厦6楼
岗位职责:
针对垂直场景设计大模型的领域微调方案,提升模型在特定任务中的准确性和效率;
探索高效微调技术(如LoRA、Adapter、Prompt Tuning)和强化学习技术(如GRPO、PPO、DPO),进行大模型的领域适配;
主导大模型的知识蒸馏(Knowledge Distillation)技术,设计师生模型架构并优化蒸馏策略,从大模型向专用小模型迁移能力;
实现模型量化(FP16/INT8/二值化)及动态量化方案,平衡精度与推理速度;
开发轻量化模型,结合剪枝、低秩分解等技术优化模型结构;
跟踪大模型轻量化领域前沿技术(如Diffusion模型压缩、动态网络架构),推动团队技术迭代;
协同数据团队设计高质量微调数据集,提供算法层面的业务支持。
招聘要求:
精通PyTorch/TensorFlow框架,深入理解大模型训练流程(预训练、SFT、RLHF);
掌握模型压缩全栈技术:知识蒸馏、量化、剪枝、低秩分解,熟悉业界工具;
熟悉轻量化模型设计范式(如NAS搜索、注意力简化、参数共享),具备从0到1构建专用小模型的经验;
透彻理解Transformer架构及其变体(如FlashAttention、稀疏Attention),能针对性优化计算效率;
熟悉分布式训练技术(数据/流水线/张量并行),具备多卡训练调优经验;
计算机科学、人工智能、应用数学等相关专业博士优先。
加分项:
发表过模型压缩、高效训练相关顶会论文(NeurIPS、ICML、ACL等)。
有多模态大模型(如CLIP、Stable Diffusion)轻量化实践经验。
参与过开源社区项目(如参与LLaMA.cpp、TensorFlow Lite优化贡献)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕