职位详情
大模型算法专家
2.5-5万
深圳市科思科技股份有限公司
深圳
3-5年
博士
04-08
工作地址

中航工业南航大厦6楼

职位描述

岗位职责:

针对垂直场景设计大模型的领域微调方案,提升模型在特定任务中的准确性和效率;

探索高效微调技术(如LoRA、Adapter、Prompt Tuning)和强化学习技术(如GRPO、PPO、DPO),进行大模型的领域适配;

主导大模型的知识蒸馏(Knowledge Distillation)技术,设计师生模型架构并优化蒸馏策略,从大模型向专用小模型迁移能力;

实现模型量化(FP16/INT8/二值化)及动态量化方案,平衡精度与推理速度;

开发轻量化模型,结合剪枝、低秩分解等技术优化模型结构;

跟踪大模型轻量化领域前沿技术(如Diffusion模型压缩、动态网络架构),推动团队技术迭代;

协同数据团队设计高质量微调数据集,提供算法层面的业务支持。

招聘要求:

精通PyTorch/TensorFlow框架,深入理解大模型训练流程(预训练、SFT、RLHF);

掌握模型压缩全栈技术:知识蒸馏、量化、剪枝、低秩分解,熟悉业界工具;

熟悉轻量化模型设计范式(如NAS搜索、注意力简化、参数共享),具备从0到1构建专用小模型的经验;

透彻理解Transformer架构及其变体(如FlashAttention、稀疏Attention),能针对性优化计算效率;

熟悉分布式训练技术(数据/流水线/张量并行),具备多卡训练调优经验;

计算机科学、人工智能、应用数学等相关专业博士优先。

加分项:

发表过模型压缩、高效训练相关顶会论文(NeurIPS、ICML、ACL等)。

有多模态大模型(如CLIP、Stable Diffusion)轻量化实践经验。

参与过开源社区项目(如参与LLaMA.cpp、TensorFlow Lite优化贡献)。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请