职位详情
大模型轻量化算法研究岗(FXQ25)
面议
江淮前沿技术协同创新中心
合肥
3-5年
硕士
04-16
工作地址

中安创谷科技园二期-H6栋

职位描述
岗位职责:
1.负责研究和开发基于各类神经网络模型(Transformer,Diffusion,MLP等)的压缩算法(如剪枝、量化、知识蒸馏等),提升模型效率并降低计算资源需求;
2.基于主流深度学习框架(如PyTorch、TensorFlow等),优化模型性能与资源占用之间的平衡;
3.紧跟前沿压缩技术(GPTQ、AWQ、QLoRA等),实现模型的8bit、4bit量化压缩;
4.与算法团队和工程团队协作,将压缩算法实现至现有场景中;
5.编制相关技术文档,撰写相关论文和专利。
任职条件:
1、学历: 硕士研究生及以上;
2、专业:计算机、人工智能、自动化、机器人学等相关专业;
3、经验及行业背景: 3年以上相关研究经验;
4、特殊要求(知识、技能等):
(1)熟悉主流深度学习框架(如PyTorch、TensorFlow),熟悉主流神经网络架构(如Transformer、CNN、GRU、SNN等);
(2)掌握模型的轻量化技术,包括但不限于模型剪枝、量化、知识蒸馏、低秩分解等;
(3)熟悉模型压缩与加速的算法(如PTQ和QAT、在线量化和离线量化等),能够针对模型设计高效的轻量化方案;
(4)有模型开发或优化经验、有模型剪枝、量化、蒸馏等轻量化技术的实际项目经验者优先;
(5)能够紧跟领域的研究动向,具有较强的责任心、良好的沟通能力、组织协调能力与执行力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请