职位描述
岗位职责
1)架构设计与开发:
负责安全领域大模型/Agent系统的架构设计与开发,解决高可靠性、可拓展性等关键技术问题;
优化深度学习超大模型的推理过程,提升系统性能、运行效率及资源利用率。
2)模型训练与优化:
设计定制化微调方案,包括高效大模型架构(如跨任务统一学习)、精调策略(LoRA/Prefix Tuning/SFT)、Prompt工程及Fine-tuning数据集构建;
实现核心算法与系统方案的工程落地,并进行效果验证与迭代优化。
3)技术前瞻与创新:
跟踪大模型领域前沿技术(如推理加速、分布式训练等),推动技术引入与落地;
协同团队攻克技术难题,提出提升模型性能的创新方法。
岗位要求
1)计算机、软件工程、自动化、应用数学等理工类专业,硕士及以上学历,有MLLM、LLM项目交付经验的优先(并可放宽至本科);
2)扎实的数理统计基础,对AI技术在安全领域的应用有强烈兴趣;
3)熟练掌握Python/Java/C++至少一门语言,熟悉数据结构,熟悉Linux开发环境,具备高质量代码开发能力;
4)熟悉主流深度学习框架(Pytorch/TensorFlow),有机器学习系统设计、开发或维护经验;
5) 熟悉GPU加速计算、并行计算技术,有大模型训练/推理/部署经验者优先;
6)责任心强,学习能力突出、具备良好的沟通协作能力和自驱力。
加分项
1)具备模型轻量化(剪枝、量化、知识蒸馏)或高性能计算优化经验;
2)熟悉大模型相关工具链(如FasterTransformer、Text Generation Inference、OpenAI Triton)并有实战经验;
3)具备多模态大模型(MLLM)或智能体(Agent)系统开发经验或者交付经验者优先;
4)在顶级会议(NeurIPS/ICML等)或期刊发表过相关论文,或参与过开源项目贡献。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕