工作职责:
1. 负责智能座舱场景下多模态大模型的性能优化,包括但不限于模型量化、剪枝、蒸馏等加速方法,以确保模型在端、云、端云混合等不同计算架构下的高效运行。
2. 深入挖掘不同边缘设备的硬件特性,适配和优化多模态大模型,在计算资源和模型精度之间做出权衡,通过技术创新和优化策略获得性能更优的模型,确保在资源受限的环境能高效运行。
3. 参与分布式训练及推理框架的落地与优化,提高大规模数据处理性能及硬件资源利用率。
4. 优化智能座舱场景下多模态大模型与其他算法模型(DMS\OMS、语音)的协同推理全链路。
任职要求:
1. 计算机、信息、数学、电子、自动化、机械、测控、汽车等相关专业本科及以上学历。
2. 具有在视觉-语言模型(VLM)或其他多模态AI项目中的模型轻量化部署工作经验,熟悉LLM、VLM等新兴模型。
3. 精通模型性能和资源优化技术,如量化、剪枝、蒸馏、NAS搜索等,熟悉LLM模型的优化方法如MoE、投机采样、LoRA等,有成功优化落地的项目经历
4. 深入理解模型性能分析工具和方法,能够准确评估模型在不同硬件上的性能,熟悉GPU/NPU等硬件上的性能分析工具。
5. 对智能座舱、人机交互、深度学习等领域有浓厚兴趣,在技术上有高追求,能保持长久投入和饱满激情;
加分项:
1. 在端侧硬件(如英伟达、高通SOC等)有实际加速深度学习模型的经验,熟悉常见硬件的体系结构和性能特性
2. 有多核异构和并行计算开发经验者优先