职位详情
深度学习算法工程师
2.5-2.8万
中数元宇数字科技(上海)有限公司
上海
1-3年
本科
06-13
工作地址

国家会展中心(上海)青浦区徐泾镇涞港路181号国家会展中心B栋616室

职位描述
岗位职责:
1、模型开发与训练:
使用PyTorch/TensorFlow设计和训练深度学习模型,应用于计算机视觉、自然语言处理或其他AI场景。
进行模型性能实验,优化架构,提升精度和效率。
与产品和硬件团队合作,定义模型需求,确保与产品目标一致。
2、模型转换与部署:
使用高通SNPE工具链将模型转换为DLC等高通支持格式,适配Hexagon DSP和Adreno GPU。
使用RKNN-Toolkit2将模型转换为RK3588 NPU支持的格式,确保高效推理。
确保模型在移动和嵌入式系统中的无缝集成,满足硬件约束。
3、模型优化:
通过INT8/FP16量化和剪枝,优化模型以适配高通Hexagon DSP、Adreno GPU及RK3588 6TOPS NPU。
分析并解决模型推理中的性能瓶颈,降低延迟、内存占用和功耗。
确保模型满足实时推理的严格要求。
4、性能评估与测试:
在目标硬件(高通Snapdragon、RK3588)上进行模型性能基准测试。
分析延迟、内存和功耗问题,优化模型表现。
验证模型在资源受限设备上的稳定性和可靠性。
5、协作与文档:
与硬件工程师、软件开发者和产品经理紧密合作,确保模型开发与系统需求一致。
记录模型开发、优化和部署流程,确保可重复性和知识共享。
跟踪深度学习、移动AI和硬件加速技术的最新进展。
任职要求:
1、教育背景:
计算机科学、电子工程、人工智能或相关领域的本科或硕士学位,博士学位加分。
2、工作经验:
2年以上使用PyTorch/TensorFlow进行深度学习模型开发的经验。
熟悉高通SNPE工具链及模型转换部署。
掌握RKNN-Toolkit2,具备适配RK3588 NPU的经验。
精通模型优化技术(如INT8/FP16量化、剪枝),适配移动/嵌入式平台。
3、技术技能:
精通Python及PyTorch/TensorFlow框架。
深入理解神经网络架构(如CNN、RNN、Transformer)及其应用。
熟悉移动端推理需求(如低延迟、低功耗、内存限制)。
具备高通Hexagon DSP、Adreno GPU或RK3588 NPU优化经验者优先。
熟悉C/C++(性能关键应用)加分。
4、软技能:
优秀的问题解决能力和团队协作精神。
良好的沟通能力,能向技术和非技术人员清晰表达复杂概念。
主动学习新工具和技术的积极性。
优先条件:
熟悉其他NPU或AI加速器工具链(如TensorRT、OpenVINO)。
具备移动或边缘设备上的计算机视觉或NLP应用经验。
了解Android或基于Linux的嵌入式系统开发。
有开源AI项目贡献或相关领域发表论文者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请