职位详情
视觉图像算法工程师-手势识别方向(2D/3D)
2.5-3.5万
中数元宇数字科技(上海)有限公司
上海
5-10年
硕士
01-07
工作地址

张江科学之门-A塔43层

职位描述

基于单双目、RGB/灰度摄像头及 MR/XR 眼镜相关传感器输入,构建端侧可部署的 2D/3D手势识别系统,输出稳定可用的 Gesture Result(手势类别/置信度/hand_id/ts/可选连续参数),持续提升在真实 XR 场景中的鲁棒性、低延迟与一致性。

职责

1. 设计并实现手势识别算法体系(端到端)

面向头戴式 Egocentric(第一人称)视角,开发手势识别算法:包括静态/动态手势、连续交互手势(如 pinch/slide/rotate/tap 等)。结合摄像头、TOF 、IMU/交互行为数据与环境语义信息,完成低延迟、高稳定的手势理解与事件输出。

2. 构建 2D/3D 手势表征与时序建模,设计并优化手势识别模型与特征。

3.手势识别系统工程化:规则/状态机/冲突矩阵/置信度校准,产出可解释、可调参、可诊断的手势识别“策略层”。

4. 端侧部署与芯片适配(XR 手势芯片落地),面向 XR 芯片/端侧平台(RKNN 、Qualcomm等)进行模型网络修改与加速:蒸馏、量化、剪枝、算子替换与一致性验证;形成端侧推理性能、延迟、功耗与效果的平衡方案,并推动落地与问题闭环。

5. 与 SDK 项目组协作完善手势 SDK 提供手势识别输出协议(API/数据结构/错误码)、调试工具与数据闭环能力(录制、回放、可视化),支持应用侧快速集成与验证。

学历

计算机科学、软件工程、数据科学或相关专业,硕士及以上学历。

技能

扎实的计算机视觉/机器学习/数学基础,具备算法设计与实现能力。

具备 2D/3D 手势识别、动作理解(Action Recognition)、骨架序列建模 经验者优先;熟悉VR/AR/XR 场景优先。

熟悉深度学习模型及训练/推理流程:CNN / Transformer / RNN / TCN / 轻量化网络;具备算法迁移、模型压缩与部署经验。

熟悉多模态/多传感器融合基础(至少能理解并使用 IMU 、深度、双目几何或 TOF 信息辅助鲁棒性。

经验

3-5 年左右经验,能够独立开展工作并推动落地闭环有边缘设备上视觉模型开发/部署经验

沟通协作能力强,能够跨团队高效推进独立思考并解决复杂技术问题的能力

加分

有算法优化与硬件平台部署经验(端侧性能/功耗/延迟优化)。

在 AI 领域知名期刊或会议发表过论文/专利/开源项目贡献。

有 Egocentric / Head-mounted Vision 、移动端/边缘设备视觉算法经验者优先

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请