1.8-3万
张江科学之门-A塔43层
基于单双目、RGB/灰度摄像头及 MR/XR 眼镜相关传感器输入,构建端侧可部署的 2D/3D手势识别系统,输出稳定可用的 Gesture Result(手势类别/置信度/hand_id/ts/可选连续参数),持续提升在真实 XR 场景中的鲁棒性、低延迟与一致性。
职责
1. 设计并实现手势识别算法体系(端到端)
面向头戴式 Egocentric(第一人称)视角,开发手势识别算法:包括静态/动态手势、连续交互手势(如 pinch/slide/rotate/tap 等)。结合摄像头、TOF 、IMU/交互行为数据与环境语义信息,完成低延迟、高稳定的手势理解与事件输出。
2. 构建 2D/3D 手势表征与时序建模,设计并优化手势识别模型与特征。
3.手势识别系统工程化:规则/状态机/冲突矩阵/置信度校准,产出可解释、可调参、可诊断的手势识别“策略层”。
4. 端侧部署与芯片适配(XR 手势芯片落地),面向 XR 芯片/端侧平台(RKNN 、Qualcomm等)进行模型网络修改与加速:蒸馏、量化、剪枝、算子替换与一致性验证;形成端侧推理性能、延迟、功耗与效果的平衡方案,并推动落地与问题闭环。
5. 与 SDK 项目组协作完善手势 SDK 提供手势识别输出协议(API/数据结构/错误码)、调试工具与数据闭环能力(录制、回放、可视化),支持应用侧快速集成与验证。
学历
计算机科学、软件工程、数据科学或相关专业,硕士及以上学历。
技能
扎实的计算机视觉/机器学习/数学基础,具备算法设计与实现能力。
具备 2D/3D 手势识别、动作理解(Action Recognition)、骨架序列建模 经验者优先;熟悉VR/AR/XR 场景优先。
熟悉深度学习模型及训练/推理流程:CNN / Transformer / RNN / TCN / 轻量化网络;具备算法迁移、模型压缩与部署经验。
熟悉多模态/多传感器融合基础(至少能理解并使用 IMU 、深度、双目几何或 TOF 信息辅助鲁棒性。
经验
3-5 年左右经验,能够独立开展工作并推动落地闭环有边缘设备上视觉模型开发/部署经验
沟通协作能力强,能够跨团队高效推进独立思考并解决复杂技术问题的能力
加分
有算法优化与硬件平台部署经验(端侧性能/功耗/延迟优化)。
在 AI 领域知名期刊或会议发表过论文/专利/开源项目贡献。
有 Egocentric / Head-mounted Vision 、移动端/边缘设备视觉算法经验者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕