职位描述
有一定技术能力的,接受单休,请投简历,薪资可谈!
职位描述:
负责语音驱动图像合成算法的优化与实现,确保算法能够与移动端SDK进行高效对接,支持在移动端的音视频实时交互。
核心职责:
1.研发和优化轻量化的语音驱动图像生成算法,确保在中端手机上达到30fps的推理速度,以支持流畅的音视频交互。
2.与移动端SDK开发团队紧密合作,提供算法接口和相关文档,确保算法顺利集成到SDK(Android/iOS)中。
3.实现动态资源管理,根据设备的CPU和GPU性能自动调整模型精度(FP16/INT8),确保内存占用控制在500MB以内,适应移动设备的限制。
4.设计标准化API接口,提供人脸特征点输入和图像流输出的标准数据协议,支持实时数据传输。
任职要求:
1.计算机相关专业本科及以上学历,至少2年相关工作经验,具备算法移动端部署成功案例。
2.精通SyncNet、StableDiffusion等算法,具备AIGC的相关项目经验。
3.熟悉PyTorch模型轻量化技术((量化/剪枝),掌握TFLite/NCNN推理框架。
4.熟练使用C++11/14进行算法实现,具备OpenCV和FFmpeg集成经验。
5.了解WebAssembly编译优化,能够与前端开发人员有效沟通以支持Vue.js集成。
6.有音画同步算法开发经验者优先,要求唇形对齐误差小于40ms,以确保实时交互的准确性
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕