岗位内容:
一、核心职责
1.算法研发与优化
负责图像分类、语义分割、目标检测、实例分割等计算机视觉算法的研发与性能调优,支持安防监控、工业检测等场景落地。
基于深度学习框架(PyTorch/PaddlePaddle)实现算法原型,优化模型精度、速度和资源占用(如参数量、FLOPs)。
针对NVIDIA Jetson系列硬件(如Jetson AGX Orin、TX2)以及其他边缘计算和服务器硬件设备进行模型部署优化,包括量化、剪枝、TensorRT加速等。
2.工程化落地
开发跨平台(Linux/Windows)的C++推理引擎,集成模型推理、后处理逻辑和性能分析工具。
设计并实现高并发视觉处理流水线,结合多线程/异步编程优化端到端延迟。
使用Qt框架开发算法效果Demo,便于调试算法和像客户快速提供能力展示。
3.数据与系统维护
构建和管理大规模视觉数据集,设计数据增强策略和自动化标注流程。
确保算法在嵌入式设备上的稳定运行和版本迭代。
编写和维护技术文档。
二、技能要求
1.深度学习与数学基础
精通卷积神经网络(CNN)、Transformer架构及其变体(如Swin Transformer、ViT)。
熟悉损失函数设计、优化器选择(如AdamW、SGD+Momentum)和学习率调度策略。
理解模型压缩技术(知识蒸馏、稀疏训练)和硬件加速原理(CUDA、OpenVINO)。
2.框架与工具链
熟练使用PyTorch或PaddlePaddle进行模型训练,掌握分布式训练(DDP)和混合精度训练。
深入理解Ultralytics YOLO系列(YOLOv5/v8/v11)、MMDetection等开源项目,能快速复现和改进算法。
熟练使用OpenCV进行图像预处理和后处理,熟悉DALI、Albumentations等数据加载库。
3.硬件与部署
有NVIDIA Jetson系列开发经验,熟悉Jetson开发环境和CUDA Toolkit,掌握TensorRT模型转换与优化,能编写自定义CUDA内核加速关键算子。
了解ARM架构(如RK3588、 Xavier NX)和异构计算(CPU+GPU+NPU)部署方案。
4.编程与开发
掌握精通C++11/14/17/20,熟悉多线程编程(std::thread、OpenMP)和内存管理优化。
掌握Python高级特性(如装饰器、生成器)和科学计算库(NumPy、SciPy)。
熟悉Linux系统开发环境(Bash脚本、GCC/G++编译、GDB调试)。
5.系统设计
能设计模块化、可扩展的算法框架,支持热更新和动态加载模型。
理解实时系统时序约束,具备性能瓶颈分析和调优经验(如perf、NVTX)。
三、加分项
熟悉视觉大模型(CLIP,SAM,DINO等)和视觉语言大模型(VLM)。
有安防监控、工业缺陷检测、OCR视觉项目经验。
获得相关职业技能认证书。
发表过高水平专业论文,或参与过Kaggle/天池等竞赛并获奖。
维护过开源视觉项目(如贡献代码、撰写文档)。
熟悉Web开发(Flask/Django)或移动端开发(Android NDK),能构建完整产品原型。
了解Docker容器化和Kubernetes集群管理。
四、软性要求
1.问题解决能力
能通过日志分析、可视化工具(如TensorBoard、W&B)快速定位模型训练或部署问题。
具备硬件选型经验(如摄像头、传感器),能评估性能与成本的平衡。
2.沟通与协作
能编写清晰的技术文档,向非技术人员解释算法原理和限制。
适应敏捷开发流程,与硬件、测试团队紧密配合推动项目落地。
3.学习与创新
关注前沿论文(如arXiv、Papers With Code)和行业动态(如GTC大会新技术)。
主动探索新技术在业务场景中的可行性(如扩散模型生成数据、NeRF重建3D场景)。
4.职位福利:五险一金、通讯补助、定期体检、绩效奖金、餐补、创业公司、周末双休、交通补助
5.有残疾证者可投