一、岗位职责
1、算法研发与优化
参与计算机视觉相关算法开发,包括但不限于OCR(文字检测/识别)、视频分析(行为识别、时序建模)、目标检测、图像分类等方向,负责模型设计、训练、调优及部署落地;
探索多模态大模型(如视觉-语言模型)在业务场景中的应用,包括模型轻量化、指令微调、知识蒸馏等技术优化;
针对实际业务需求(如低资源场景、实时性要求),设计高效算法解决方案。
2、大模型技术实践
参与大规模预训练模型(CV/NLP/多模态方向)的训练、微调及性能优化,解决分布式训练、显存优化、模型压缩等问题;
结合业务数据,设计prompt工程、数据增强、模型评测方案,提升大模型在垂直领域的泛化能力。
3、技术研究与工程支持
负责计算机视觉领域前沿算法和系统的跟进与研究,
协助完成数据处理、特征工程、模型部署,
负责算法在应用领域的性能优化和落地
二、任职要求
1、基础要求
本科及以上学历,计算机科学、电子工程、数学、自动化等相关专业;
扎实的编程能力,熟练使用Python,熟悉PyTorch/TensorFlow等深度学习框架,掌握数据结构与算法设计。
2、技术能力
计算机视觉方向:
熟悉CV领域经典任务(如OCR中的CTPN/DBNet/CRNN,目标检测中的YOLO系列、Faster R-CNN等);
具备实际项目经验,如文档解析、视频内容理解、图像分割等。
大模型技术栈:
熟悉Transformer架构及主流大模型(如CLIP、LLaMA、Stable Diffusion),了解预训练、指令微调、RLHF等技术;
有分布式训练(Deepspeed/Megatron)、模型量化/剪枝、LoRA/P-Tuning等轻量化经验者优先。
加分项:
在CVPR/ICCV/ECCV/NeurIPS等顶会发表论文,或在Kaggle、天池等竞赛中取得优异成绩;
熟悉多模态技术(如视觉问答、图文生成)、强化学习或AutoML工具链;
有开源项目贡献或技术博客撰写经验,代码工程能力突出。
软性要求:
逻辑清晰,具备快速学习与解决问题能力,对技术落地有强烈兴趣;
良好的沟通能力与团队协作意识,能适应快节奏的研发环境。
工作地点:杭州 余杭区