职位详情
感知决策算法工程师 (VLM方向)
6000-12000元
甘肃华悦信息系统工程有限责任公司
兰州
不限
本科
08-15
工作地址

中广商务大厦1602

职位描述
职位描述
1、设计并实现VLM模型,实现工作空间视觉感知和指令语义解析,包括但不限于Grounding/Affordance等算法 。
2、优化VLM模型框架和算法组件,构建实现zero-shot/few-shot的多任务通用感知能力。
3、负责感知决策相关多模态数据集的构建、清洗等,提升算法性能和决策质量。
4、负责模型的训练策略的设计与优化,提升模型性能与泛化能力 。
5、负责VLM的训练与微调,实现模型实际场景的落地需求。
6、支持VLM模型在机器人控制系统中的集成,确保算法的实时性和稳定性。
职位要求
1、计算机科学、人工智能、机器人工程或相关领域硕士及以上学历。
2、具备深度学习、计算机视觉和自然语言处理的扎实理论基础和实践经验。
3、熟练掌握Python、C++等编程语言,有使用PyTorch、TensorFlow等深度学习框架的经验。
4、熟悉VLM/MLLM模型的训练流程,包括数据预处理、预训练、模型调优和验证等,了解常见的增量训练方法与大模型微调方法。
5、具备良好的团队合作精神和沟通能力,能够通过团队协作推进项目进展。
6、加分:熟悉 CLIP、BLIP 等多模态预训练基座,有 LLava、MiniGPT、CogVLM 等多模态大模型项目经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请