职位描述
1. 参与多模态AI相关的技术和研发。从数据侧(data-centric),模型侧(model-centric),以及类人偏好侧(human-centric)等方面,开展相应的研究工作。包括并不局限于多模态数据融合对齐,数据高效学习(半监督、自监督),模型推理决策(planning, action),提示词优化(如思维链, 上下文学习)。结合多模态大模型的发展趋势,打造多模态通用的AI能力,形成有影响力的研究工作,包括论文和专利。
2. 深入多模态在计算机视觉中的应用场景,包括内容理解(检测、分割、分类)与生成(图像,视频生成,编辑等)相关的已有场景,以及机器人具身智能(如自主性决策、推理、控制,环境交互等),虚拟智能体助手(Agent)等新兴场景。提升相关技术和系统,在内外部业务场景进行验证,形成业内领先的技术服务能力和体系。
3. 从业务和系统角度,解决多模态大模型在视觉场景使用中的实际应用问题,如幻觉的克服,高效的参数微调,自我反思,主动在线学习等相关问题。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕