职位详情
AIGC世界模型标注与评估研究员
1-1.5万
腾讯瑞德铭(重庆)科技发展有限公司
成都
不限
本科
01-29
工作地址

腾讯成都大厦-A座

职位描述
一、岗位职责 (Responsibilities)
1. 高质量SFT数据构建

精细化视频描述 (Dense Captioning): 负责世界模型SFT(监督微调)阶段的高质量数据生产。对视频内容进行多维度的深度描述,需精准还原主体动作、光影氛围、物理动态(如流体、重力、碰撞效果)及材质纹理。

和场景的交互标注: 识别并标注视频中的主体和环境的交互动作,标注交互动作的时间戳,建立标注动作的类目体系。

Prompt工程与优化: 编写与优化复杂的视频生成提示词(Prompts),设计涵盖不同风格、场景和物理交互的高难度指令,构建“文本-视频”高度对齐的训练数据集。

2. 模型多维评测 (Evaluation)

多维度质量评估: 建立并执行世界模型的评测体系。从交互动作、时空一致性(物体是否变形/闪烁)、物理真实性(是否存在反重力、穿模、逻辑谬误)及文本遵循度等维度对生成结果进行打分与分级。

GSB 对比: 对比不同版本模型或竞品的生成效果,捕捉细微差异,执行盲测与胜负判定。

3. 数据分析与指标洞察 (Analysis)

指标分析与报告: 深度分析评测数据,结合客观指标与主观评分,监控模型在核心指标上的变化趋势。

Badcase挖掘与闭环: 归纳模型在特定场景下的失效模式(Failure Modes),输出高质量的分析报告,辅助算法团队定位问题并制定优化策略。

标准制定: 参与制定视频数据的标注规范与评测标准,沉淀可复用的QA文档与样张库。

二、任职要求 (Requirements)
专业能力要求 1) 学历与专业: 本科及以上学历。理工科背景,对视觉艺术有浓厚兴趣,或者有游戏行业相关经验。 2) 视觉与物理认知(核心): 深刻理解视听语言,熟悉专业的镜头术语(Pan/Tilt/Zoom/Dolly等)和构图法则。 对现实世界的物理规律(如惯性、重力加速度、流体动力学、光影反射)有敏锐感知,能快速识别视频中不符合真实物理逻辑的“幻觉”瑕疵。 3) 语言能力: 具备优秀的中英文写作能力(英语CET-6及以上优先),能流畅阅读英文技术文档。 4) SFT认知: 了解生成式AI的基本原理,理解SFT数据对模型行为的影响。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请