职位详情
AI数据提效实习生-大模型数据服务中心
3000-4000元
字节跳动
北京
本科
01-27
工作地址

中国大陆北京市海淀区中关村大街11号e世界财富中心C座,邮编:100089

职位描述

岗位职责:

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队;
主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。

1、技术落地实施,通过Agent/Workflow/代码等自动化手段搭建数据生产全链路,完成数据生产,或在技术平台完成小规模自闭环数据实验与数据效果验证,实现数据处理链路的自动化流转;
2、合成数据管线支持,参与SFT、RL训练数据的技术落地,利用模型生成高质量的训练样本并编写脚本进行数据一致性与质量的自动化校验;
3、全流程技术支持与工具开发,提供技术指导,定位并解决业务推进中的技术卡点、完成数据提效类工具开发,熟悉Trae/Claude Code/Copilot等Al原生IDE,快速开发或交付高可用的数据提效工具,能够利用AI工具大幅缩短代码开发周期;
4、数据运营与策略评估,负责大模型安全策略的落地验证工作,深度协同产品与研发团队,执行高质量的数据标注与评测,量化线上拦截策略表现及模型防御边界,评估模型安全防御能力,基于数据反馈驱动安全策略的持续选代与优化;
5、数据方法探索,前沿数据训练方法的探索与落地实践,沉淀自动化数据生产方法论,持续跟踪AI领域的前沿工具与技术(如MCP、Skills等),将业务需求转化为可复用的工程化Demo,辅助提升团队整体的数据运营效率。

任职要求:

1、本科及以上学历在读,计算机科学、软件工程、数学或相关理工科专业优先;
2、深入理解Prompt Engineering,能够编写结构化Prompt以引导模型输出标准化的JSON/XML数据格式优先;
3、精通扣子或类似LLM应用开发平台,深刻理解RAG(检索增强生成)、Function Calling及Agent编排逻辑,有复杂Workflow搭建与调试的实际项目经验优先;
4、对AI有热情,有较强的自驱力,具备独立判断的思维,能够利用AI工具极速解决问题,可以流畅阅读英文文档,具备较强的快速学习能力(包括论文研究)与技术落地执行力,能清晰、准确地传达信息和想法,具备优秀的沟通协调能力及团队合作精神。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请