数据开发工程师
1.5-2.2万
南京 本科
玄武大道699号-18号19栋
岗位职责:
1. 负责探索大模型数据合成增强算法、数据蒸馏模型、强化学习等前沿数据工程技术;
2. 负责开发数据合成工具,数据清洗Pipeline核心算法开发,实现大规模数据的智能清洗、分类与质量评估,
3. 负责数据集构建与管理,设计和构建大模型训练/推理所需的数据集,建立数据质量管控系统;
4. 与训练、推理团队协作,构建数据-训练-推理全链路融合系统
1. 3年以上相关工作经验,扎实的Python编程基础,熟练运用数据科学核心工具栈,熟悉常见数据集格式与协议,熟悉高质量数据集的构建;
2. 熟悉Claude Code,Codex等AI编码工具与prompt工程技巧;
3. 掌握大模型领域的数据合成、模型蒸馏、数据增强技术,熟悉数据处理库、工作流引擎、数据版本管理,熟悉数据中4.具备LLM项目经验,深入了解模型训练数据处理完整流程-有数据质量算法设计与优化经验,拥有多模态数据处理业务背景(自动化标注、图像理解、OCR等)
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕