职位详情
数据工程师(数据增强与合成)
面议
国机数字科技有限公司
南京
3-5年
本科
01-09
工作地址

玄武大道699号-18号19栋

职位描述

岗位职责:

1. 负责探索大模型数据合成增强算法、数据蒸馏模型、强化学习等前沿数据工程技术;
2. 负责开发数据合成工具,数据清洗Pipeline核心算法开发,实现大规模数据的智能清洗、分类与质量评估,
3. 负责数据集构建与管理,设计和构建大模型训练/推理所需的数据集,建立数据质量管控系统;
4. 与训练、推理团队协作,构建数据-训练-推理全链路融合系统



任职要求:

1. 3年以上相关工作经验,扎实的Python编程基础,熟练运用数据科学核心工具栈,熟悉常见数据集格式与协议,熟悉高质量数据集的构建;
2. 熟悉Claude Code,Codex等AI编码工具与prompt工程技巧;
3. 掌握大模型领域的数据合成、模型蒸馏、数据增强技术,熟悉数据处理库、工作流引擎、数据版本管理,熟悉数据中4.具备LLM项目经验,深入了解模型训练数据处理完整流程-有数据质量算法设计与优化经验,拥有多模态数据处理业务背景(自动化标注、图像理解、OCR等)

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请