职位描述
岗位职责要求
1、制定与公司AI产品与业务相匹配的高质量数据发展战略,规划前瞻性、多模态、多场景的数据集建设蓝图,支撑AI产品研发与业务落地的长期需求。
2、主导建立覆盖全流程的AI数据质量标准、安全管理规范、伦理合规体系及自动化评估机制,确保数据产出的合规性、一致性与高可用性。
3、主导数据集相关建设项目的全流程工作,包括需求分析、方案设计、资源协调、进度控制、质量验收与成本管理,对数据交付的规模、质量、时效及成本负责。
4、推动数据标注平台、数据集管理工具的研发与优化,构建高效、敏捷的数据生产体系,协调并拓展外部数据合作伙伴、供应商及标注生态。
5、研究并引入数据发现、合成、增强、自动标注及价值评估等领域的前沿方法与技术,持续提升数据生产的效率、规模与智能化水平。
6、作为数据专家,协同算法、产品团队,将数据需求精准转化为可执行的方案,为模型训练、评测及迭代提供数据支持。
任职详细要求
1、硕士研究生及以上学历,计算机科学、人工智能、数据科学等相关专业。
2、5年以上数据相关工作经验,至少3年专注于AI训练数据领域。
3、扎实的机器学习与深度学习基础,熟悉常见模型架构及其对数据特性的要求。熟练使用Python及主流ML框架(如PyTorch, TensorFlow, Scikit-learn)。具备完整的模型训练、评估与调优实践经验。
4、深刻理解AI(特别是大模型与深度学习)对数据的需求,精通数据生命周期管理。具备从零到一规划并交付大规模、高质量、多模态(文本、图像、语音等)数据集的成功经验。
5、熟悉数据标注平台、质量管理工具及主流数据治理框架,对主动学习、合成数据、指令数据工程、数据评估等领域的技术趋势有深入洞察和实践经验。
6、具备垂直行业的业务知识转化为数据定义与标注schema的能力,有能源行业高质量数据集构建经验者优先。
7、对数据安全、隐私保护(如GDPR、个人信息保护法)及AI伦理有深刻理解,并能将其落实到具体的数据规范与流程中。
8、出色跨部门协作与沟通能力,能清晰地向技术与非技术干系人阐述数据战略与价值,能领导复杂项目并在多线并行中确保目标达成,具备极强的系统性思维、逻辑推理能力和解决复杂问题的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕