面议
永晖大厦B座2层
岗位职责:
构建行业领先的数据质量标准体系,为大型数据管理平台打造核心技术壁垒。与核心团队合作,主导平台质量管理项目。目标是服务于打造可用、可靠、可信的数据及数据服务平台。
一、平台技术深度整合
熟悉进而全面掌握现有数据管理平台的技术架构、数据流转机制及应用体系。识别质量管控节点和风险点,评估现有质量措施有效性,为标准体系建设提供技术基础。
二、业务场景研究分析
深入研究智能应用、数据服务、AI训练、数据分析等典型应用场景,分析不同场景的质量需求差异和痛点。形成场景化质量需求矩阵,指导标准体系的业务适配设计。
三、质量标准体系构建
设计涵盖数据本质质量、业务适配质量、生态系统质量、智能化治理四维度的完整标准框架。制定质量评估指标、算法方案及检测流程,确保体系的可扩展性和适应性。此外,该体系应与数据安全标准体系兼容和适配。
四、国际标准对标融合
研究如DNV-RP-0497、ISO/IEC 25012等国际标准,进行本土化改造和创新扩展。确保标准体系具备国际先进性、兼容国际标准体系的同时满足中国市场特殊需求。
五、智能化技术实现
设计基于机器学习的智能质量评估引擎,实现质量问题检测、评分模型训练及预测性管理。构建支持PB级数据(毫秒级、秒级、实时等)快速检测的实时监控系统。
任职要求:
• 计算机、数据科学、统计学相关专业硕士及以上学历;
• 5年以上大型数据平台或数据治理项目经验;
• 熟悉Hadoop、Spark、Kafka、Flink等大数据技术栈;
• 具备机器学习和深度学习理论基础及实践经验;
• 精通Python、Java、Scala编程语言及SQL技术;
• 深入了解ISO/IEC 25000系列、DAMA-DMBOK、GDPR等国际标准规范;
• 有企业级数据标准制定和质量管理项目实施经验;
• 熟悉一个或者多个数据质量检测工具(Talend[商用]、Informatica[商用]、Apache Griffin[开源]、Great Expectations[开源,Python/SQL]、Deequ/PyDeequp[开源,Spark/Scala/Python]、Soda Core[开源,YAML+SQL 或商业版]等);
• 熟悉分布式系统设计和微服务架构,有架构能力者优先;
• 优秀的业务理解能力和跨团队协作能力。
优先条件:
• 持有CDMP、DGSP等数据管理专业认证;
• 在知名互联网公司、金融机构有数据质量相关工作经验;
• 了解AI大模型、联邦学习、隐私计算等前沿技术;
• 有海外工作学习经验或国际技术交流参与经验,或有一定的英语水平;
• 在数据管理领域有技术文章发表或标准制定参与经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕