工作职责
1、组建并管理数据工程团队,涵盖开发与管理人才、制定考核标准、促进团队成长。
2、负责文本、图像、视频、传感器、结构化数据等多模态数据建模,定义数据标准,负责数据智能体产品各环节数据支持,包括数据处理、模型评测、结果整合、数据统计等。
3、设计多模态数据Pipeline,选型技术栈。负责图像、视频、音频的数据自动化处理流程,包括格式转换、搭建清洗链路、数据可视化等,构建数据质量管控机制,确保数据准确性、一致性。
4、与知识工程团队协作,定义数据-知识映射关系,支撑知识抽取与融合。
5、优化数据处理性能,满足实时/准实时决策需求。
任职要求
1、硕士及以上学历,计算机、数据科学或相关专业,8年以上大数据架构师/工程师经验,其中3年以上团队管理经验,处理过TB级文本、图像、传感器数据,具备多个大数据平台设计架构、数据架构、数据治理等项目经验者优先。
2、精通OCR、CV、NLP、语音识别等多模态数据处理技术,熟悉至少两种分布式计算框架,对大模型预训练、微调、评测等内部逻辑及具体流程有一定了解,具有丰富的工程开发经验,能基于python进行数据分析,数据可视化等功能开发,有自动化流程开发经验者优先;有图像处理、音视频处理经验者优先。
3、有政府/互联网/央国企等大型组织大规模多模态数据平台建设经验;熟悉主数据、数据标准(含指标标准、业务数据标准)、数据建模等政企数据治理相关的体系和方法,有行业数据标准的标准规范建设经验优先。
4、了解本体工程/知识图谱技术,具备数据与知识融合的实践经验,持有CDA数据架构师认证者优先。
具有较强的学习能力、逻辑分析能力、问题排查能力,良好的沟通能力和团队协作精神,主观能动性强,认真细致,责任心强,能主动发现问题。