岗位职责:
1、负责公司离线及实时数据仓库/数据湖的设计与开发,保证所有数据实时抽取/汇聚到数据湖;
2、根据业务数据分析进行数仓数据模型的设计与开发,与大数据和开发团队协作进行数据底座平台的设计和开发工作,推动业务部门的数据化运营;
3、为公司平台所有系统级数据中台提供数据集市和主题层的数据服务,参与公司数据产品及应用项目开发建设;
任职要求:
1 、从事数据仓库开发领域至少5年以上,熟悉数据仓库模型设计与ETL开发经验,掌握维度建模设计方法,具备实时数仓架构设计及开发相关经验;
2 、精通数据仓库领域知识体系和技能,对数据采集、数据抽取、数仓分层架构、数据湖架构及应用、湖仓一体的实时数仓的设计和实施有比较丰富的经验;
3、精通数据模型的设计,深入理解离线、实时数仓及流批一体架构选型的技术特点,能够根据业务要求选择合适的技术栈,搭建符合公司平台要求的数据底座基础设施;
4、熟练掌握flink、kafka、spark、hive、hbase等流式/批式处理引擎或技术;
5、精通SQL,有一定的SQL性能调优经验,熟练掌握mysql等数据库的应用和接口开发优化;
6、精通java/python/shell/Scala其中至少一门语言;
7、具有电商行业经验或者互联网相关经验,有业务sense,能够通过梳理设计数据模型发现开发及产品业务问题,并驱动业务目标实现;
8、性格积极乐观,诚信,积极分享成果,有较强的语言表达能力;具备强烈的进取心、求知欲及团队合作精神。