职位描述
IT互联网类/数据开发
1、负责数据仓库的模型设计与开发,包括但不限于概念模型、逻辑模型、物理模型的设计与优化;
2、基于阿里云DataWorks平台进行数据开发,完成ETL流程设计与实现,保障数据加工的高效性和稳定性;
3、参与数据迁移工作,包括数据清洗、数据验证、跨平台数据同步等,确保数据迁移的完整性和准确性;
4、配合团队优化数据仓库性能,解决数据处理中的技术瓶颈(如Spark任务调优);
5、编写技术文档,清晰描述模型设计、数据血缘关系及数据处理逻辑;
6、与业务团队协作,理解需求并转化为可落地的数据仓库解决方案。
任职资格
1、熟悉数据仓库建模方法论(如维度建模、范式建模等),具备实际数仓建模经验;
2、精通SQL开发,熟悉DataWorks开发流程,有阿里云大数据产品(MaxCompute、Hologres等)使用经验;
3、掌握Spark技术栈,能够独立完成Spark任务开发与调优;
4、具备数据迁移项目经验,熟悉异构数据源迁移的流程与工具;
5、熟悉Linux环境,掌握Shell/Python等至少一门脚本语言。
加分项
1、持有阿里云相关认证(如ACP大数据工程师);
2、有大型企业级数据仓库或数据中台项目经验;
3、熟悉Hadoop生态(Hive、HBase等)或其他云平台(AWS、腾讯云)技术;
4、具备数据治理、数据质量管控相关经验