职位描述
岗位职责
1、基于阿里云大数据平台(MaxCompute、DataWorks、E-MapReduce、Flink CDC 等)设计并开发数据仓库分层模型(ODS/DWD/DWS/ADS);
2、独立完成复杂 ETL 任务开发与优化,基于阿里云产品特性解决数据处理性能问题;
3、基于 Flink/Spark 等计算引擎开发实时 / 离线数据处理任务,满足业务的实时监控、离线分析需求;
4、制定数据质量规则,搭建数据质量监控体系,保障数据准确性、完整性、及时性;
5、对接业务方需求,提供数据技术解决方案,协助解决业务数据分析过程中的技术问题;
6、搭建数据质量监控体系,保障算法数据的准确性、完整性和及时性。
任职要求
1、本科及以上学历,计算机、大数据相关专业,3-5 年数据开发相关工作经验;
2、精通 SQL/Hive SQL/MaxCompute SQL,熟练使用 MySQL、Hive、ClickHouse 等至少两种数据存储工具;
3、精通阿里云大数据生态(DataWorks、MaxCompute、Flink 全托管、PAI 等),有 2 年以上阿里云平台数据开发经验;
4、熟练掌握 Flink/Spark 至少一种计算引擎,能基于阿里云产品完成实时 / 离线数据开发
加分项:熟悉常用机器学习算法(如 LR、XGBoost、随机森林、深度学习基础),有算法数据支撑、特征工程落地经验;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕