职位描述
岗位职表:
1.承接数据提取需求:根据业务需求进行需求分析,设计数据处理流程,使用SparkSQL或Hive SQL开发ETL脚本,完成数据开发工作;
2.保障数据交付质量:依据项目需求文档分析数据逻辑,设计数仓表结构,开发ETL脚本,执行数据验证测试,确保数据质量及处理性能达标,
技术要求:
1.本科及以上学历,计算机,电子信息相关专业,具有5年以上复杂业务场是下的ETLT程化开发经验,
2.精通Hadoop、Hive、Spark SQL开发,学握Hive/Spark资源分配、数据倾斜、执行计划等调优技巧:
3.具备PB级数据仓库构建或日均亿级日志处理的项目实践经验;
4.熟悉Linux操作系统,能熟练编写Shel/Python脚本实现自动化运维及数据处理,
【优先考虑】
1.有车企领域数仓ETL、车联网项目经验;
2.具备复杂嵌套JSON/Parquet结构数据的高效解析、治理及性能调优经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕