职位描述
【岗位职责】
1. 数据治理与标准化:参与公司大数据平台的搭建与优化,优化离线实时数据仓库全链路,确保数据的高效流通和价值挖掘。
2. 数据仓库设计与开发:根据业务需求,设计和开发高效、可扩展的离线实时数据仓库解决方案,涵盖数据采集、清洗、转换、存储等全流程。
3. 数据仓库维护与优化:负责离线实时数据仓库的设计、开发与维护,确保数据的准确性和可靠性,包括数仓模型设计、ETL开发及性能优化。
4. 项目经验:具备多次从0到1构建离线/实时数据仓库的经验优先。
【任职要求】
1. 本科以上学历,数学、统计学、计算机相关专业;3年以上相关工作经验,具备较强的逻辑思维能力和问题解决能力。
2. 技术能力:
- 精通大数据技术体系(如Hadoop、Hive、Spark、Flink等),能够独立完成高质量的离线和实时开发场景。
- 熟悉Java代码开发、掌握drools类的规则引擎库设计和应用,具备flink和drools整合输出符合规则的数据
- 熟悉Sql、Shell、Python等脚本语言,具备良好的编程能力。
- 熟悉常用的数据仓库建模方法和规范,能够独立完成数据模型设计与开发,熟知数据仓库各层开发规范和代码要求。
3. 工具应用:
- 具备DolphinScheduler工作流调度工具的应用经验,整合大数据各项组件完成调度任务。
- 掌握SeaTunnel、datax数据同步工具,具备大数据集群调优维护能力,能够解决常见的技术问题。
- 掌握hive、spark、flink代码优化,具备参数调优能力
- 掌握Springboot,掌握flink整合drools处理数据,掌握部分规则校验代码开发功能
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕