职位描述
- 平台设计与开发:
- 负责核心数据平台、数据仓库的架构设计与开发工作,确保系统的高性能、高稳定性和高扩展性。
- 主导数据需求分析、数据建模、ETL/ELT 开发、测试和上线等全流程工作。
- 根据数据应用场景进行技术选型,并指导团队成员进行数据开发。
- 技术难题攻关:
- 解决海量数据处理、实时计算、数据倾斜等技术难题,持续优化数据任务的性能与资源消耗。
- 负责关键模块(如实时数据链路、核心数仓模型)的技术攻关,制定解决方案,确保数据项目的顺利交付。
- 数据质量与规范:
- 制定并推动团队执行数据开发规范、数据建模规范和数据质量标准。
- 组织并执行代码评审(Code Review / SQL Review),保障数据产出的准确性与时效性,提升团队整体开发质量。
- 数据研发效能:
- 参与数据开发与发布流程(DataOps)的建设与优化,提升数据测试、部署和监控的自动化水平。
- 推动数据开发工具链的完善,提升整体数据研发与交付效率。
- 团队协作与指导:
- 指导并帮助初级/中级工程师解决大数据开发中的技术问题,提升团队整体技术水平。
- 在项目中起到技术引领作用,促进团队在数据技术领域的协作与进步。
- 新技术研究与应用:
- 关注并研究大数据领域的新技术,评估其在业务中的应用价值。
- 组织并参与技术分享,推动技术团队在大数据架构上的演进与创新。
任职要求:
- 本科学历,大数据、计算机科学、软件工程或相关领域专业。
- 3-5 年以上大数据平台开发经验,有大型互联网公司数据仓库或数据湖建设经验者优先。
- 编程与计算引擎: 精通 Python、Java 或 Scala 编程语言,深入理解 JVM 原理;熟练掌握 Hadoop 生态(HDFS, Yarn, Hive),并精通 Spark 或 Flink 中至少一种主流计算引擎。
- 数据架构与建模: 熟悉数据仓库建模理论(如维度建模),掌握数据分层、数据湖、湖仓一体等架构设计思想。
- 数据存储与查询: 具备良好的 SQL 编写与优化能力,熟悉主流 OLAP 引擎(如 ClickHouse, Doris, StarRocks)及 NoSQL 数据库(如 HBase, Elasticsearch, Redis)的使用场景与调优。
- 数据管道与中间件: 掌握常用数据同步工具(如 DataX, Flink CDC),并精通消息队列 Kafka 的使用与原理。
- 基础环境与运维: 熟悉 Linux 操作系统和常用 Shell 脚本,具备大数据组件的部署、监控和问题排查能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕