职位描述
1、精通Java/Scala/Python中至少一种编程语言,熟悉多线程与高并发开发;
2、深入理解Hadoop生态(HDFS、YARN、Hive、HBase等)及Spark生态(Spark Core、Spark SQL、Structured Streaming具备Flink/Kafka Streams等实时计算框架开发经验,熟悉状态管理、窗口函数等机制;
3、掌握SQL优化技巧,熟悉数据仓库分层设计(ODS/DWD/DWS/ADS):
4、熟悉分布式存储tchouse,数据湖iceberg等;
5、熟悉容器化技术(Docker、K8s)及运维操作。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕