职位描述
1、深入理解业务需求,运用维度建模、关系建模等方法,设计并持续优化数据仓库模型。
2、通过合理的模型架构,确保数据仓库在性能、成本、效率和数据质量之间达到最佳平衡,例如优化数据存储结构,减少数据冗余,提升查询性能。
3、熟练运用 Apache Spark 这一强大的大规模数据分析统一引擎,进行数据工程、科学计算及机器学习任务。
4、利用 Spark 的批处理与流处理能力,对海量数据进行高效处理与分析,如使用 Spark SQL 执行快速的分布式 ANSI SQL 查询,为业务决策提供数据支持。
5、对doris 或starrocks有一定的了解。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕