职位描述
1.本科及以上学历,数据科学或计算机相关专业,一年以上经验;
2.熟练掌握 Java、Python 等一种及以上编程语言,有编程实践经验;
3.熟悉关系型数据库(如:MySQL、Oracle、SqlServer)、非关系型数据库(如:MongoDB、Redis)及分布式数据库(如:Doris)的原理与优
4.熟悉 Flink、Kafka、Hadoop、Spark、Hive、MapReduce、HBase 等大数据技术栈,并了解其工作原理和应用场景;
5.掌握 ETL/ELT 流程设计,使用工具实现数据从数据源到数据仓库的抽取、加载和转换,例如:
ETLCloud, Kettle (Pentaho) , Airflow,
Apache NiFi、DolphinScheduler 等;
6.理解数据仓库理论(如 Inmon、Kimball 建模方法),能设计分层数据仓库(ODS/DWD/DWS/ADS),优化数据模型以提升查询效率;
7.掌握数据链路监控工具,能快速定位并修复数据延迟、任务失败等生产问题;熟悉数据质量保障方法(如数据一致性校验、血缘追溯),确保数据输出的准确性与可靠性;
8.严谨、细密和工作态度和工作风格,良好的团队合作精神,较强的内部及外部沟通能力,能够承受较大的工作压力;
9.有厂商大数据认证优先;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕