1.教育背景:计算机科学、软件工程、数学或相关专业,本科及以上学历。
2.编程基础:精通Java/Scala/Python中的至少一门语言,具备扎实的编码能力和良好的编程习惯。
3.技术栈:
·深入理解分布式系统原理,熟悉大数据生态主流框架,如Hadoop,Hive,Spark,Flink,HBase,Kafka等。
·具备扎实的数据库和SQL知识,熟悉数据仓库建模理论(如维度建模)。
·熟悉Linux开发环境,具备良好的脚本能力(Shel/Python)。
4.经验:拥有3年及以上大数据领域开发或运维经验,有大规模集群处理经验者优先。
5.能力素质:具备出色的逻辑思维能力、分析问题和解决问题的能力,对技术有热情,乐于接受挑战。
6.团队合作:具备良好的沟通能力和团队协作精神,能与不同角色高效协同。
优先考虑:
1.有云厂商(AWS,Azure,阿里云,腾讯云等)大数据产品研发或使用经验。
2.有实时计算、数据湖、数据治理、BI工具等领域深度经验。
3.熟悉容器化技术(Docker,Kubermetes)和微服务架构。
4.有AI/机器学习平台开发或数据科学项目经验。
5.具备大型企业级项目交付经验或复杂问题处理经验。