【岗位职责】
1、设计和构建⾼效的⼤数据处理管道,确保数据的实时处理和存储。
2、进⾏数据清洗、集成和预处理,为模型训练提供⾼质量的数据集。
3、持续监控和优化数据处理流程和架构设计,提⾼系统性能确保系统的可靠性。
4、负责平台系统:包含实时和离线数据研发运维/作业调度/元数据管理/数据集成/数据服务和产品等。
【岗位要求】
1、计算机科学、数据科学或相关领域的本科及以上学历。
2、熟练掌握⼤数据技术(如Hadoop、Spark、Hive等)。
3、熟悉容器技术和常⻅中间件(如Kubernetes、Kafka等)。
4、具备编程能⼒(如Python、Java、Golang 等),熟悉 SQL。
5、具有解决综合复杂问题的能⼒,具具备良好的沟通能⼒、项⽬管理能⼒和团队合作精神。