一、岗位职责
1、负责各类系统的日常运维及部署,故障排查。
2、参与系统版本升级工作,确保升级过程平稳,不影响业务连续性。
3、负责大数据组件的相关安装、部署及调优。
4、负责大数据平台的运维、部署、扩容等,保障服务稳定。
5、编写运维工作相关技术文档,对运维资料进行整理归档。
二、岗位要求
1、熟练掌握 Linux 操作系统(如 CentOS、Ubuntu 等),具备系统安装、配置、优化及故障排查能力,能够进行服务器的日常维护、监控。
2、熟悉网络原理和 TCP/IP 协议,能够进行网络配置,如 VLAN 划分、NAT 配置、防火墙策略设置等。
3、熟悉常用中间件,如Tomcat、Nginx、Redis等,具备中间件的安装、配置、调优和维护能力。
4、熟练使用 Shell、Python 等脚本语言进行系统管理和运维任务开发,如日志分析、数据处理、监控脚本编写等,提高运维效率。
5、熟悉主流数据库,如 MySQL、MongoDB、PG等。
6、掌握容器技术,Docker,可以编写 dockerfile ,熟悉 docker 网络、存储、跨主机通信。
7、熟悉Kubernetes 集群的日常运维工作,涵盖集群部署、扩缩容操作,以及针对集群运行中出现的故障进行排查与修复,维持集群的稳定运作。
8、熟悉CDH大数据集群运维管理,能快速定位并解决问题。
9、熟悉大数据相关开源组件(Hadoop/Hive/Spark/Impala/Flink/ES),具备编写高阶MapReduce Task、Spark Task或Hive SQL能力,能够处理PB级别或更多的数据集。