岗位内容:
1.能够完成大数据领域常见组件的安装部署,编写巡检脚本、完善监控指标,定期检查节点与服务运行状态。
2.根据监控与异常告警信息,通过日志分析等手段快速定位并处理常见故障,确保服务能够尽快恢复正常。
3.与开发、测试人员密切配合,按照流程完成应用的版本发布与功能迭代,确保上线过程平稳顺利。
4.协助对各类数据库的日常运维,包括连接状态检查、慢查询分析以及基础参数调优等工作。
5.协助对Kubernetes集群的管理维护,能够处理常见的K8s异常,并根据需求对资源配额进行合理调度。
任职要求:
1. 具备 2 年以上运维相关工作经验,有大数据领域或云计算领域运维从业经历者优先;
2.熟悉大数据常见组件(如 Hadoop、Spark、HBase 等)的安装部署与基础运维逻辑;
3.具备基础的脚本编写能力(如 Shell、Python 等),能够独立完成巡检、监控类脚本开发;
4.了解数据库基础运维知识,具备慢查询分析、基础参数调优的实操经验;
5.熟悉 Kubernetes 集群基本架构,能够处理容器编排、资源调度等常见问题;
6.具备较强的故障排查能力,能够通过日志、监控数据快速定位并解决问题;
7.具备良好的跨团队沟通协作能力,能够配合开发、测试团队完成版本发布与迭代工作