职位描述
岗位职责: 1. 执行日常系统运维工作,包括 Linux 服务器巡检、日志排查、性能监控和基础优化。 2. 负责 Kubernetes 集群的日常管理:应用发布、资源调整、基础故障处理与常规组件维护。 3. 按照规范维护常用开源服务(Nginx、MySQL、Redis、Kafka、MongoDB 等),执行版本更新、基础配置及常见问题处理。 4. 负责 AWS 云资源的日常操作与管理,包括 EC2、RDS、S3、VPC、EKS 等常用服务的启动、配置与基本排查。 5. 支持监控与可观测平台运维工作,按照要求维护 Fluent-bit、ELK、Prometheus、Grafana 等组件的正常运行。 6. 协助处理生产环境的告警和常见故障,遵循操作流程,确保业务稳定性。 7. 持续学习并优化日常运维流程,提升效率和稳定性。 任职要求: 1. 熟练使用 Linux,理解 CPU、内存、磁盘、网络等基础系统指标及常见问题分析方法。 2. 熟悉 Kubernetes 基本使用方法,能够执行常规资源管理、应用发布及基础排错。 3. 熟悉常见开源应用(Nginx、MySQL、Redis、Kafka、MongoDB)的安装、配置和常规维护。 4. 具备 AWS 云服务(EC2/RDS/S3/VPC/EKS 等)的基本操作经验,能够执行常规管理任务。 5. 理解监控与可观测性的基础概念,熟悉 Fluent-bit、ELK、Prometheus 等工具的日常运维与常规排查。 6. 具备良好的执行力、学习能力和问题分析能力,遇到系统问题能够冷静处理,具有对生产环境的责任感与敬畏心。 7. 良好的沟通能力,能够根据既定流程完成跨团队协作与任务交付。 加分项: • 有基础的脚本能力(Shell / Python),能进行简单自动化脚本编写。 • 了解 CI/CD 流程和工具(如 GitLab CI、Jenkins)。 • 有运维值班、故障响应经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕