职位描述
岗位职责:
1. 负责公司对外业务系统的日常部署、监控、巡检与故障排查,保障业务系统稳定运行;
2. 参与公司智能运维体系建设,包括shell/python脚本开发、ansible等自动化部署工具落地、CICD流程优化等,提升运维效率;
3. 负责监控体系搭建与优化,包括 Zabbix/Prometheus+Grafana、Nagios 等监控工具的部署配置、监控指标设计、告警规则制定,实现系统资源、应用性能、业务状态的全面监控与智能告警;
4. 负责数据库(Mysql/MongoDB/Redis)的日常运维,包括备份恢复、权限管理、配合开发团队解决数据相关问题;
5. 制定并落地服务器、网络、安全等相关运维规范与应急预案,定期开展灾备演练、安全漏洞扫描与修复;
6. 对接开发、产品团队,提供运维技术支持,协助解决线上业务部署、环境配置、性能瓶颈等问题;
7. 关注行业技术动态,引入适配的运维工具与技术方案,持续优化运维架构与流程。
要求。
任职要求:
1.本科及以上学历,计算机相关专业(计算机科学与技术、软件工程、网络工程等),3年及以上相关运维工作经验;
2.熟练掌握 Linux 操作系统(CentOS/Ubuntu)的日常管理,包括系统安装、权限配置、进程 / 内存 / 磁盘管理,能独立排查系统级故障;
3.具备网络基础能力,熟悉 TCP/IP 协议、路由与交换原理,能排查常见网络问题(端口不通、路由异常等);
4.掌握至少一种脚本语言(Shell/Python 优先),能独立编写自动化脚本(如批量部署、日志分析、监控告警脚本);
5.熟悉主流监控工具的使用与配置,至少掌握 Zabbix 或 Prometheus+Grafana 中的一种,能独立完成监控指标设计、告警规则配置、监控面板定制;
6.熟悉至少一种云平台(华为云/阿里云 / 腾讯云)的核心产品使用,包括 ECS、RDS、SLB、OBS 等,有云资源规划与优化经验者优先;
7.熟悉数据库基础运维,能完成 MySQL 的安装配置、备份恢复、慢查询分析。
8.具备强烈的责任心与故障应急响应能力,能接受必要的值班值守;
9.逻辑思维清晰,善于分析和解决复杂技术问题,具备良好的沟通协调能力;
10.有较强的学习意愿,能快速适应新技术、新环境,关注运维领域前沿动态;
11.有大型分布式系统运维经验、DevOps 实践经验或相关认证(如阿里云 ACP)者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕