职位描述
一、工作职责(核心任务)
- 保障稳定:通过监控、告警和应急响应,确保云上应用7x24小时稳定运行。
- 自动化运维:使用基础设施即代码(如Terraform)和脚本(如Python/Shell)自动化部署、管理和扩展云资源。
- 成本优化:监控并优化云资源使用,控制成本。
- 确保安全:实施云安全最佳实践,管理网络访问、密钥和备份恢复策略。
- 支持CI/CD:维护自动化发布流程,支持开发团队高效交付。
二、岗位要求(关键技能)硬技能:
- 云平台:精通至少一家主流云厂商(如AWS/阿里云)的核心服务。
- 容器化:熟练掌握Docker和Kubernetes。
- 自动化工具:熟练使用Terraform、Ansible等IaC工具。
- 监控排查:熟悉Prometheus、Grafana等监控日志工具。
- 系统基础:扎实的Linux和网络知识。
软技能:
- 强大的问题解决能力和责任心。
- 自动化思维,追求用技术替代重复劳动。
- 良好的团队协作和沟通能力。
- 具备持续快速学习的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕