数智分身科技有限公司是一家专注于人工智能前沿技术研发的科技公司。我们的目标是利用AI技术,打造能真正帮助人们提升工作效率、解决复杂问题的智能系统。
核⼼职责:
负责CI/CD流⽔线、⽣产环境部署和运维。
搭建和维护基于K8s的云原⽣基础设施。
实现系统的监控、告警和⽇志管理。
制定和执⾏灾难恢复计划,确保系统⾼可⽤。
优化系统性能和资源利⽤率。
编写部署脚本。
任职要求:
5年以上DevOps/SRE经验。
精通 Kubernetes, Docker, Helm。
精通 Prometheus, Grafana, ELK 等监控告警⼯具。
熟悉云平台或私有云。
有⾼并发、⾼可⽤系统运维经验。