职位详情
SRE / 站点可靠性工程师
1-1.6万
成都水月雨科技有限公司
成都
1-3年
本科
08-20
工作地址

德昆·悦天地B座 13楼

职位描述
工作职责:
1、负责公司 AI 产品的稳定性、可扩展性和性能优化;
2、管理和维护阿里云 / AWS 上的基础设施与服务,保证高可用与容灾能力;
3、参与 后端服务(Python / Node.js) 的运维与性能调优,支持研发团队快速迭代;
4、维护 Postgres 数据库与 Weaviate 向量数据库,确保数据的可靠性与可扩展性;
5、建立并优化监控、日志和告警体系(Prometheus / Grafana / ELK / OpenTelemetry 等),快速响应线上问题;
6、优化 GitHub Actions CI/CD 流程,提升自动化程度与交付效率;
7、与前端团队紧密协作,推动全链路的可观测性与性能优化。

任职要求:
1、本科及以上学历,计算机或相关专业,2年以上相关经验。
2、熟悉 Linux 系统,精通至少一种脚本语言(Python / Go / Shell 等),熟悉React 技术栈;
3、有 云原生架构 经验,熟悉 Docker、Kubernetes 的部署与运维;
4、有 阿里云 / AWS 实际运维经验,能独立管理和优化资源;
5、熟悉 Postgres 运维与优化,有数据库高可用和备份容灾经验;
6、有 CI/CD 实践经验,能独立维护和优化 GitHub Actions 工作流;
7、具备较强的故障排查能力和系统性思维,能在压力下快速响应问题;
8、良好的团队沟通协作能力,愿意在快速迭代的环境中保障产品的稳定上线。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请