职位描述
岗位职责
1.负责监控平台的搭建、部署与迭代优化,涵盖监控指标设计、数据采集链路构建及可视化看板开发。
2.开发自动化脚本(Shell/Python 等),实现服务器、应用、数据库等核心资源的指标采集、日志清洗与异常检测。
3.深度分析监控数据,挖掘系统性能瓶颈与潜在风险,输出分析报告并推动优化落地。
4.设计优化告警规则,提升告警准确性与及时性,降低误报率以保障系统稳定。
5.承担监控平台日常维护、故障排查与性能调优,确保平台高效稳定运行。
6.协作业务团队梳理核心监控指标,输出贴合业务需求的监控方案。
任职要求
1. 计算机相关专业,2 年以上后台研发或监控平台搭建经验。
2. 熟练掌握 Python/Shell 脚本开发,能独立完成数据采集、清洗与分析类脚本开发。
3. 了解时序数据库(如 InfluxDB)原理与使用,能处理监控数据存储及查询问题。
4. 扎实掌握 Linux 操作、TCP/IP 网络及进程管理,能独立排查系统 / 应用故障。
5. 具备数据分析思维,能从监控数据提炼问题并输出可落地优化建议。
6. 良好沟通协作能力,能推动跨团队协作;强问题解决与学习能力,对技术有钻研精神。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕