参与企业级监控平台研发,统一采集分析指标、日志及链路数据,开发高性能数据处理模块支撑实时可观测性;实现智能告警、故障定位等能力,推动全公司监控标准化,优化资源消耗与查询效率。
1. 学历:本科及以上,计算机科学与技术、软件工程、网络工程、物联网工程、数学与应用数学、信息与计算科学、电子信息工程、电子科学与技术、通信工程、等理工科相关专业
2. 工作年限:3年及以上相关工作经验;
3. 技术要求:熟悉 Java 或 Go 编程语言,有 Prometheus、Grafana、ELK、Loki、SkyWalking 等系统开发或深度定制经验;熟悉时序数据库(Prometheus TSDB、InfluxDB、ClickHouse)或日志存储(Elasticsearch)的原理与调优;能设计高吞吐、低延迟的数据管道(采集、传输、存储、查询),处理百万级指标或 TB 级日志;理解分布式系统常见故障模式,能将运维痛点转化为有效监控能力;熟悉 OpenTelemetry 标准,具备埋点规范设计与落地能力;掌握监控告警策略设计、降噪算法与根因分析辅助技术。
4. 具备良好的团队协作能力、沟通能力与问题解决能力,认同公司技术理念与发展方向。