9000-11000元
崖州湾雅布伦科技产业园
岗位职责:
1.运维战略与体系搭建:负责公司物联网云平台整体运维战略规划与落地,建立覆盖设备接入、数据流转、服务运行全链路的运维标准、流程及管理制度,确保平台可用性达到99.99%以上。
2.平台稳定与性能优化:主导平台性能监控、容量规划及优化工作,通过压力测试、实时监控等手段识别性能瓶颈,制定资源扩容、架构调整方案,支撑百万级设备高并发接入及TB级数据实时处理需求。
3.故障应急与灾备管理:建立健全故障应急响应机制,设计服务降级、容灾备份及故障自愈方案,带领团队实现故障分钟级定位、小时级恢复,降低故障对业务的影响,保障平台7×24小时稳定运行。
4.自动化与智能化运维建设:推动运维工具链落地,搭建自动化运维平台(含监控、部署、调度、日志分析等),研发自动扩缩容、故障预警等能力,提升运维效率30%以上;关注行业前沿技术,探索AI运维、混沌工程等在实际工作中的应用。
5.团队管理与技术支撑:搭建并管理运维团队,负责人员招聘、技术培训、绩效评估及能力提升,建立技术分享机制;跨部门协同产品、研发、业务团队,提供运维技术支持,平衡运维成本与业务发展需求。
6.安全与合规管理:负责平台数据安全与网络安全体系建设,实施身份认证、加密传输、入侵检测等防护措施,定期开展安全审计与漏洞修复;确保平台运维符合行业法规及数据安全标准。
1.学历与专业:本科及以上学历,计算机科学、信息技术、软件工程等相关专业,具备扎实的技术功底。
2.工作经验:10年以上大型分布式系统、云平台或物联网平台运维经验,其中5年以上团队管理经验;有互联网、云计算、物联网行业头部企业运维管理经验,或大规模物联网设备接入运维实战经验者优先。
3.技术能力:精通云原生技术栈(Kubernetes/Docker/ServiceMesh),熟悉物联网协议(MQTT/CoAP等)运维特性;深入掌握Linux系统管理,熟练使用Shell、Python等至少一门脚本语言;精通MySQL、MongoDB、Redis等数据库及Kafka、RabbitMQ等中间件的运维与调优;掌握全链路监控工具(Prometheus/Grafana)、日志分析工具(ELK)及自动化运维工具(Ansible/SaltStack)。
4.管理能力:具备战略规划与落地能力,能结合业务目标制定运维 roadmap;拥有优秀的团队领导力和跨部门协作能力,能激励团队攻克复杂技术难题。
5.综合素养:具备强烈的责任心和主动性,能主动识别潜在风险并推动解决;在重大故障中展现高效决策与执行力,具备敏锐的技术洞察力和持续学习能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕