【工作职责】
聚焦于分布式技术架构领域信息系统运维管理工作,确保分布式系统的稳定运行、高效性能和快速响应,主要工作内容如下:
1.负责各个信息系统故障的及时发现、定位、分析和处理,能够快速响应并处理系统发生的各类故障和突发事件,制定并实施有效的解决方案,同时不断优化现有系统应急预案故障恢复计划,最小化故障对业务的影响。
2.负责各个系统的性能监控,分析性能数据,识别瓶颈和潜在问题,制定并实施优化措施,提高系统性能。
3.应用系统网络权限、服务器资源、中间件、数据库资源申请和日常管理/运维,根据业务需要,及时调整信息系统各项设定,定期评估系统资源和需求,制定合理的资源分配计划。
4 负责系统的信息安全策略制定和执行,包括访问控制、数据加密、安全审计、代码漏洞检测、组件漏洞检测等,确保系统的安全性和数据的保密性。
5.负责系统的备份策略制定和执行,确保数据的完整性和可恢复性;制定和撰写各个系统灾备方案,并定期参与恢复演练。
6.负责推进各个系统对接公司统一流水线,并按照变更管理流程,制定实施方案和回退计划,按方案执行系统变更,包括实施应用无中断发版,配置修改、组件升级等,确保变更顺利进行。
7.负责构建和维护运维知识库,包括运维流程、模板、最佳实践等,提高运维人员的能力和效率,并负责各个系统运维文档的编写和更新,总结经验。
8.根据各个系统现状,定期复盘分析典型运维问题,更新并优化系统技术架构、应用架构及运维流程。
9.根据最佳实践和各项新技术,负责新系统、新平台的部署、上线和运维工作。
【任职资格】
1.硕士研究生及以上学历,计算机、软件工程相关专业优先;
2.有扎实的编程能力基础,能熟练使用一种编程语言,包括不限于Golang/Python/Java/PHP/C++/C;
3.熟悉操作系统、网络原理,熟练掌握linux操作系统命令、国内常见品牌网络设备配置,了其解基本原理;
4.熟悉云计算、容器化、微服务等分布式技术架构相关技术和应用;
5.能够承受工作压力,具备较强的执行力和责任心。