职位描述
一、岗位职责
1.负责公司服务器、网络设备、数据库等 IT 基础设施的日常运维,保障系统 7×24 小时稳定运行,及时处理服务器宕机、网络中断等突发故障,快速恢复业务正常运作;重点承担网络设备日常运维与故障排除工作,确保网络稳定畅通。
2.进行公司网络的规划、设计和配置,根据业务发展需求优化网络架构,提升网络性能与安全性;同时对系统进行性能监控与优化,通过数据分析定位系统瓶颈,调整服务器配置、优化数据库查询语句等,提升系统整体性能与响应速度。
3.制定并执行系统备份与恢复策略,包括数据库、重要文件的自动化备份,定期测试备份数据的可用性,确保数据安全,在数据丢失或损坏时能快速完成数据恢复。
4.负责虚拟化平台的管理,保障虚拟化环境稳定运行,根据业务需求合理分配资源,优化虚拟化平台性能。
5.参与系统部署与上线工作,协助开发团队完成代码部署、环境搭建,配合开发人员进行系统更新与测试,确保新系统或功能模块顺利上线,并进行上线后的监控与维护。
5.编写并完善运维文档,包括系统架构文档、操作手册、故障处理流程等,为团队知识共享和后续运维工作提供支持。
6.参与监测预警系统功能的测试工作,制定详细的测试计划,模拟各类异常场景,验证监测预警系统的准确性、及时性和稳定性;对测试过程中发现的问题进行详细记录、分析和反馈,协助开发团队进行优化改进,确保监测预警系统能有效保障公司 IT 系统安全运行。
二、任职要求
(一)专业技能
1.至少 1 年网络运维经验,熟悉网络架构与常见网络设备(如路由器、交换机、防火墙等)的配置与管理,能够熟练处理网络故障,保障网络稳定与安全。
2.熟练使用 Linux 操作系统,掌握 Docker、Nginx、Tomcat 等工具或服务的安装、配置与管理,能够进行用户管理、权限分配、服务部署与管理,具备 Linux 系统故障排查与优化能力。
3.熟练使用 SSH 脚本,具备一定的脚本编程能力,可编写自动化运维脚本处理日常运维任务;熟悉 postgresql、华为GaussDB等主流数据库的安装、配置、优化与备份恢复,具备数据库性能调优、SQL 语句优化能力,能处理数据库相关故障。
4.掌握虚拟化平台管理技术,熟悉至少一种虚拟化平台(如 VMware、KVM 等)的操作与维护;了解云计算技术,熟悉 AWS、阿里云、腾讯云等主流云平台的使用,能够进行云服务器创建、配置、监控与管理,具备云环境下的运维经验者优先。
5.掌握至少一种自动化运维工具,能够实现服务器批量管理、配置分发、任务自动化执行,提高运维效率。
6.具备一定的测试技能,熟悉测试流程与方法,有监测预警系统或相关系统测试经验者优先。
(二)工作经验
1.本科及以上学历,计算机科学与技术、网络工程、信息安全等相关专业;若有丰富实践经验,学历要求可适当放宽。
2.有参与国家公安部的攻防演练或大型央国企的护网行动经验者优先考虑,有大型企业或互联网公司系统运维经验优先。
(三)职业素养
1.具备良好的问题分析与解决能力,能够快速定位系统故障根源,并提出有效的解决方案。
2.有较强的责任心和团队协作精神,能够承受工作压力,适应 7×24 小时轮班值守与紧急故障处理。
3.具备良好的沟通能力,能够与开发、测试、产品等团队有效协作,共同推进项目顺利进行。
4.有较强的学习能力,关注行业新技术发展,能够不断学习新知识、新技能,提升自身专业水平。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕