职位详情
运维工程师(上海)
3-4万
哈尔滨工业大学
哈尔滨
3-5年
本科
03-30
工作地址

哈尔滨工业大学材料科学与工程学院

职位描述

岗位职责

(1) 1、安装、配置、监控和维护,确保系统的稳定运行。

2、管理服务器资源,包括虚拟化平台(如VMware、KVM等)的管理和维护,合理分配计算、存储和网络资源。及时响应系统故障和异常,快速定位问题并进行修复,确保业务的连续性;建立故障响应机制和应急预案,定期进行故障演练,提升系统的抗风险能力。

3、负责公司大数据平台(包括 Spark 和 Storm 等分布式计算框架)的部署、配置和维护,确保集群的高可用性和性能;监控大数据平台的运行状态,及时发现并解决集群中的问题,保障数据处理任务的顺利执行。

4、负责系统性能监控,使用监控工具(如Zabbix、Prometheus、Grafana等)实时监控系统资源使用情况,及时发现性能瓶颈并进行优化。定期分析系统性能数据,提出优化建议,提升系统的整体性能。

5、负责系统的安全防护工作,包括防火墙配置、入侵检测、安全漏洞扫描等,确保系统的安全性;管理系统账号和权限,确保数据的安全性和保密性。

6、推进运维自动化,使用自动化工具(如Ansible、SaltStack、Puppet等)实现系统的批量部署、配置管理、任务调度等;根据运维需求开发或集成运维工具,提升运维效率和质量。

7、为开发团队和业务部门提供技术支持,协助解决系统运行中的技术问题;协调跨部门的技术合作,确保技术方案在运维环境中的有效落地和实施。

8、编写运维相关的技术文档,包括运维手册、故障处理手册、系统配置文档等,方便团队成员查阅和学习;定期总结运维经验,优化运维流程和文档。

任职要求

1、计算机科学与技术、网络工程、信息安全等相关专业本科及以上学历,3年以上系统运维经验,有大型互联网系统或企业级应用的运维经验优先。

2、熟悉Linux/Unix操作系统,能够熟练进行系统安装、配置和管理;熟悉主流的服务器硬件和网络设备,能够进行故障排查和维护。

3、熟练掌握至少一种监控工具(如Zabbix、Prometheus、Grafana等),能够进行系统性能监控和告警配置;对 Spark 和 Storm 集群进行性能调优,优化作业调度和资源分配,提升数据处理效率。

4、熟悉自动化运维工具(如Ansible、SaltStack、Puppet等),能够实现系统的自动化部署和管理。

5、了解容器化技术(如Docker、Kubernetes)的基本概念和使用,有相关运维经验者优先。

6、熟悉网络安全知识,能够进行防火墙配置、入侵检测和安全漏洞扫描。

7、熟练使用运维工具(如Shell脚本、Python脚本等)进行日常运维任务的自动化。

8、具备较强的学习能力,能够快速掌握新技术和新工具;具备较强的责任心,对系统的稳定性和安全性负责。

9、具备良好的沟通能力,能够与开发团队、运维团队等进行有效的沟通和协作。

10、有以下经验者优先:DevOps实践经验,熟悉CI/CD流程和工具(如Jenkins、GitLab CI等),云平台(公有云、私有云)的运维经验,数据库运维(如MySQL、Oracle等),高可用架构(如负载均衡、冗余设计等)的搭建和管理经验。


注:哈尔滨、上海两地工作。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请