【岗位职责】
1、负责昇腾计算推理及训练产品与解决方案现网问题处理,主导重大事故的快速恢复和根因定位,确保客户满意度达成,支撑商业成功。
2、负责通过现网问题系统化识别对在研产品的负向改进措施并跟踪落地,确保关键问题不重犯,提升产品质量。
【岗位要求】
1、具备python开发经验1年+, 熟悉 nunpy、torch、pandas等库。
2、具备服务器、网络、存储等产品软硬件维护工作经验,有良好的问题分析定位及解决思路,熟悉CPU、内存、GPU、NPU、DPU硬盘、电源、时钟等模块
3、熟悉操作系统、虚拟机、docker容器等基础操作及原理,熟悉AI推理或训练业务流程优先。
4、具备良好的沟通能力及合作精神,较强的服务意识,能承受一定的工作压力。