工作职责:
1.负责公司核心算力平台(包括但不限于GPU/CPU集群管理、调度系统、分布式存储、高性能网络)的规划、设计与开发工作。
2.主导关键技术攻关,解决平台在性能、稳定性、安全性及成本效益方面面临的挑战。进行架构评审和技术选型,确保技术方案的先进性与可行性。
3.主导从概念到上线的完整产品生命周期管理,协调研发、设计、运营等团队,确保产品成功交付。
4.负责产品的定价策略、上市推广及后续的迭代优化,对产品的用户增长、收入及利润率负责。
5.深入市场与客户,洞察行业趋势,挖掘基于算力、网络、云计算等技术的产品机会。
6.定义产品愿景、路线图,并撰写详尽的商业需求文档(BRD)和产品需求文档(PRD)。
7.跟踪业界前沿技术(如Slurm/Kubernetes在算力调度中的应用RoCE/InfiniBand网络),并推动其在团队内的落地。
8.负责开发团队成员的绩效管理,激发团队潜能,建立优秀的技术和产品文化,制定团队工作流程和规范。
任职要求:
1.计算机科学、软件工程或相关专业本科及以上学历。8年以上互联网、云计算或基础设施领域的技术开发经验,其中至少2年以上担任技术经理或产品负责人角色,并有过成功带领5人以上团队的经验。
2.精通至少一门主流编程语言(如Go, Python, Java, C++),具备扎实的编码能力和良好的代码品位。
3.深厚的系统架构功底,对分布式系统、高并发、高可用性架构有深刻理解和实战经验。
4.熟悉算力相关技术栈,包括但不限于:容器化(Docker)、编排调度(Kubernetes)、集群管理、GPU虚拟化、分布式存储、Linux操作系统。
5.熟悉网络与云技术,深入了解TCP/IP、SDN、VPC、云计算(公有/私有/混合云)服务与架构。
6.具备强烈的产品思维和用户视角,能够将技术能力转化为清晰的客户价值。
7.有独立负责过至少一款技术产品从0到1的全过程经验,并取得可验证的市场成果。
8.卓越的沟通协调能力,能够有效联动技术、业务、销售等多个部门。
9.强大的自驱力、责任心和抗压能力,热爱挑战,追求卓越。