晨羽智云(杭州)科技有限公司为2025年新核准的国家高新科技企业,以自主研发的分布式算力调度系统和多节点GPU集群为技术基础,构建了强大且高效的AI算力平台。为独立开发者,初创团队,中小企业提供了专业的算力支持。
1、公司运营着中国最大的“一站式AI应用商店”,打造了涵盖内容生成、智能设计、自动化工作流等多领域的AI生态系统。通过无代码、即开即用的便捷体验,晨羽智云极大降低了AI应用的使用门槛,满足了教育科研、数字文创、智能设计等前沿领域的多样化需求。
2、晨羽智云积极参与和推动高校合作与产业共建,致力于让人工智能核心能力在内容创作与智能生产中的广泛落地,助力AI技术真正转化为现实生产力。晨羽ai学院拥有1000+讲师,累计培训学员30万+。
核心职责
1、高并发算力调度系统开发:设计并实现高可用、高并发的分布式算力调度系统。利用Go的Goroutine和Channel机制,优化任务队列、负载均衡和资源分配算法,以应对客户动态、突发性的AI推理算力需求。
2、算力服务API网关与中间件:负责AI算力服务API网关的设计、开发与性能优化。保障API服务的稳定、低延迟与高吞吐,支持未来向“客户按需即时调用”的API租赁模式平滑过渡。
3、集群管理与自动化运维平台:参与开发集群管理、监控与自动化运维系统。通过Go实现高效的节点状态同步、故障自愈、弹性扩缩容逻辑,提升上万张算力卡集群的运维效率与资源利用率。
4、性能优化与系统调优:深入系统底层,进行性能剖析与调优。运用pprof等工具分析并优化CPU调度、内存分配(GC)及同步机制,解决大规模并发下的性能瓶颈,确保算力服务的经济性与竞争力。
5、技术方案设计与攻坚:参与核心模块的技术选型、架构设计,撰写高质量的设计与开发文档。主导或协助解决在开发过程中遇到的关键技术难题。
任职要求
一、基础能力:
1、计算机科学、软件工程或相关专业本科及以上学历,具备3年-5年Go语言后端服务开发经验。
2、深刻理解Go语言的并发模型、内存管理、网络编程及标准库,有生产环境高性能、高并发服务开发经验。
3、熟练掌握Linux开发环境,熟悉Docker容器化技术及Kubernetes生态,具备云原生应用的开发和部署经验。
4、良好的系统设计能力,熟悉分布式系统常用概念,了解RPC、消息队列、缓存、数据库等中间件原理与应用。
二、业务匹配技能(满足以下至少一项):
1、云计算/算力平台方向:有云计算IaaS/PaaS层、资源调度、虚拟化或高性能计算平台相关开发经验。对成本控制与资源利用率优化有深刻理解。
2、AI工程化方向:对AI模型训练与推理的工程化流程有了解,有使用Go进行相关工具链开发、模型服务(Model Serving)或对接TensorFlow/PyTorch等框架的经验。熟悉GoMLX等Go生态机器学习框架者优先。
3、大规模系统优化方向:具备丰富的大型系统性能调优经验,精通Go运行时调度器(GPM模型)原理,能通过定制内存池、无锁数据结构等手段解决实际性能问题。
加分项
1、有参与过开源项目或在技术社区有活跃贡献。
2、对主流AI大模型技术栈(如Transformer架构)和推理优化有基本了解。
3、有算力租赁、GPU集群管理或类似平台的实际项目经验。
4、熟悉网络编程,对RDMA、InfiniBand等高速网络技术有一定了解。