职位描述
 1、负责参与得物预估服务、深度学习分布式训练框架和平台的研发,重点研发GPU分布式训练系统,支持搜广推稀疏大模型离线训练和在线学习等算法需求,支持AIGC大模型分布式训练需求;
    2、负责参与TensorFlow/PyTorch框架的后端GPU训练性能优化,自定义GPU算子的cuda kernel开发和优化;
    3、参与模型训练,模型服务,资源调度等重要方向的研发,提升平台的效率和易用性,加速得物算法团队的模型迭代效率。
    职位要求
    1、硕士及以上学历,人工智能、计算机、软件工程、电子、数学等相关专业,精通数据结构/算法, 操作系统,网络通信等核心理论知识;
    2、有较强的动手能力,具备优秀的编码能力,熟练掌握C++/Python编程语言,ACM参赛者优先,参与过深度学习框架开发的优先,熟悉GPU编程的优先;
    3、有较好的逻辑思考能力, 快速识别关键问题, 清晰描述问题和沟通解决方案, 有一个或者多个技术点深入思考者优先;
    4、有较好的主动性, 开放心态,能大胆, 主动问问题, 思考问题, 大胆提出自己的想法和建议, 开源社区积极参与者或者活跃者优先;
    5、具有良好的沟通协作能力,主动分享意愿, 主动和师兄思考问题, 解决问题, 共同成长;
  以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕