职位描述
职位描述
1.负责大模型预训练及微调;
2.针对国产GPU及英伟达GPU体系,根据主流大模型体系如DeepSeek, Qwen,研究及开发加速技术,包括但不限于算子库,编译器,编程框架层;
3.负责大模型异构推理,训练的性能优化,充分挖掘GPU性能。
4.参与AI原生云产品的训练推理部分研发
职位要求
1.熟悉C/C++/CUDA编程,算子融合、算子优化、模型量化,熟悉常见的大模型推理框架:vllm、llama.cpp等
2.参与过大模型训练,微调,及传统机器学习训练,精通Pytorch, TensorFlow等平台
3.熟悉Deepspeed ,Megatron-LM或Colossal-Al等大模型分布式训练框架;
4. 对于AI, 大模型技术,训练微调,底层框架有强烈兴趣,可以自我驱动探索研究,主动性强。
加分项:
1.除了英伟达CUDA体系,深度了解国产GPU技术体系,例如壁仞,天数,海光DCU等。
2.对于云原生产品,K8S, Ray有研发和使用经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕