职位描述
学历与理论基础:
计算机科学、人工智能、数学或相关领域的硕士/博士学历。
扎实的机器学习/深度学习理论基础,熟悉主流模型架构(如Transformer, CNN, LSTM等)。
算法与编程能力:
精通Python,并至少熟悉一种主流深度学习框架(PyTorch(优先) 或 TensorFlow)。
拥有丰富的算法研发和调优经验,具备优秀的代码能力和数据结构基础。
架构与工程经验(关键):
必须具备大规模AI系统(训练/推理)的实战经验。熟悉分布式训练(如DDP, DeepSpeed, FSDP)、模型并行、流水线并行等技术。
必须具备将复杂模型成功部署到生产环境的经验,熟悉Docker, Kubernetes及相关的服务化框架(如Triton, TFServing等)。
熟悉MLOps工具链(如 Kubeflow, MLflow, Airflow)并有实际项目经验。
对高性能计算、GPU架构、网络和存储优化有深入理解者优先。
领域专长(至少精通一项):
大语言模型方向: 具有LLM预训练/微调(SFT, RLHF)、推理优化、Agent应用等经验。
搜索/推荐/广告方向: 具有超大规模稀疏模型(如DeepFM, DCN)、召回与排序系统架构经验。
多模态/CV方向: 具有CLIP、Diffusion模型等相关项目经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕