1.5-2.2万
广东省广州市黄埔区科学大道8号国家文化产业示范基地A栋6楼6楼604
工作职责:(可远程面试)
1. 部署和实现机器学习模型推理,包括主流模型如llama、Qwen、Stable diffusion等。
2. 负责模型推理加速的实现,包括但不限于使用流行的模型推理加速框架。
3. 探索和开发自研的加速框架,以满足特定业务需求。
4. 对主流机器学习模型进行微调,以适应特定的应用场景。
5. 与算法科学家、软件工程师和产品经理合作,确保模型的有效集成和部署。
6. 跟踪最新的机器学习研究和技术趋势,将其应用于产品开发中。
任职要求:
- 计算机科学、统计学、数学或相关领域本科以上学历学位。
- 至少3年的机器学习或深度学习领域的工作经验。
- 熟练掌握Python编程语言,以及相关的机器学习库和框架(如TensorFlow, PyTorch等)。
- 熟悉至少一种主流的模型推理加速框架(如TensorRT, Vllm等)。了解关于模型推理加速的基本概念和原理,如量化、KVcache等。
- 有使用现代机器学习工作流和工具的经验,包括模型训练、评估和部署。
加分项:
- 有参与开源机器学习项目的经验或在顶级会议发表相关研究论文。
- 熟悉分布式系统、容器化和集群技术(如 Kubernetes, Docker),有实际在生产环境中操作的经验。
- 在模型可解释性、鲁棒性或模型调优方面有相关经验,具备解决实际业务场景中模型性能与公平性问题的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕