职位描述
岗位职责
1.构建与维护机器学习模型的生产环境部署流程,包括模型打包、上线、回滚等自动化操作。
2.开发与优化模型训练与推理的CI/CD流水线,提高开发迭代效率。
3.设计与实现特征工程流水线与数据处理流程,确保训练和推理数据一致性。
4.构建模型监控系统,对模型性能(如准确率、延迟、漂移等)进行实时监控和告警。
5.协助算法团队完成模型训练、调优和部署,推动模型从开发到生产的闭环。
6.管理和优化模型存储、版本控制与模型注册服务(如MLflow、SageMaker Model Registry等)。
7.使用容器化与云原生技术(如Docker、Kubernetes)部署可扩展的机器学习服务。
8.与数据工程、算法工程和平台团队协作,推动端到端的机器学习系统落地。
任职要求
【必备要求】
1.计算机、软件工程、人工智能等相关专业本科及以上学历,具备扎实的软件工程基础。
2.对图像处理方向有项目经验。
3.对语音识别、自然语言处理中的至少一个方向有项目经验。
4.熟悉主流的机器学习平台与工具链,如 MLflow、Airflow、Kubeflow、SageMaker、TensorFlow Serving 等。
5.熟练掌握容器化与自动化部署技术,如 Docker、Kubernetes、CI/CD 工具(Jenkins/GitLab CI 等)。
6.熟悉 Python 编程语言,具备一定的脚本编写能力(Shell、Bash)。
7.理解机器学习/深度学习基本原理,能与算法工程师有效沟通。
8.熟悉至少一种云平台(如 AWS、GCP、阿里云、Azure)中的机器学习部署服务。
【加分项】
1.有实际的模型部署和上线经验,尤其是在生产环境中支持高并发/低延迟推理任务。
2.了解模型性能监控、日志收集(如Prometheus/Grafana/ELK)系统。
3.具备数据管道开发经验,如使用 Spark、Kafka、Beam 等。
4.拥有 DevOps/SRE 背景优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕