职位描述
职责
- 设计开发并维护自动化数据管道,从多来源实时采集、清洗、存储市场价格、负荷、天气等训练与预测数据。
- 将算法科学家的特征工程、模型训练代码重构为高效、模块化、可测试的生产级 Python 代码。
- 部署 LightGBM、LSTM 等机器学习模型为低延迟、可扩展的 API 服务,支撑实时调用。
- 运用 Airflow/Prefect 等工具,编排 “数据获取 - 特征计算 - 模型预测 - 结果存储” 全流程自动化工作流。
- 搭建监控与警报系统,保障数据管道、模型服务及预测结果的稳定可靠,排查解决生产环境技术问题。必备条件
- 计算机科学、软件工程等相关专业本科及以上学历。
- 精通 Python 编程,熟练应用于后端服务与数据处理。
- 扎实的软件工程基础,具备优秀编码与系统设计能力,熟悉数据结构、算法、计算机网络。
- 掌握 PostgreSQL 等 SQL 数据库及 Redis 等 NoSQL 数据库,有 InfluxDB/TimescaleDB 等时序数据库经验者优先。
- 具备 RESTful API 设计与部署经验,熟悉 FastAPI/Flask/Django Rest Framework。
- 精通 Git 及协作流程。
优先条件 - 具备 CI/CD、Docker 容器化经验,有 Kubernetes 使用经验优先。
- 熟悉 AWS/Azure/Google Cloud 任一主流云平台,有云上数据 / AI 服务部署管理经验。
- 有 Airflow/Prefect/Dagster 等工具的复杂工作流管理经验。
- 熟悉 Scikit-learn、LightGBM、PyTorch/TensorFlow 等 ML 框架的使用与部署。
- 理解机器学习基本概念,能与算法科学家高效沟通。
- 对金融量化交易、能源市场或复杂时间序列数据处理有浓厚兴趣。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕