岗位职责:
1.负责海量管道运行时序数据的收集、清洗、校验和特征工程工作。
2.对管道压力、流量、温度等关键参数进行深度分析,识别数据模式、异常点和潜在规律。
3.构建和维护高效、可靠的数据处理流水线。
4.研究、设计和开发用于管道流量预测、压力预测、设备剩余寿命预测、异常检测(如泄漏识别)等的机器学习与深度学习模型。
5.应用并优化时间序列分析技术(如ARIMA, LSTM, Transformer等)解决业务预测问题。
6.负责模型的训练、调优、验证和评估,确保模型的准确性、鲁棒性和泛化能力。
7.与工程团队协作,将训练好的模型进行封装、部署到生产环境,并实现模型的在线服务。
8.监控模型在生产环境中的性能,持续迭代和优化算法模型。9.通过数据分析和模型结果,撰写分析报告,为管道运营、维护和安全管理提供数据驱动的洞察和建议。
任职要求:
1.计算机科学、统计学、数学、数据科学、自动化或相关专业本科及以上学历。
2. 精通 Python 及数据科学相关库(如 NumPy, Pandas, Scikit-learn, Matplotlib/Seaborn)。
3. 具备扎实的 TensorFlow 或 PyTorch 框架使用经验,能够独立完成模型的搭建与训练。
4.拥有丰富的时间序列数据分析和建模经验,熟悉常见的时序预测模型和异常检测算法。
5.熟练使用SQL进行数据查询和操作,具备良好的数据处理能力。