工作内容:
1. 数据资产管理与治理:
负责或参与构建设备运行数据的全生命周期管理体系,设计并维护数据的存储、清洗与标准化流程,制定数据质量监控规则,确保数据服务的及时性、有效性和易用性。
2. 数据平台开发与优化:
负责或参与分布式数据平台及数仓的建设,对数据管理平台迭代开发提出建议。利用平台数据开发模块或线下IDE工具,编写自定义数据聚合筛选、指标计算等算法脚本。
3. 数据探索与价值挖掘:
开发数据预处理脚本与特征工程工具,为算法团队提供高质量数据集。负责或参与利用存量数据构建基础分析模型,如进行设备健康度计算、参数预警、关联分析等模型开发与研究。
岗位要求:
1. 教育背景:
本科及以上学历,数据科学、计算机、自动化、热能动力等相关专业。
2. 专业技能:
精通常用单机数据库维护方法,包括MySQL、Redis、MongoDB等。
熟悉CDH大数据平台架构,掌握HBase、OpenTSDB等分布式数据库运维方法。
熟悉数据清洗、特征筛选、特征衍生等数据分析过程。
精通PYTHON或JAVA编程,熟悉Sklearn,PyTorch,TensorFlow等常见人工智能框架。
了解工业数据特性(如高频采样、非结构化日志),具备数据清洗与异常检测实战经验。
3. 行业经验
3年以上数据工程相关经验,有工业设备、物联网或能源行业数据治理经验者优先,有工业场景的机器学习算法、深度学习算法开发项目经验者优先。
4. 综合素质:
具备数据敏感度与业务洞察力,能快速理解设备运维场景的数据需求,并善于用数据驱动问题解决。
具有良好的团队合作精神和沟通能力,能够与不同专业的人员协作完成项目任务。
具备较强的责任心和敬业精神,能够在压力下高效完成工作任务。