岗位职责:
1、梳理核电业务需求,挖掘数据场景和潜在价值,形成详细的需求规格书和设计方案;
2、制定公司数据标准和规范,建立公司数据质量管控流程,数据资产消费管控流程,开展主数据和元数据的管理,开展大数据安全审计和性能健康分析;
3、实现集团数据、各业务系统数据,现场实时数据、IOT物联网数据、系统日志数据等数据的溯源、采集、清洗、满足质量管控要求后实现接入;
4、开发大数据应用程序,包括数据挖掘、机器学习、数据可视化和数据交互分析,面向用户交付;
5、负责对大数据平台软硬件的高可用运维。
任职要求:
1、计算机、电子工程等相关专业,本科及以上学历;
2、掌握Hadoop大数据生态集群的部署与工作原理,包括大数据管理框架Zookeeper、YARN、Docker分布式集群的构建,资源管控与稳定运维。理解大数据存储框架HDFS、HBase、NoSQL的技术原理,掌握大数据的计算框架MapReduce、Hive、Spark、ESearch的运用开发。
3、掌握大数据分析理论、工具和方法,如噪声过滤、数据属性填补、属性值归一化、数据去重等,进而开展大数据分类与建模,实现智能决策,精准预判;
4、能够对文本数据、音频数据、图像数据、视频数据、各类结构化数据进行分析和处理,并开展大数据挖掘基础算法的开发,开展MLlib 机器学习开发,开展深度学习的人工神经网络的开发。熟练使用Python语言及相关工具实现模型建立、算法开发、BI展示等业务应用开发。