职位描述
职位概述:
我们正在寻找一位充满激情的Python开发工程师,您将加入我们的海洋科技团队,核心工作是构建高效、可靠的数据处理管道和数据治理体系,并利用人工智能技术从复杂的海洋数据中提取洞察,为海洋科学研究、环境保护和商业决策提供技术支撑。
核心职责:
1. 海洋大数据处理与平台开发: · 设计、开发和维护面向多源、异构海洋数据(如卫星遥感、浮标、Argo、船舶、台站、数值模式等)的ETL数据管道。 · 参与构建和维护海洋大数据平台,实现数据的接入、存储、计算和可视化。 · 处理和优化海量网格数据(如NetCDF, HDF, GRIB等格式)的读写与计算性能。
2. 数据治理与质量管理: · 参与制定和执行海洋数据标准、元数据规范和数据质量评估流程。 · 开发和实施数据清洗、校验、融合和标准化工具,提升数据的可用性与一致性。 · 管理和维护数据目录,确保数据的可发现、可理解、可信任。
3. 人工智能模型开发与应用: · 利用机器学习和深度学习技术,解决海洋领域的预测、分类、识别等问题(如海洋现象识别、渔业资源预测、水质参数反演、台风路径预测等)。 · 负责AI模型从数据准备、特征工程、模型训练到评估部署的全流程开发。 · 应用和优化计算机视觉、时间序列分析等AI子领域的技术于海洋遥感影像和序列数据。
4. 协作与支持: · 与海洋科学家、数据分析师紧密合作,理解业务需求,并将其转化为技术解决方案。 · 编写清晰的技术文档,并进行必要的技术分享和支持。
职位要求(必备技能):
1. 编程与计算机基础: · 精通 Python 编程,具备扎实的编码能力和良好的编程习惯。 · 熟练掌握 Python 科学计算和数据处理生态,包括但不限于:NumPy, Pandas, Scipy, Xarray。 · 熟悉至少一个主流深度学习框架,如 PyTorch 或 TensorFlow。 · 掌握常用的机器学习库,如 Scikit-learn。 · 了解基本的软件工程知识,会使用 Git 进行版本控制。
2. 数据技术与数据库: · 具备扎实的SQL知识,有使用关系型数据库(如 PostgreSQL/MySQL)的经验。 · 了解至少一种大数据处理技术或框架,如 Spark(PySpark)、Dask 或 Hadoop 生态圈工具。 · 有使用或了解分布式存储和NoSQL数据库(如 HDFS, Cassandra, MongoDB)的经验者优先。
3. 海洋与数据领域知识: · 了解海洋数据的常见类型、格式和特点,特别是对 NetCDF, HDF 等格式有实际处理经验。 · 熟悉常用的海洋数据处理和可视化库,如 Cartopy, GDAL, Matplotlib, Seaborn 等。 · 对数据治理的基本概念(如元数据管理、数据质量、数据血缘)有初步了解。
4. 个人素质: · 具备优秀的问题解决能力和逻辑思维能力。 · 具有良好的团队合作精神和沟通能力。 · 对海洋事业有热情,有强烈的求知欲和学习能力,能快速掌握新领域知识。
加分项(优先考虑):
· 领域经验:有海洋学、大气科学、地理信息系统(GIS)或相关地球科学领域的教育背景或项目经验。
· AI项目经验:有实际的海洋AI项目经验,例如:使用CNN识别海洋中尺度涡旋、利用LSTM预测海表温度、使用目标检测识别船舶等。
· 云平台与 DevOps:
· 有在主流云平台(如 AWS, Azure, 阿里云)上部署和管理数据管道或AI模型的经验。
· 熟悉 Docker 容器化技术,了解 Kubernetes。
· 有 MLOps 相关工具(如 MLflow, Kubeflow)的使用经验。
· 数据治理工具:了解或使用过开源数据治理工具,如 Apache Atlas, DataHub, Amundsen 等。
· 高性能计算:有并行计算、GPU编程(CUDA)或高性能计算(HPC)集群使用经验。
· 可视化技能:熟悉 Web 可视化技术(如 D3.js, ECharts, Deck.gl)或有构建地理信息仪表板的经验。
目前公司虽刚起步,成员少但经验丰富,由专家博士生导师带队,成员全部硕士以上学历,欢迎有追求理想和成就的有志之士加入。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕