职位详情
机器学习算法工程师
1.2-2.2万
兆凯电气系统(北京)有限公司
北京
不限
大专
01-15
工作地址

中国国际科技会展中心B座908

职位描述
岗位职责:
会阿里云大数据平台和机器学习的优先
1. 负责基于Python的业务系统、数据接口及微服务开发,主导数据相关服务的设计与落地(如使用Flask/FastAPI开发数据查询接口)。

2. 对接各类数据源(MySQL/PostgreSQL、Hive、MongoDB等),独立完成数据提取、清洗、转换、标准化等预处理工作,解决数据质量问题。

3. 负责ETL脚本开发与数据管道维护,参与数据仓库分层建模(ODS/DWD/DWS/ADS),保障数据同步的一致性与时效性。

4. 负责使用大数据平台采集的数据,采用机器学习(XGBoost、Apriori)算法进行训练。

5. 优化数据处理流程与代码性能,解决海量数据处理中的效率、数据倾斜等问题,确保服务高可用。

6. 配合产品、前端、测试团队推进项目落地,编写技术文档,参与线上问题排查与优化。

任职要求

1. - 本科及以上学历,计算机相关专业,5年以上Python后端开发经验,有OCR(PaddleOCR、YOLOv8)、机器学习经验(XGBoost、Apriori)优先。

2 - 精通Python编程语言,深入理解Python的核心原理、内存管理、并发编程(多线程、多进程、协程),熟练使用asyncio等异步框架。

3. 熟练掌握Python核心语法,精通Pandas、NumPy数据处理库,熟悉PySpark、Dask等大数据处理工具者加分。

4. 掌握至少一种关系型数据库(MySQL/PostgreSQL),具备扎实的SQL功底及查询优化能力;了解NoSQL数据库(MongoDB/Redis)优先。

5. 熟悉至少一种Python Web框架(Flask/FastAPI/Django),了解WSGI/ASGI服务器部署,具备微服务开发经验者加分。

6. 具备数据仓库建模、ETL开发经验,能独立设计数据处理流程,解决数据同步中的各类异常问题。

7. 熟悉数据可视化工具(Matplotlib/Plotly/Tableau),有非结构化数据(JSON/XML/图片/文档)处理。

8 具备良好的代码规范、沟通能力及问题排查能力,能承受一定的项目压力,有团队协作精神。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请