职位详情
H7687岗TPG-大模型数据开发 已下线
1.8-2万
武汉佰钧成技术有限责任公司
深圳
无经验
本科
05-01
工作地址

百度国际大厦东塔楼百度

职位描述
033岗位职责
- 负责公司数据采集、清洗、整理与加工等处理流程的开发与维护;
- 编写高效、可维护的 Python 脚本,实现数据自动化处理;
- 与数据分析师、数据科学团队协作,提供高质量的数据支持;
- 优化数据处理流程,提高处理效率与数据质量;
- 编写相关技术文档,确保流程透明与可追踪。
任职要求
- 学历要求:本科及以上学历,计算机、数据科学、统计学、数学等相关专业;
- 编程能力:扎实的 Python 编程能力,熟悉常见的数据处理库(如 Pandas、NumPy、openpyxl、requests、re 等);熟悉 Linux 环境,掌握 Shell 脚本;
- 数据能力:熟悉数据清洗、转换、整合技术,能够处理结构化与非结构化数据;能独立搭建、维护分布式数据处理pipeline。
- 大模型使用经验:熟悉大模型相关库(如:transformers、vllm),有实际使用大模型处理数据的案例(包含但不限于LLaVA、Qwen、CosyVoice等),能解决模型输出不一致问题(如通过正则 / 规则模板标准化结果);
加分项:
- 至少熟悉一种深度学习框架,例如 PyTorch、TensorFlow、PaddlePaddle;
- 有大数据(如 Hadoop、Spark)经验;
- 有数据可视化(如 Matplotlib、Seaborn、Plotly)经验;
- 有使用 Docker、Git 等工具的经验;
- 良好的沟通能力和团队合作精神,能独立思考、主动发现问题并提出解决方案。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

查看更多相似职位