职位描述
岗位职责
• 使用 Python 完成 预训练代码数据的爬取、清洗、加工与结构化处理
• 负责代码类数据的 日常评估、问题总结与流程持续优化,保障数据可训练与可评测价值
• 参与项目任务拆解、进度协作与结果同步,推动多方高效协同
• 结合实际工作,跟进 大模型(LLM)代码生成 / 理解方向的前沿进展,并探索可落地的数据构建或评估方式
• 深度使用 AI Coding 编程工具 提升代码开发、数据构建与验证效率
任职要求(必备)
• 熟练掌握 Python,具备工程级编码能力;
• 具备 真实爬虫项目经验,能够独立完成数据采集、异常处理与流程维护
• 具备 多技术栈代码理解能力(不限于 Python,能读懂并修改其他常见语言代码)
• 熟练使用至少一种 开发工具 / IDE,并能高频使用 AI Coding 类产品进行提效
• 具备良好的 沟通与协作能力,能够清晰反馈技术与数据问题
• 对大模型生成方向(尤其是代码生成、代码理解)**有强烈兴趣并愿意持续学习
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕