职位描述
 职位描述: AI模型代码能力评测 - 对模型生成的代码进行多维度、深度的专业评估,评判其正确性、效率、可读性、健壮性及代码风格。 - 横向对比不同模型或不同版本模型在复杂任务上的表现差异,并提供精准、结构化的评测结论。 高质量代码范例撰写 - 针对模型当前能力较弱的领域(如复杂算法、最新技术栈、特定领域逻辑),撰写“黄金标准”的代码范例(SFT数据)。 - 以“代码导师”的身份,创建高质量的指令和代码实现,直接教会模型掌握新的知识和更优的编码范式。 模型边界与缺陷分析 - 设计并执行具有挑战性的编程任务和边缘测试用例(Edge Case),主动探索和挖掘模型的知识盲区、逻辑漏洞和潜在缺陷。 - 分析模型的“幻觉”和错误模式,为算法优化提供关键的一手资料。 真实世界应用与反馈 - 在日常工作中深度使用我们正在开发的AI编程工具,完成真实的项目模块或开发任务。 - 从真实用户的视角,提供关于工具链、模型响应和人机交互的全面反馈,推动产品体验的提升。 Prompt Engineering与最佳实践沉淀 - 基于丰富的实践,探索并总结最高效的Prompt Engineering技巧,形成团队的最佳实践。 - 与产品经理、算法工程师紧密合作,将您的工程洞察和评测经验转化为可执行的需求和优化方向。 理想的专家是AI辅助编程的深度实践者,对提升模型性能充满热情,并具备扎实的工程经验。他们的核心特征包括: - 精通多种编程语言 和 3年以上 的全栈代码经验,熟悉代码补全、代码生成、代码纠错、单元测试生成等常见任务。 - 是cursor 或类似AI编程工具的 重度用户 。 - 具备 注重细节、逻辑严谨、乐于分享 的个人特质。
职位要求: - 编程语言: 精通至少两门主流编程语言(高优Python, JavaScript/TypeScript, 低优 Go, Java, C++),对语言的细微差别和最佳实践有深入理解。熟悉代码补全、代码生成、代码纠错、单元测试生成等常见任务。 - 开发经验: 拥有3年以上软件开发经验,主导或深度参与过中大型项目,具备丰富的代码调试、重构和性能优化经验。(对标T4T5) - AI工具使用: 是cursor 或类似AI编程工具(如 GitHub Copilot)的重度用户(日均使用>1小时),熟悉其优势与局限,并有自己独特的 Prompt Engineering 技巧,有过使用这些AI编程工具构建项目的经历 - 学历: 本科及以上 职业背景: - 来自知名科技公司、独角兽或顶级开发工作室的资深工程师、架构师。 - 活跃在开源社区的资深贡献者或知名技术博主。 - 在特定领域(如算法、数据科学、前端/后端开发)有深厚积累的技术专家。 个人特质: - 注重细节: 对代码质量有洁癖,能够发现并修正细微的逻辑错误或不规范的写法。 - 逻辑严谨: 具备优秀的分析和归纳能力,能够清晰、一致地应用评测标准。 - 乐于分享: 愿意分享自己的见解和经验,有帮助他人成长的意愿。 - 好奇心强: 对AI技术充满好奇,愿意探索和评测前沿的编程模型。
  以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕