1.1-1.8万
富力双子座A座2502
我们是一支专注利用大数据和机器学习来解决医疗和法律领域难题的研究团队,孵化自 UC Berkeley。与我们一同在北京工作,您不仅能享受五险等完善福利,还能享用可乐、巧克力、旺旺雪饼等各类零食。我们期待对前沿模型和算法充满热情、愿意迎接挑战的科研人才加入!
岗位职责:
1. 大语言模型数据处理:对大语言模型的文本材料进行提取和处理,生成可用于训练的数据集。
2. RAG 架构研究与优化:结合检索模型(如 Elasticsearch、Faiss)与生成模型(如 BERT、T5、GPT 系列)进行研发与迭代。
3. 信息检索系统构建:设计并实现基于 RAG 的垂直领域信息检索系统。
4. 向量数据库与大数据处理:熟悉向量数据库(如 Milvus、Weaviate、Pinecone)或大数据处理工具(如 Spark、Hadoop),并能在项目中灵活应用。
5. 模型加速与优化:熟悉模型量化、蒸馏、推理加速(如 TensorRT、ONNX)等技术手段。
6. 协同开发与集成:与后端软件组件和开发团队紧密协作,确保 RAG、语言模型及其他系统模块无缝集成。
7. 用户反馈分析与性能改进:收集、分析用户反馈和行为数据,持续改进模型性能和用户体验。
8. 前沿技术追踪:跟踪最新的语言处理技术和研究进展,为团队提供专业知识与指导。
9. 文档与报告撰写:编写技术文档和研究报告,记录 RAG 开发过程和关键性能指标。
岗位要求:
1. 计算机科学、人工智能、语言学或相关领域的硕士或博士学位。
2. 至少 3 年相关领域专业经验,有 RAG 开发经验者优先。
3. 精通 Python 编程语言,熟悉 TensorFlow、PyTorch 等主流深度学习框架。
4. 拥有大语言模型知识库的深入理解,能独立设计与实施复杂的垂直领域 RAG 架构流程。
5. 具备阅读英文论文和敏捷解决新问题的能力。
6. 在垂直领域文本处理方面有经验者优先考虑。
7. 对 LLM(大语言模型)原理及 LORA 方法有深刻理解,并愿意从算法原理层面进行探索。
具体工资面议 最高薪资可达8万
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕