职位详情
数据智能研发
2-4万·15薪
启元实验室
北京
不限
硕士
12-11
工作地址

银桦路58号院-2号楼

职位描述
岗位职责:
1. 开展基于团队自研的数据系统的研发(图数据库、向量数据库等),参与公司自研的向量数据库核心模块的设计、开发与性能优化,重点涵盖查询执行器、索引管理、实现高性能向量检索算法(HNSW、IVF-PQ、ScaNN、DiskANN 等)等。
2. 探索向量数据库与传统关系型数据库、图数据库融合的多模态数据库架构,设计下一代多模态数据库架构。
3. 开展大语言模型的应用设计与开发,包括 RAG、Agent等核心场景。
4. 基于国产硬件平台与团队自研的国产数据系统设计端到端的数据智能应用,涵盖模型推理服务、知识检索、记忆缓存与用户交互方式。
5. 结合业务需求,设计数据流、提示链与工具调用链,持续优化数据服务的生成质量与效率。
6. 与模型团队、后端开发团队协同,完成自研数据智能应用的国产化应用落地,并持续优化应用运行情况。
7. 持续跟踪开源与商业的LLM应用生态,评估并引入适合的框架或工具。

岗位要求:
1. 计算机、软件工程或相关专业硕士或博士,计算机体系结构、操作系统等基本功扎实。
2. 深刻理解大语言模型的工作原理(Transformer、RAG Pipeline 等),熟悉多轮对话、工具调用、长文本扩写等场景的架构模式。
3. 精通Python、C++或者Java语言,熟悉 LangChain / LlamaIndex / FastAPI 等框架进行快速迭代与部署。
4. 熟悉常见数据系统:关系型(PostgreSQL、MySQL)、NoSQL(Redis、RocksDB)、向量(Milvus、Qdrant)、图(Neo4j、Nebula Graph)、大数据处理(Hadoop、Spark),具备良好的数据建模能力。
5. 深入理解数据库内核原理,包括存储管理、查询优化器、事务与日志、多版本并发控制等。有参与或贡献开源数据库经验者优先。
6. 了解主流向量数据库(Milvus、Weaviate、FAISS、Qdrant 等)并能进行性能调优。
7. 逻辑清晰,结果导向,具有良好的文档编写能力,具备跨团队沟通协作,热爱探索学习前沿大模型应用技术;有生成式 AI 产品落地经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请