职位描述
职位描述:
我们正在寻找一位对人工智能和大型语言模型充满热情的Java后端开发工程师。您将作为核心成员,参与构建和优化我们下一代AI应用平台的后端系统,重点负责大模型部署服务、RAG(检索增强生成)引擎、以及高性能向量数据库集成等核心模块的开发与迭代(例如类似RAGFlow的后台微调与服务体系)、智能体框架搭建、MCP等。
主要职责:
1.设计与开发大模型微调平台:参与设计、开发和维护支持多种大模型(如LLaMA、ChatGLM、deepseek等)的高效微调(Fine-Tuning)后台系统,包括LoRA、P-Tuning等微调技术的集成与优化。
2.构建与优化RAG引擎:负责研发高性能、高可用的RAG(Retrieval-Augmented Generation)后端服务,包括文本处理、向量化 embedding、向量检索(Similarity Search)等关键流程。
3.深度集成向量数据库:与向量数据库(如Milvus, Weaviate, Qdrant, Pinecone等)进行深度集成与性能优化,确保海量向量数据的高效存储与毫秒级检索。
4.保障系统性能与稳定性:解决高并发、大数据量下的系统性能瓶颈,保证微调任务和推理服务的稳定性与低延迟。
5.参与技术选型与架构设计:参与AI中后台的技术选型、架构设计和核心代码编写,推动系统向更高效、更稳定、更易扩展的方向演进。
6.协同合作:与算法工程师、前端工程师和产品经理紧密协作,理解业务需求,共同交付高质量的AI产品功能。
职位要求:
1.教育背景:计算机科学、软件工程或相关专业,本科及以上学历。
2.Java开发经验:3年及以上Java服务器端开发经验,具备扎实的Java基础,深入理解JVM、多线程、并发编程、网络IO等核心知识。
3.主流框架精通:精通Spring Boot, Spring Cloud, MyBatis等主流开源框架,对其核心原理有深入了解。
4.数据库与缓存:熟练掌握至少一种关系型数据库(如MySQL, PostgreSQL)和一种NoSQL数据库(如Redis, MongoDB),具备优秀的SQL编写和优化能力。
5.工程化能力:熟悉Maven/Gradle、Git等开发工具,了解CI/CD、Docker容器化技术,具备良好的编码习惯和文档编写能力。
6.良好的沟通能力、问题解决能力。
优先考虑:
1.大模型相关经验:有实际的大模型微调(Fine-Tuning)、提示词工程(Prompt Engineering)、或LangChain/LlamaIndex等框架使用经验者优先。
2.向量数据库经验:有Milvus, Weaviate, Qdrant, Chroma等任一向量数据库的集成或调优经验者优先。
3.Python技能:具备一定的Python基础,能够阅读和理解算法团队的相关代码(如PyTorch, TensorFlow脚本)者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕