岗位职责:
1.前沿技术追踪与落地:持续跟踪LLM、多模态、 Al Agent等领域的最新技术动态(如GPT系列、 DeepSeek系列、Claude系列、Sora等),并结合业务场景进行快速验证和应用。
2.模型微调与对齐:负责大模型的监督微调
(SFT)、指令微调,以及基于人类/AI反馈的强化学习(RLHF/RLAIF)、直接偏好优化(DPO)等对齐技术,提升模型在特定任务上的表现。
3.RAG与智能体(Agent)开发:设计和优化检索增强生成(RAG)流程,结合向量数据库、知识图谱等技术,减少模型幻觉,提升回答的准确性。构建和开发能够使用工具、进行复杂任务规划的AI智能体。
4.多模态能力构建:负责文本、图像、音频、视频等多模态大模型的研发和应用工作,包括但不限于多模态内容理解、生成和跨模态检索。
5.性能优化与部署:负责大模型的推理性能优化,包括量化、蒸馏、剪枝等模型压缩技术,并使用 vLLM、TensorRT-LLM等先进框架进行高效部署,降低服务成本。
6.评估体系建设:设计并建立一套科学、全面的模型评估体系,从准确性、流畅性、安全性等多个维度对模型能力进行持续、客观的评测。
任职要求
1.计算机科学、人工智能、电子工程、数学或相关领域的硕士研究生学历。
2.3年以上AI算法研发经验,至少1年以上大模型(LLM)相关的项目实战经验,环保相关领域。
3.精通Python编程,熟练掌握至少一种主流深度学习框架(PyTorch优先,TensorFlow亦可)。
4.具备丰富的大模型微调(SFT,LoRA,QLoRA等)和对齐(RLHF, DPO)实践经验。
5.熟悉RAG技术栈,有向量数据库(如Milvus, Pinecone.Chroma)的使用经验.