岗位职责:
1. 负责大模型(LLM)的研发与优化,包括但不限于模型架构设计、训练调优(SFT、RLHF)、推理加速等,提升模型在搜索、问答等场景的性能。
2. 探索前沿技术方向,如RAG(检索增强生成)、多模态融合、数据飞轮等,推动大模型在垂直领域的应用落地。
3. 参与海量数据清洗、标注及预处理,构建高质量训练数据集,优化模型泛化能力。
4. 主导大模型(LLM)与智能体(AI Agent)系统的联合研发,包括智能体任务规划、决策推理、记忆机制等核心模块设计,提升复杂场景(如自动化办公、多轮交互)的自主执行能力。
5. 熟悉大模型驱动的智能体技术栈,如AutoGen、LangChain框架开发,实现API调用、工具扩展、多智能体协作等高级功能。
6. 参与大模型训练全流程(预训练、SFT、RLHF),支撑智能体底层认知与推理能力。
-
岗位要求:
1. 计算机/AI相关专业,熟悉机器学习、强化学习及NLP核心技术,掌握Transformer、BERT/GPT等模型架构。
2. 精通Python,具备PyTorch/TensorFlow实战经验,熟悉智能体开发框架(如AutoGen、LangChain)及工具链集成。
3. 有大模型结合智能体落地项目经验,包括但不限于任务分解、记忆管理、API调用优化等。
4. 熟悉智能体评估方法论,能独立设计测试用例与性能指标。