一、岗位职责:
(一)AI Agent开发:
1.参与前沿技术的研究与实践,专注于AI Agent编程研发工作
2.负责与LLM大模型的对接、优化和改进,提升AI Agent系统的性能、可靠性和智能水平,确保其在复杂场景下的高效运行。
3.使用Python作为主要编程语言,进行AI Agent相关功能模块的开发、调试和优化,编写高质量、可维护的代码。
4.与跨职能团队紧密合作,包括产品、设计、开发等团队,确保按时交付符合需求的AI Agent解决方案,满足业务目标和用户体验要求。
5.跟踪和研究AI Agent领域的最新技术动态,结合LLM大模型的发展趋势,为团队引入创新的技术理念和方法,推动项目的持续进步。
(二)模型开发与优化:
1.负责大语言模型(LLM)或深度强化学习(DRL)模型的微调(Fine-tuning)、提示工程(Prompt Engineering)及持续训练。
2.优化模型推理效率(如量化、剪枝、蒸馏)及分布式训练(PyTorch FSDP/DeepSpeed)。
(三)全流程搭建:
1.主导数据采集、清洗、标注及特征工程,构建高质量训练数据集。
2.搭建模型训练-评估-部署的完整Pipeline,集成MLOps工具链(如MLflow/Kubeflow)。
二、任职要求:
1.计算机科学、人工智能、软件工程、数学或相关专业本科及以上学历。
2.至少1 年以上的AI Agent开发经验,有Magentic-One、AutoGen、LangGraph等开源框架开发经验优先。
3.熟悉机器学习和深度学习算法,对大模型有基本的了解。
4.熟悉常见的Python代码框架,具备使用这些框架进行Web应用开发的经验,能够快速搭建和部署API接口,实现AI Agent与外部系统的高效交互。
5.具备与LLM大模型开发的实践经验,了解LLM模型的架构、训练方法和优化技巧,能够高效地进行模型调用、结果解析和二次开发。
6.熟悉LLM模型的推理框架的原理和使用,如vllm,了解其在分布式推理中的应用,进行模型的高效推理。 - 熟悉LLM模型的部署框架的原理和使用,如Ray Serve,能够使用Ray Serve进行模型的部署和管理,实现模型的自动扩展、多GPU和多节点支持等功能。
7.熟悉LLM agent开发工具框架的使用,如LangChain、LangGraph、LlamaIndex、Microsoft AutoGen等 - 熟悉常用的中间件系统,如mysql、redis、mongodb、kafka等,能够基于这些中间件进行数据存储、缓存管理和消息传递等操作,以支持AI Agent系统的高效运行。
8.对docker、k8s等云原生组件有深入的理解和运用能力,能够利用容器化技术进行AI Agent应用的部署、管理和扩展,确保系统的高可用性和可伸缩性。 - 具备较强的算法开发能力,能够针对AI Agent的特定需求,设计和实现高效的算法,提升系统的智能化水平。
9.熟悉AI Agent技术领域的最新研究成果,有实际项目落地经验者优先,尤其是在LLM大模型与AI Agent结合的应用场景中有成功案例者将更具优势。