此岗位属于外包驻场形式,不喜勿投!!
一. 岗位职责
1. 基于大模型,构建智能体架构,实现复杂问题的 理解–规划–工具调用–执行–感知–反思(必要条件) 全流程能力;
2. 前沿技术探索,设计 算法迭代飞轮(必要条件),优化基础模型,有效提升模型性能指标与稳定性;
3. 规划与实施 多智能体系统(必要条件),并在实际场景中落地;
4. 负责大模型在具体产品中的预训练、微调、封装与模型部署服务化全链路;
5. 与产品、工程团队协作,针对业务进行模型适配、性能优化与迭代升级。
二. 任职要求
● 硕士及以上学历,人工智能、计算机科学、自动化、数学等相关专业优先;
● 扎实的数据结构和算法功底,精通 Python/C++ 中至少一种,有 PyTorch、
TensorFlow 等深度学习框架使用经验,并熟悉 分布式训练;
● 有大型预训练模型开发经验,包括高效训练、微调、模型压缩、推理优化/部署等;
● 在顶级学术会议(如 NeurIPS、ICLR、CVPR、ACL 等)发表一作论文,或在多模态、CV、NLP、强化学习等竞赛中取得优异成绩者优先;
● 责任心强、积极主动,良好的沟通与团队协作能力,能够快速推进项目进展
工作时间10点——21点