职位描述
岗位职责
1. 架构设计与开发
- 设计并实现基于大模型的AI Agent架构及多智能体协同系统,支撑智能对话系统、专业领域问题解决等应用场景
- 构建涵盖模型选型、微调、部署、计算优化的全链路大模型服务框架及工具平台
- 开发多模态数据融合框架,解决跨模态信息提取与分析问题
2. 算法研究与优化
- 推进LLM、AIGC、多模态模型在业务场景中的落地,优化模型推理效率与用户体验
- 主导大模型训练/对齐全流程,包括思维链数据构造、模型架构优化、训练评估及垂类模型微调(SFT/RLHF/GRPO等)
- 探索Agent应用、图文生成等关键技术攻坚,复现前沿研究成果
3. 工程效能提升
- 开发数据闭环工具链(标注/分析/可视化系统),优化产研效率
- 实现大模型服务部署优化(GPU加速、Langchain集成、API开发等)
- 解决模型训练与应用中的性能瓶颈及工程难题
任职要求
核心条件
- 2025届硕士及以上学历,计算机/人工智能/软件工程相关专业
- 深入理解Transformer架构及大模型底层原理,熟悉BERT/GPT系列模型微调技术(LoRA等)
- 精通Python/C++/Java至少一门语言,熟练使用PyTorch/TensorFlow、HuggingFace/ModelScope等框架
- 具备NLP/CV多模态实践经验,掌握RAG、知识库建设等应用技术
- 扎实的算法基础(ACM/NOI竞赛获奖者优先)
优先条件
- 具备大模型RL算法调优、思维链构建、模型压缩部署实战经验
- 发表过ACL/ICML/CVPR等顶会论文,或HuggingFace高星项目贡献者
- 掌握Spark/Flink大数据处理技术及Spring Cloud微服务架构
能力特质
- 技术敏锐度:持续跟踪LLM领域前沿动态,具备快速技术转化能力
- 系统性思维:能统筹模型开发全生命周期,平衡性能与工程可行性
- 创新驱动:善于攻克复杂场景技术难题,推动业务突破
- 协作精神:优秀的技术沟通能力,能有效推进跨团队协作
发展机会
- 参与亿级参数大模型研发,打造行业标杆级AI Agent产品
- 与顶尖AI团队深度协作,持续提升技术影响力
- 前沿技术探索资源支持(算力/数据集/学术交流)
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕