大模型开发
面议
北京 本科
海淀大悦信息科技园
岗位职责:
1.模型微调与优化
设计和实施大规模语言模型的微调策略(如LoRA、P-tuning等);
优化模型训练流程,提升模型性能和计算效率;
研究并实现参数高效微调方法;
构建和优化训练数据pipeline。
2.多模态技术研发
开发视觉-语言模型,实现跨模态理解和生成;
设计多模态对齐和融合算法;
优化多模态模型的训练方法和推理效率;
研究多模态数据增强和预处理技术。
3.Agent系统开发
设计基于LLM的智能Agent架构;
开发Agent的规划、推理和决策能力;
实现Agent与外部工具和API的交互;
优化Agent的任务完成效率和鲁棒性。
任职要求:
1.教育背景
计算机科学、人工智能或相关领域博士学位;
深度学习和自然语言处理扎实的理论基础。
2.专业技能
精通PyTorch或TensorFlow等深度学习框架;
熟悉Transformer架构和预训练语言模型;
有大规模模型训练和优化经验;
良好的算法设计和编程能力。
3.研究经验
在顶级会议/期刊发表过相关论文;
有大模型微调、多模态或Agent领域的实际项目经验;
熟悉业界最新研究进展和技术动态。
4.个人素质
优秀的问题解决能力和研究创新能力;
良好的团队协作和沟通能力;
对人工智能前沿技术有浓厚兴趣。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕