职位描述
岗位职责:
1、负责大语言模型在业务场景下的探索规划,包括技术前瞻、业务适配、方案设计、落地部署等。
2、负责大语言模型开发的全流程管理,包括训练数据准备、模型指标评测、训练过程监督调优及项目成本控制等,按时上线产品功能。
3、深度了解目前大模型应用技术方案及能力边界,Prompt、RAG、Agent、MCP等等。
4、深入理解Transformer架构,自注意力机制,熟悉LoRA等高效微调技术,具备分布式训练(多机多卡)经验。
任职资格:
1、至少3年AI平台或相关产品的从业经验,1年管理经验,熟悉AI Agent和大模型的技术特点和应用场景。
2、 具备计算机、数学、统计学等相关专业背景,熟悉机器学习、深度学习等算法。
3、熟练掌握Python编程语言,熟悉TensorFlow、PyTorch等深度学习框架。
4、对AI Agent技术(如强化学习、多模态交互等)和大模型(如GPT、BERT等)有深入理解。
5、出色的沟通能力和团队协作精神,能够协调跨部门资源推动项目进展。
6、具备较强的自我学习和创新能力,能够不断学习和探索新的技术和方法。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕