职责描述:
1、基于公司业务场景,负责大规模方向的研发工作,包括但不限于NLP、CV及多模态等领域;
2、深入理解业务需求,完成垂直领域大模型精调与轻量化部署,构建Agent应用,支撑产品能力需求;
3、参与构建高质量的数据集,基于实际需求进行深入分析以指导后续改进方向;
4、将开发完成的模型部署到生产环境中,配合相关团队完成系统的联调联试,确保其稳定可靠地运行;
5、构建和维护大模型的测试框架,优化测试流程,提升测试效率。
6、深入分析测试数据,提取关键性能指标,为模型优化提供数据支持。
7、跟踪相关领域技术动态,撰写技术报告,为团队技术发展提供建议和支撑
任职要求:
1、拥有计算机科学、人工智能、数学等相关专业硕士及以上学位者优先考虑;
2、熟练掌握Python,精通TensorFlow、PyTorch等至少一种主流深度学习框架;
3、对机器学习、深度学习理论有深刻理解;熟悉NLP或CV领域常用技术和工具;
4、熟悉大模型SFT训练方法,包括LoRA、P-tuning、Prefix-Tuning等,具有大模型训练、性能调优经验;
5、了解常用的大模型能力评测Benchmark,对大模型能力评测体系和系统有基本了解;
6、具有垂直领域LangChain、LLaMAIndex、AutoGPT应用开发落地经验者优先;
7、英文读写流利,能够无障碍阅读英文文献资料;
8、具备良好的沟通协调能力和团队合作精神,心态乐观、积极面对挑战。