岗位职责:
1、模型微调:使用预训练的大语言多模态模型(例如GPT系列),负责设计和实施微调策略,以适应特定任务和数据集。
2、自动化脚本编写:开发自动化工具和脚本,用于模型微调、数据预处理、实验管理和结果分析,以提高工作效率并确保实验的可重复性。
3、测试脚本规划:设计和编写用于模型评估和性能测试的脚本,包括功能测试、端到端测试和基准测试。
4、数据处理和清洗:处理和清洗多模态数据,准备用于模型训练和微调的数据集。
5、算法优化:不断改进微调过程和模型性能,通过实验和分析寻找优化策略,提高模型在特定任务上的性能。
6、技术文档编写:撰写技术文档和报告,记录实验结果、方法和发现,以及分享最佳实践和经验教训。
7、团队协作:与团队成员合作,包括研发人员、测试工程师和产品经理,共同推动项目进展并解决技术挑战。
招聘要求:
1、学历要求:计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。
2、专业技能:具有深度学习和自然语言处理领域的扎实理论基础和实践经验,熟悉常见的神经网络架构和训练技术。
3、编程技能:熟练掌握Python编程语言和深度学习框架(如PyTorch或TensorFlow),具有良好的编程实践和软件工程能力。
4、经验要求:至少2年以上相关工作经验,有大语言模型微调或自然语言处理项目经验者优先。有智能体和RAG开发经验,熟悉python。
5、沟通能力:出色的沟通和团队合作能力,能够清晰表达想法、分享知识,并与多学科团队紧密合作。
6、创新精神:具有创新思维和问题解决能力,能够在复杂的问题上寻找新颖的解决方案。