职位描述
【工作内容】
1、支撑大数据中心:大数据中心有海量的数据样本,这个人需要懂得大模型的全流程,对于他们自己的样本给到最终用户之前进行内部的模拟流转,找出样本里的问题,进行样本的调优和数据治理。
2、常驻大数据中心,和大数据中心另外的模型训练项目组会有一些交流,方案编写和汇报沟通。
3、参与大型语言模型(语义、多模态等)的训练与效果优化,包括但不限于数据处理、预训练、指令精调、RLHF等。
4、对现有算法、数据进行分析和评估,优化模型生成效果,减少有害、敏感或偏见相关回复。
5、调研并探索LLM方向前沿算法、框架,持续提升现有算法的效率与效果。
6、统筹内部与垂直大模型相关的数据集管理工作
【掌握技能】
懂得大模型的全流程,可进行样本的调优和数据治理、方案编写和汇报沟通、有(GPT、BERT 等)研发经验、掌握大模型样本前沿的知识,主流开源大模型的了解。关键词:训练、蒸馏、量化
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕