岗位职责:
前沿算法研究与技术创新:负责人工智能领域前沿算法研究和创新,重点聚焦LLM、生成式AI、时序类大模型等,探索人类反馈强化学习、MoE、多模态、long-context等方向。
模型微调与优化:负责对大语言模型(LLM)进行领域适配微调(如LoRA、P-Tuning等),提升模型在特定任务(如对话、文本生成等)上的性能。
数据处理与构建:清洗、标注和构建高质量的微调数据集,设计数据增强策略以提升模型泛化能力。
实验设计与调参:设计微调实验方案,调整超参数(学习率、批次大小等),评估模型效果并迭代优化。
性能评估与监控:使用BLEU、ROUGE等指标评估模型输出,分析bad case并提出改进方案。
模型对齐:优化强化学习与对齐训练流程,解决大规模分布式环境下的效率瓶颈和行业对齐。
工程化部署支持:协助将微调后的模型部署到生产环境,优化推理效率(如量化、剪枝)。
技术跟踪与创新:跟进大模型领域最新技术(如RLHF、Adapter架构),探索低成本微调方案。
任职要求:
技术背景:计算机、AI相关专业硕士及以上学历,熟悉PyTorch/TensorFlow框架和Transformer架构。
微调经验:有LLM(如GPT、LLaMA、ChatGLM)微调实战经验,熟悉Prompt Engineering和Few-shot Learning。
数据处理能力:熟练使用NLP工具(Hugging Face、spaCy),具备文本清洗、标注和分布式训练经验。
编程基础:精通Python,熟悉Linux环境,能优化训练代码(如混合精度训练、分布式训练)。
工程方向:精通分布式、微服架构思想,具有创建生产工程的相关经验。
问题解决能力:能分析模型欠拟合/过拟合问题,提出数据或算法层面的解决方案。
团队协作:良好的沟通能力,能与算法、产品团队协作落地业务场景需求。