岗位职责:
1、大语言模型研发
设计并实现大语言模型(LLM)的技术方案,推动其在行业客户的垂直场景中落地应用,包括多轮对话、文档问答(Document QA)、结构化信息抽取、工具调用等;
熟悉指令微调(Instruction Tuning)与LoRA训练,针对行业需求调整模型效果;
关注大语言模型及相关领域的最新研究进展,将前沿技术应用于模型优化与训练。
2、数据分析与建模
针对多种业务场景,开展结构化与抽象数据的建模与分析,包括时序数据预测、异常检测、根因分析及多维数据建模;
运用数学建模方法与深度学习算法,解决复杂数据场景中的预测与优化问题。
3、模型训练调优与部署
负责模型研发全流程,包括数据集构建、模型训练调优,以及模型轻量化部署与性能优化;
持续改进模型表现,提升模型的准确性与泛化能力,为生产场景提供稳定可靠的算法支持。
岗位要求:
1、至少3年算法研发经验,扎实的机器学习与深度学习理论基础;
2、熟练掌握Python或C++编程,具备独立开发高效算法的能力;
3、熟悉主流深度学习框架(如TensorFlow、PyTorch),并具备多机多卡训练和模型量化部署的实际经验;
4、优秀的逻辑分析能力,能够快速定位并解决复杂问题;
5、热爱技术创新,具备较强的学习能力和良好的团队协作精神。