职位描述
岗位职责
1.负责大模型(LLM)的本地部署与集群部署工作,确保模型稳定高效运行,优化大模型推理性能,提高响应速度及资源利用率
2.进行大模型的训练、微调及知识库挂载RAG,提升模型在特定场景的表现
3.与团队协作开发大模型应用,适配新场景并持续优化性能
岗位要求
1.熟悉Transformer架构及大模型原理,了解主流开源大模型(如QwQ-32B、DeepSeek-R1、Gemma3等)
2.具备大模型部署经验,熟悉vllm、DeepSeek、ONNX、TensorRT等推理加速技术
3.有大模型微调(如LoRA、QLoRA、SFT等)和知识库挂载RAG相关经验,能适配大模型在不同场景的应用
4.良好的沟通能力,对项目有责任心,富有团队合作精神
工作经验及学历要求
1.本科及以上学历,非应届2年以上工作经验,学历学位证书学信网可查,
2.人工智能、自然语言处理、计算机科学等相关专业,211/985硕士优先;
3.在大模型开发、部署或微调方向有1-2个成功项目经验者优先;
4.有开源大模型相关贡献者特别优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕