职位描述
岗位职责:
1. 参与大模型技术研究与学习,(如Transformer架构、Prompt Engineering、RLHF等)
2. 协助大模型的部署优化,包括模型量化、分布式推理、服务化部署(Hugging Face/DeepSpeed等工具链实践)
3. 支持大模型训练全流程,涵盖数据清洗、分布式训练加速、模型微调(LoRA/P-Tuning等参数高效方法)
4. 探索大模型应用场景,参与构建行业垂直领域智能体(如Agent系统、知识库问答等)
5. 完成技术文档沉淀与知识分享,协助团队构建技术资产
任职要求:
1.985、211在校学生优先考虑,持续6个月;
2.熟悉OpenWebUI、Langchain等项目,能够部署、修改;
3.熟练掌握至少一种编程语言,如Python(最常见,包括numpy、pandas、scikit-learn、PyTorch、TensorFlow等库的使用),或C++等;
4.掌握深度学习基础理论,理解Transformer/BERT/GPT等模型架构,有Hugging Face库使用经验加分;
5.熟悉RAG技术;有基于Rag构建垂直领域知识库经验者优先。
6.熟悉MCP协议、A2AI协议,有MCP服务器构建经验者优先。
7.熟悉vllm、llama.cpp等模型推理框架,有模型量化、分布式推理、服务化部署经验者优先。
8.具备良好的团队合作精神,能够有效沟通,积极解决技术难题。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕