职位描述
大模型技术基础
熟悉大语言模型(LLM)全流程开发,包括预训练、指令微调、偏好微调、模型压缩和推理加速技术(如LoRA、QLoRA、DeepSpeed等)
掌握Transformer、BERT、GPT等模型架构,具备实际优化大模型性能(如训练效率、推理稳定性)的经验
熟练使用PyTorch、TensorFlow等深度学习框架,具备分布式训练和部署能力
自然语言处理与对话系统
精通智能客服场景的算法设计,包括意图理解、对话管理、文本生成、多轮对话和问题推荐
具备RAG(检索增强生成)、Multi-Agent智能体开发经验,能结合知识图谱优化客服系统的可靠性和响应效率
熟悉自然语言处理任务如文本分类、摘要生成、情感分析等,并能够处理高并发请求
工程实践能力
熟练使用Python/Java编程,熟悉SQL优化及大规模数据处理(如数据清洗、预处理)
熟悉Docker、Kubernetes等容器化技术,具备云端部署和运维经验
了解Linux环境开发,熟悉中间件和主流数据库(如MySQL、Redis)
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕