职位描述
工作内容:
1.需求分析:与相关方沟通,明确项目需求,特别是涉及大语言模型的应用场景。评估大语言模型在业务场景中的可行性,提出技术方案并验证效果。
2.算法研究与实现:选择并实现适合的机器学习或深度学习算法,进行模型训练和优化。
3.LLM模型开发与微调:基于预训练大语言模型,进行领域适配和微调(Fine-tuning),使用Prompt Engineering优化模型输出。开发基于LLM的多轮对话系统、文本分类、信息抽取等应用模块。
4.LLM模型部署与优化:将大语言模型部署到生产环境,支持高并发、低延迟的推理服务。优化模型推理性能,应用量化、蒸馏等技术降低资源消耗。解决大语言模型在实际应用中的问题(如幻觉、偏见、长文本处理)。
5.LLM系统集成与创新:将大语言模型与现有业务系统(如GIS、知识库)集成,实现智能化功能。探索大语言模型与其他AI技术(如计算机视觉、语音识别)的多模态融合应用。持续跟踪大语言模型领域的最新进展,推动技术创新。
6.技术支持:为团队提供技术咨询和支持,解决开发过程中的问题。
7.新技术研究与落地:跟踪AI的技术趋势,推动AI技术创新在项目中的应用。
任职要求:
1.计算机科学、人工智能、自然语言处理或相关专业本科及以上学历。
2.有2年及以上自然语言处理或大语言模型开发经验,有实际项目落地案例。
3.精通Python编程,熟悉主流深度学习框架(如PyTorch、TensorFlow)。
4.深入理解大语言模型的原理(如Transformer架构、注意力机制),熟悉主流模型。
5.掌握大语言模型的微调技术、RAG(检索增强生成)、Agent框架和推理优化方法(如量化、剪枝)。熟悉Prompt Engineering。
6.掌握大语言模型的应用框架(如LangChain、LlamaIndex、Dify)和工具链(如Hugging Face、OpenAI API)。
7.对AI技术有强烈兴趣,能快速学习并应用最新研究成果。具备良好的沟通能力,能将复杂技术转化为业务价值。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕