岗位职责
1、参与公司大模型的开源应用落地,尤其是结合公司核心业务的实际应用开发与实践;
2、负责公司业务相关数据的处理工作,包括数据清洗、分类、分析和存储,助力构建高质量的数据集;
3、协助公司业务知识库的建设,支持大模型文本生成、智能问答、知识图谱等应用的开发与优化;
4、负责大模型微调与优化工作,涵盖主流大模型(如Qwen、DeepSeek等),使用Dify、Langchain、Ollama等开发工具,以及LORA技术提升模型性能;
5、持续关注大模型领域的技术前沿,及时跟进最新研究动态与行业趋势,并结合公司实际需求提出创新思路与解决方案。同时,参与数据挖掘,完成大模型训练数据集的构建。
任职资格
1、计算机、人工智能、数学、自然语言处理等相关专业本科及以上学历,具备一定的学术背景和实践经验;
2、熟练掌握Python,熟悉PyTorch以及最新的Transformer、diffusion等模型架构,具备常见深度学习模型的应用经验;
3、熟悉多个主流大模型(如GPT、Gemini、LLaMA、Claude、DeepSeek、Qwen等)的工作原理及应用,精通Dify、Langchain、Ollama等一种或多种开源LLM/Agent开发框架;
4、有丰富的深度学习、多模态、NLP、大模型等领域的相关模型训练和调试经验,优先考虑有多机多卡训练、全参数微调、加速、蒸馏以及高质量数据构建等相关经验者;
5、拥有扎实的自然语言处理(NLP)或机器学习算法理论基础,热衷于AI产品或NLP应用的开发与实践经验者优先;
6、在大数据处理、大规模分布式计算、分布式训练等领域有科研或实践经历优先;
7、具备较强的学习能力和问题解决能力,能够在快节奏环境中工作。