岗位职责:
1.负责主流大模型(如DeepSeek、Qwen等)的本地化部署、调优及API接口开发;
基于ollama、vLLM等框架优化大模型推理效率,提升服务性能;
2.独立完成Dify平台的本地化部署,并开发企业级大模型应用;
使用RAGFlow、Llama-Factory等开源工具搭建行业解决方案;
3.参与大模型相关项目的全流程开发,包括需求分析、代码实现及文档撰写;
持续跟踪大模型技术发展,探索前沿技术落地场景。
任职要求:
1.计算机/人工智能/数学相关专业本科及以上学历,1年以上相关经验(优秀应届生可放宽);
2.熟悉主流大模型架构及部署流程,能独立完成本地环境配置与资源管理;
掌握ollama、vLLM等至少一种大模型推理框架的优化实践;
3.具备Dify平台本地部署经验,能基于其开发企业级AI应用;
熟练使用RAGFlow、Llama-Factory等工具解决检索增强生成、模型微调等问题;
熟练掌握Python,熟悉Linux开发环境及Git版本管理;
4.有强烈的技术热情,良好的逻辑思维与问题解决能力;
5.加分项:有大模型实际项目开发经验,或熟悉LangChain、向量数据库等技术。