职位描述
要求:适应驻场开发,有金融银行实际项目经验。
岗位职责/任职要求:
1.负责大语言模型(LLM)的本地化部署、性能优化及推理加速,熟练使用Xinference、Ollama、vLLM等框架进行模型服务化;确保模型在生产环境中的稳定运行和高性能表现。
2.基于LangChain、Dify等框架开发大模型应用,设计并实现复杂工作流编排与Function Calling应用;
3.负责知识库的构建及优化任务。
岗位要求:
1.计算机科学/人工智能相关专业本科及以上学历;
2.精通Python语言,熟悉使用FastAPI、Flask、Django任一框架;
3.熟悉Linux开发环境,熟练使用Git等协作工具。
4.2年以上NLP算法开发应用经验,熟悉Transformer、BERT、GPT等模型原理及调优方法;
5.熟悉大模型部署工具链(Xinference/Ollama/vLLM),有实际部署通义千问、DeepSeek等模型经验。
6.熟悉LangChain/Dify等应用框架,具备工作流编排与Function Calling开发经验;
7.熟练使用Docker实现模型服务容器化,了解CI/CD流程及K8s生态;
8.加分项:
(1)具有数据开发相关经验,熟悉数据开发任务,包括但不限于报表生成、ETL流程的调度和优化;
(2)在LLM应用创新(RAG/Agent)方向有落地案例。
公司地址:武汉市江夏区金融港A12栋503
薪酬简介:
1,享受武汉本地社保、公积金、商业险;
2,自备笔记本电脑,享受电脑补助;
3,享受午餐补贴;
4,享受带薪年假+福利假;
5,享受年度体检。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕