职位详情
Ai开发高级工程师(J12208)
2-4万·14薪
江苏鱼跃医疗设备股份有限公司
南京
3-5年
本科
01-06
工作地址

徐庄软件园研发一区-6号楼福中高科技产业园6栋 鱼跃凯立特研发大楼

职位描述
岗位职责:
1. 基于开源大模型(Llama/Qwen/GLM 等)进行二次开发,落地业务场景:对话、多轮上下文、工具调用(Tool-Calling)、Agent 工作流编排。
2. 负责 RAG/知识库能力建设:文档解析清洗、切分、索引、向量化、召回与重排、引用溯源、增量更新与版本管理。
3. 按业务需要进行微调与对齐:SFT、LoRA/QLoRA(DPO/RL 视项目选用);建设训练/评测数据闭环。
4. 推理服务部署与性能优化:vLLM/TGI/Transformers Serving;提升吞吐、降低时延与 token/GPU 成本。
5. 建立评测与质量体系:离线基准集、线上监控指标、回归集;红队测试(幻觉、提示注入、越权工具调用、数据泄露等)。
6. 与前后端/客户端协作,将能力封装为稳定 API/SDK,支撑灰度发布、回滚与持续迭代。

任职要求:
1. 精通 Python,熟练 PyTorch;熟悉 HuggingFace(Transformers/Datasets/PEFT)。
2. 有大模型应用落地经验,至少具备以2 项:- RAG(向量检索/重排/引用溯源)- Tool-Calling/Agent 编排(函数调用、工作流、状态管理)- LoRA/QLoRA/SFT 微调或模型评测体系 - 推理部署与优化(并发、缓存、限流、降级)
3. 扎实工程能力:可观测性、日志/链路追踪、线上故障定位与复盘;良好的代码质量与测试习惯。
加分项
- 熟悉 Milvus/FAISS/pgvector/Elastic、召回-排序链路与检索评测
- 熟悉 vLLM/TGI/TensorRT-LLM/llama.cpp、量化(AWQ/GPTQ)
- 有安全经验:prompt injection 防护、工具权限隔离、审计与脱敏
- 有垂直领域(医疗/金融/工业等)落地经验或开源贡献

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请