职位详情
大模型应用算法工程师
1.2-1.8万
深圳市中誉艾科科技有限公司
深圳
1-3年
本科
12-28
工作地址
曙光大厦12楼12号
职位描述
前沿模型选型与微调
针对业务场景评估LLaMA/Qwen等开源或商用大模型的优缺点,完成全参、LoRA、QLoRA、RLHF、DPO 等微调,使模型在垂直领域达到上线精度
。
数据工程与知识库构建
负责海量文本/多模态数据的采集、清洗、去重、配比、指令构造、质量评估,并建立可更新版本的知识库或向量索引,为 RAG、Agent 提供检索底座
。
模型压缩与推理加速
应用量化、剪枝、蒸馏、Flash-Attention、vLLM、TensorRT-LLM、Triton 等方案,在 GPU/昇腾/NPU 上实现 2-10× 推理加速与显存压缩,满足线上低延迟、高并发要求
。
应用框架与智能体开发
基于 LangChain、LlamaIndex、Dify、Coze、AutoGPT 等搭建 Agent,完成多轮对话、工具调用 (Tool Calling)、任务规划、意图路由、工作流编排,实现复杂业务自动化
。
高性能服务化与部署
使用 Python/FastAPI/Tornado 开发异步推理服务,封装 REST/gRPC 接口;用 Docker+K8s+Helm 做容器化编排,实现灰度发布、弹性伸缩、负载均衡与可观测性
。
存储与检索系统
设计 PostgreSQL、Redis、Milvus/Elasticsearch 等混合存储方案,支持结构化元数据、缓存、向量检索与关键词检索,提高多路召回效率
。
性能监控与持续优化
构建线上指标体系(QPS、Latency、TTFT、TP99、吞吐、GPU 利用率),定位瓶颈并迭代优化;通过 A/B 实验验证业务效果(准确率、转化率、用户满意度)
。
技术跟踪与内部赋能
持续阅读顶会论文(NeurIPS、ICML、ACL、EMNLP)、跟踪开源社区动态,定期输出技术报告与最佳实践,推动团队技术升级与知识共享
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕
职位福利
深圳市中誉艾科科技有限公司
企业服务
100-299人
|
为您推荐更多相似职位
AI应用工程师
2-3万
深圳市投控东海投资有限公司
深圳
本科
AI算法工程师(012139)
面议
中信银行信用卡中心
深圳
本科
点云处理算法工程师(26届校招)(J10845)
面议
奥比中光
深圳
硕士
大疆--中/高级SLAM算法工程师(深圳)
5-10万·15薪
天津尘时科技有限责任公司
深圳
硕士
信号处理算法工程师
1.6-2.5万
深圳国际量子研究院
深圳
硕士
AI工程师
面议
CET中电技术
深圳
本科
查看更多相似职位
周边城市
广州招聘
东莞招聘
珠海招聘
汕头招聘
韶关招聘
湛江招聘
中山招聘
江门招聘
茂名招聘
立即申请
收藏职位
举报职位
取消