职位详情
大模型应用算法工程师
1.2-1.8万
深圳市中誉艾科科技有限公司
深圳
1-3年
本科
12-28
工作地址

曙光大厦12楼12号

职位描述
  1. 前沿模型选型与微调
    针对业务场景评估LLaMA/Qwen等开源或商用大模型的优缺点,完成全参、LoRA、QLoRA、RLHF、DPO 等微调,使模型在垂直领域达到上线精度
  2. 数据工程与知识库构建
    负责海量文本/多模态数据的采集、清洗、去重、配比、指令构造、质量评估,并建立可更新版本的知识库或向量索引,为 RAG、Agent 提供检索底座
  3. 模型压缩与推理加速
    应用量化、剪枝、蒸馏、Flash-Attention、vLLM、TensorRT-LLM、Triton 等方案,在 GPU/昇腾/NPU 上实现 2-10× 推理加速与显存压缩,满足线上低延迟、高并发要求
  4. 应用框架与智能体开发
    基于 LangChain、LlamaIndex、Dify、Coze、AutoGPT 等搭建 Agent,完成多轮对话、工具调用 (Tool Calling)、任务规划、意图路由、工作流编排,实现复杂业务自动化
  5. 高性能服务化与部署
    使用 Python/FastAPI/Tornado 开发异步推理服务,封装 REST/gRPC 接口;用 Docker+K8s+Helm 做容器化编排,实现灰度发布、弹性伸缩、负载均衡与可观测性
  6. 存储与检索系统
    设计 PostgreSQL、Redis、Milvus/Elasticsearch 等混合存储方案,支持结构化元数据、缓存、向量检索与关键词检索,提高多路召回效率
  7. 性能监控与持续优化
    构建线上指标体系(QPS、Latency、TTFT、TP99、吞吐、GPU 利用率),定位瓶颈并迭代优化;通过 A/B 实验验证业务效果(准确率、转化率、用户满意度)
  8. 技术跟踪与内部赋能
    持续阅读顶会论文(NeurIPS、ICML、ACL、EMNLP)、跟踪开源社区动态,定期输出技术报告与最佳实践,推动团队技术升级与知识共享

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请