职位描述
1. 负责将大模型技术转化为稳定、可靠的业务应用。主导或深度参与智能问答、内容生成、代码辅助、数据分析等产品的算法模块设计与实现,并对最终效果负责。
2. 主导大模型应用(如RAG系统、智能体)从技术选型、原型验证、效果优化到线上服务部署、性能监控与迭代升级的全流程,确保高可用性与可扩展性。
3. 解决大模型落地中的工程挑战,包括但不限于推理延迟优化、成本控制、提示工程、RAG检索精度提升等,并构建相关工具链提升迭代效率。
4. 与产品经理、前后端工程师紧密协作,精准理解业务需求,将模糊的产品概念转化为可行的技术方案,并能用非技术语言清晰汇报进展与价值。
5. 关注并评估业界成熟的模型、框架与云服务,将其高效集成至业务栈中,快速驱动业务增长。
任职要求:
大模型应用开发
精通LangChain、LlamaIndex等框架,能快速构建和迭代智能应用。
具备RAG(检索增强生成)完整实战经验,熟悉文档解析、向量化、检索、重排序、效果评估与调优全流程。
具备智能体(Agent)开发经验,熟练使用ReAct、Tool Calling等范式实现任务规划与工具调用。
模型调优与部署
熟练掌握大模型微调技术,有使用LoRA等方法对LLaMA系列等开源模型进行下游任务适配的成功案例。
熟悉高效推理部署与服务化,掌握vLLM、TGI、FastAPI等技术,能优化推理性能与延迟。
编程与工程能力(重中之重)
精通Python及主流数据科学库,代码工程化能力强,熟悉单元测试、代码复用与性能分析。
熟练掌握C++,有高性能计算、底层优化或工程集成经验者优先。
熟悉Linux开发环境、Git、Docker,了解Kubernetes等部署工具,具备良好的系统设计思维。
综合素质
优秀的产品意识、逻辑思维和问题解决能力;沟通协作强,能主动推动跨部门项目落地。
加分项(优先考虑)
有成功上线并承载一定用户流量的大模型应用经验,熟悉A/B测试与线上效果监控。
熟悉模型量化、剪枝等轻量化技术,或有推理成本优化经验。
了解AWS、Azure、GCP等云厂商AI服务并有集成经验。
GitHub上有高质量开源项目,或在国际算法竞赛中取得优异成绩。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕