职位描述
职位描述:
我们正在寻找具备出色系统架构设计能力、熟悉大模型及其应用生态的工程师,加入 低空智能大模型研发团队。你将主导LLM/VLM应用的系统设计、性能优化和多能力编排,推动低空场景各产品形态持续创新与规模化增长。
你将负责:
1. 主导大语言模型/多模态在低空业务场景下的服务化架构设计与实现,提供支持联网、文件解析、代码执行等多工具(Tools)能力,构建多模型灵活切换与组合的动态编排能力;
2. 深度参与WebGPT、Function Calling、Agent、Assistant API、多模态(图像/结构化数据)等复杂服务能力的系统支持,探索 LLM/VLM + 工具链的产品形态;
3. 设计并实现基于流式通信的高效 LLM/VLM应用架构,协同国内领先的大模型推理平台,构建稳定、低延迟、高吞吐的在线服务系统;
4. 与算法、产品、前端、评测团队紧密合作,实现从架构到效果的全链路闭环,提升用户体验与系统可扩展性。
任职要求:
1. 计算机相关专业硕士及以上学历,2年以上研发经验;
2. 精通 Python / Go / C++ / Java 中至少一门语言,具备扎实的工程能力和良好的架构思维;
3. 熟悉高性能服务架构设计,对流式通信、服务编排、RPC/HTTP通信机制、资源调度有深刻理解;
4. 具备复杂系统场景的分析与拆解能力,良好的跨团队协作能力和技术驱动意识;
5. 有在线服务系统、大规模机器学习平台、搜索/推荐/对话系统等经验者优先。
加分项:
● 熟悉大语言模型原理,有 ChatGPT、Claude、Qwen等模型的落地与服务经验;
● 有参与 Agent架构、多工具执行系统、Function Calling引擎等项目经验;
● 熟悉 MLSys、推理服务优化(如KV缓存、分批调度、异步流式)等,有高性能分布式系统设计背景;
● 对多模态模型、跨模态服务系统有实践经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕