工作职责
负责基于大语言模型(LLM)的AIoT应用开发,主导RAG(检索增强生成)、Agent(智能体)、MCP(模型上下文协议)技术在桌面机器人、AI玩具、智能终端等场景的落地,实现自然语言交互、任务规划及多模态数据处理;
设计并实现本地化大语言模型部署方案,结合国产算力平台(如昇腾、寒武纪)及边缘计算芯片(如乐鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、显存优化(PagedAttention)及端侧推理加速;
深度集成国内云平台(阿里云百炼、华为云昇腾AI服务、腾讯云NLP),实现模型服务的弹性扩展与高可用性,满足数据合规性与安全隔离要求;
开发桌面机器人核心功能,包括舵机控制、传感器融合、屏幕交互等,结合LLM实现语音问答、环境感知、行为决策等智能化能力;
与前端团队协作,快速构建技术验证Demo(如可视化对话系统、工具调用界面),支持产品原型设计与客户演示。
任职要求
负责基于大语言模型(LLM)的AIoT应用开发,主导RAG(检索增强生成)、Agent(智能体)、MCP(模型上下文协议)技术在桌面机器人、AI玩具、智能终端等场景的落地,实现自然语言交互、任务规划及多模态数据处理;
设计并实现本地化大语言模型部署方案,结合国产算力平台(如昇腾、寒武纪)及边缘计算芯片(如乐鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、显存优化(PagedAttention)及端侧推理加速;
深度集成国内云平台(阿里云百炼、华为云昇腾AI服务、腾讯云NLP),实现模型服务的弹性扩展与高可用性,满足数据合规性与安全隔离要求;
开发桌面机器人核心功能,包括舵机控制、传感器融合、屏幕交互等,结合LLM实现语音问答、环境感知、行为决策等智能化能力;
与前端团队协作,快速构建技术验证Demo(如可视化对话系统、工具调用界面),支持产品原型设计与客户演示。