职位描述
岗位职责
负责大语言模型(LLM)及多模态模型(文本 / 图像 / 语音融合)的训练与推理全流程开发,基于 PyTorch 构建高效训练 pipeline,解决模型收敛速度、数据效率、泛化能力等核心问题;
聚焦端侧场景(移动端、嵌入式设备等),主导大模型轻量化与推理优化,包括但不限于模型量化(INT4/INT8)、结构化剪枝、知识蒸馏、算子融合等技术落地,确保模型在终端设备上的高效运行;
结合终端硬件特性(CPU/GPU/NPU 等),优化模型推理链路,降低 latency(延迟)、内存占用与功耗,平衡模型性能与终端资源限制;
参与端侧大模型部署方案设计,与工程团队协作完成模型从算法原型到终端产品的落地,解决部署过程中的兼容性、稳定性问题;
跟踪大模型端侧优化领域前沿技术(如轻量级架构设计、动态推理等),推动技术创新与产品功能迭代。
任职要求
大模型 / 多模态模型研发经验;
精通大语言模型(如 Transformer 系列)或多模态模型(如 CLIP、FLAVA 等)的原理与实现,具备扎实的模型训练(预训练 / 微调)或推理链路搭建经验;
熟练掌握 PyTorch 框架及模型训练、部署工具(如 TorchScript、ONNX),能独立完成模型代码开发与调试;
具备丰富的模型端侧工程经验:
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕