「北京海淀区多模态大模型工程师招聘」_2025年长春捷翼汽车科技股份有限公司招聘-智联招聘

职位详情

多模态大模型工程师

2.5-5万

长春捷翼汽车科技股份有限公司

北京

5-10年

本科

08-15

工作地址

清华大学

职位描述

岗位职责

1. 多模态模型研发
• 设计与实现多模态模型架构，支持文本、图像、分子结构、3D空间数据等多种模态的联合建模；
• 深入研究并集成当前主流的多模态模型（如 CLIP、BLIP-2、ImageBind、Kosmos、GIT、CoCa、Flamingo 等）；
• 针对制药数据（分子图谱 + 文本描述 + 生物实验数据）构建专用多模态特征融合模块；
• 针对制造场景（图像 + 传感器数据 + 工艺文档）实现模态间信息对齐与融合。

2. 模型优化与微调
• 基于领域数据进行多模态大模型的微调（LoRA、QLoRA、Adapter等）；
• 研究和实现多模态指令微调（Instruction Tuning）与对齐（Alignment）策略；
• 优化推理性能（量化、蒸馏、稀疏化）以适配不同算力平台（GPU、边缘计算设备）。

3. 数据处理与增强
• 搭建多模态数据处理流水线，包括清洗、标注、增强、模态间配对与对齐；
• 设计自动化 Prompt 生成和数据增强工具，提高多模态任务的泛化能力。

4. 场景落地与平台集成
• 将多模态模型能力集成到公司统一的 AI 平台 API 层；
• 与 AI制药建模专家合作，开发分子结构+文献的联合检索与分析功能；
• 与机器人/视觉团队协作，开发视觉-语言交互接口，支持机器人任务规划。

⸻

任职要求
• 5 年以上深度学习研发经验，至少 2 年多模态大模型相关经验；
• 精通 Transformer 架构，熟悉 ViT、Vision-Language Pretraining、Cross-Modal Attention 等技术；
• 有 CLIP、BLIP-2、ImageBind、Kosmos-2、Q-Former 等模型落地经验；
• 熟悉 PyTorch、DeepSpeed、Hugging Face Transformers 等框架；
• 有领域化大模型微调经验（医疗、制药、工业制造优先）；
• 熟悉分布式训练与推理加速技术（FSDP、Megatron-LM、Tensor Parallel）。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕