职位详情
多模态大模型算法专家
5-10万
北京雪扬科技有限公司
北京
5-10年
硕士
08-28
工作地址

华熙国际中心-C座21层

职位描述
职位名称:算法专家(多模态大模型/计算机视觉/语音模态)一、职位概述

我们正在寻找在人工智能前沿领域充满激情的算法工程师。无论您专精于多模态大模型、计算机视觉还是语音模态,如果您渴望将尖端算法技术应用于解决极具挑战性的真实世界问题,并推动其从研究到落地,那么这个职位将为您提供绝佳的舞台。

二、核心职责:

1.算法研究与开发:负责各自方向(多模态/CV/语音)的算法研究、模型设计、实验训练和调优工作,持续提升模型效果与性能。

2.工程落地与部署:将算法模型进行服务化部署,实现高性能、高可用的线上推理服务,并处理海量数据的训练问题。

3.业务需求对接:与产品、业务团队紧密协作,深入理解应用场景与需求,设计并输出合理、高效的技术解决方案。

4.技术前瞻探索:跟踪学术界与工业界的最新进展,并将有潜力的技术应用于实际项目,保持技术的领先性。

5.跨团队协作:与数据、后端、前端、移动端等团队高效协同,共同推进项目从概念到上线的全流程。

三、具体方向要求:

(一)多模态大模型方向:

1.精通Transformer、BERT、GPT、CLIP等大模型架构及其预训练、微调技术。

2.具有多模态(如图文、视频-文本、音频-文本等)融合建模及COT构建的实际项目经验。

3.熟悉对比学习、提示学习(Prompt Learning)、指令微调(Instruction Tuning)、强化学习(ppo、dpo、grpo、dapo,gspo)等前沿技术。

4.有大规模分布式训练(如DeepSpeed, FSDP)、PTQ/QAT量化、模型压缩经验者优先。

(二)计算机视觉方向:

1.精通CNN、Transformer、VIT等视觉模型,在图像分类、目标检测、图像分割、视频理解等一个或多个领域有深入研究。

2.熟悉目标跟踪、行为识别、生成式模型(如Diffusion Model、GAN)等相关技术者优先。

3.具备模型轻量化、移动端部署(如TensorRT, TFLite, CoreML)经验者优先。

(三)语音模态方向:

1.精通语音识别(ASR)、语音合成(TTS)、声纹识别、语音情感分析等关键技术。

2.熟悉传统声学模型(如HMM)及端到端深度学习模型(如Conformer, Wav2Vec2, Whisper)。

3.有音频信号处理、噪声抑制、回声消除等前端处理经验者优先。

四、必备核心能力:

1.扎实的算法基础:精通机器学习/深度学习/强化学习理论,具备优秀的代码实现能力(编程语言不限,Python必须熟练,算法能力达到LeetCode中级以上水平)。

2.工程落地能力:具有亿级参数大模型的训练、调优或部署经验,熟悉PyTorch/TensorFlow等框架,了解Docker、Kubernetes等云原生部署技术。

3.业务洞察力:具备强烈的产品意识,能快速理解业务痛点,独立设计并推动技术方案落地,以解决实际问题为导向。

4.团队协作力:拥有出色的沟通能力和团队协作精神,能有效协调多方资源,主导或积极参与跨团队项目。

五、优先录取条件:

1.学术成果:在ACL、NeurIPS、ICML、ICLR、CVPR、ICCV、ECCV、INTERSPEECH等顶级会议或期刊以主要作者身份发表过相关论文。

2.竞赛/开源贡献:在Kaggle、天池等权威算法竞赛中获得过顶级名次,或有知名开源项目的核心代码贡献经历(请在简历中附上GitHub链接)。

3.交叉领域经验:具备多模态、强化学习、知识图谱等两项或以上的交叉项目经验。

4.领域知识:熟悉中医、医疗、生物医药等垂直领域业务知识或数据特点者将极具优势。

六、我们提供:

1.极具竞争力的薪酬待遇和激励机制。

2.与行业顶尖专家共事的机会,获得快速的技术成长与职业发展。

3.挑战前沿技术难题的平台和丰富的计算资源支持。

4.鼓励创新、开放包容的技术氛围。

5.有机会深入一个充满前景的领域,让你的工作产生深远的影响。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请