1.2-2万
华熙国际中心-C座21层
我们正在寻找在人工智能前沿领域充满激情的算法工程师。无论您专精于多模态大模型、计算机视觉还是语音模态,如果您渴望将尖端算法技术应用于解决极具挑战性的真实世界问题,并推动其从研究到落地,那么这个职位将为您提供绝佳的舞台。
二、核心职责:1.算法研究与开发:负责各自方向(多模态/CV/语音)的算法研究、模型设计、实验训练和调优工作,持续提升模型效果与性能。
2.工程落地与部署:将算法模型进行服务化部署,实现高性能、高可用的线上推理服务,并处理海量数据的训练问题。
3.业务需求对接:与产品、业务团队紧密协作,深入理解应用场景与需求,设计并输出合理、高效的技术解决方案。
4.技术前瞻探索:跟踪学术界与工业界的最新进展,并将有潜力的技术应用于实际项目,保持技术的领先性。
5.跨团队协作:与数据、后端、前端、移动端等团队高效协同,共同推进项目从概念到上线的全流程。
三、具体方向要求:(一)多模态大模型方向:
1.精通Transformer、BERT、GPT、CLIP等大模型架构及其预训练、微调技术。
2.具有多模态(如图文、视频-文本、音频-文本等)融合建模及COT构建的实际项目经验。
3.熟悉对比学习、提示学习(Prompt Learning)、指令微调(Instruction Tuning)、强化学习(ppo、dpo、grpo、dapo,gspo)等前沿技术。
4.有大规模分布式训练(如DeepSpeed, FSDP)、PTQ/QAT量化、模型压缩经验者优先。
(二)计算机视觉方向:
1.精通CNN、Transformer、VIT等视觉模型,在图像分类、目标检测、图像分割、视频理解等一个或多个领域有深入研究。
2.熟悉目标跟踪、行为识别、生成式模型(如Diffusion Model、GAN)等相关技术者优先。
3.具备模型轻量化、移动端部署(如TensorRT, TFLite, CoreML)经验者优先。
(三)语音模态方向:
1.精通语音识别(ASR)、语音合成(TTS)、声纹识别、语音情感分析等关键技术。
2.熟悉传统声学模型(如HMM)及端到端深度学习模型(如Conformer, Wav2Vec2, Whisper)。
3.有音频信号处理、噪声抑制、回声消除等前端处理经验者优先。
四、必备核心能力:1.扎实的算法基础:精通机器学习/深度学习/强化学习理论,具备优秀的代码实现能力(编程语言不限,Python必须熟练,算法能力达到LeetCode中级以上水平)。
2.工程落地能力:具有亿级参数大模型的训练、调优或部署经验,熟悉PyTorch/TensorFlow等框架,了解Docker、Kubernetes等云原生部署技术。
3.业务洞察力:具备强烈的产品意识,能快速理解业务痛点,独立设计并推动技术方案落地,以解决实际问题为导向。
4.团队协作力:拥有出色的沟通能力和团队协作精神,能有效协调多方资源,主导或积极参与跨团队项目。
五、优先录取条件:
1.学术成果:在ACL、NeurIPS、ICML、ICLR、CVPR、ICCV、ECCV、INTERSPEECH等顶级会议或期刊以主要作者身份发表过相关论文。
2.竞赛/开源贡献:在Kaggle、天池等权威算法竞赛中获得过顶级名次,或有知名开源项目的核心代码贡献经历(请在简历中附上GitHub链接)。
3.交叉领域经验:具备多模态、强化学习、知识图谱等两项或以上的交叉项目经验。
4.领域知识:熟悉中医、医疗、生物医药等垂直领域业务知识或数据特点者将极具优势。
六、我们提供:1.极具竞争力的薪酬待遇和激励机制。
2.与行业顶尖专家共事的机会,获得快速的技术成长与职业发展。
3.挑战前沿技术难题的平台和丰富的计算资源支持。
4.鼓励创新、开放包容的技术氛围。
5.有机会深入一个充满前景的领域,让你的工作产生深远的影响。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕