职位描述
工作职责:
1、设计并训练具备超大参数量与高效推理能力的客户洞察大模型,支持多行业、跨场景的智能推荐与用户理解;
2、深度融合文本、图像、音视频、位置、交易行为等数据,构建高维度、动态更新的用户兴趣向量与语义 ID 系统;
3、将大规模预训练与生成式建模相结合,探索零样本、少样本推荐技术,实现用户需求的主动预测与实时响应;
4、在 PB 级数据集上进行分布式训练与参数高效更新,探索模型压缩、推理加速等工程优化技术;
5、将模型能力应用于精准营销、个性化内容分发、用户增长等核心业务场景,并通过大规模 A/B 实验验证效果。
任职要求:
1、博士学历,计算机科学、人工智能、数据科学等相关专业;
2、深入理解大规模预训练模型(LLM/多模态)的架构与优化(LoRA、MoE等),熟悉推理加速与效能评估;
3、精通推荐系统与表示学习,熟悉语义ID建模、多模态融合与生成式推荐,具备A/B实验与因果评估经验者优先;
4、具备分布式训练与工程化能力,能够处理 TB/PB 级多源多模态数据,并在高并发、低时延环境稳定部署;
5、在 NeurIPS、ICML、ICLR、KDD、WWW、SIGIR、WSDM、CIKM、RecSys、TOIS、TKDE 等有高水平成果或同等产出者优先;
6、具备科研到业务的闭环能力,能将模型与算法沉淀为平台化能力;
7、具备优秀的沟通协作与推动力,对超大规模模型研发保持热情与长期投入。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕