1.5-2.2万
江苏省南京市雨花台区凤集大道12-9号
【岗位职责】
1、技术战略规划
1.1 主导高等职业学校及本科类AI技术方案设计,制定3年演进路线图;
1.2 本地化构建支持千亿级参数的分布式训练框架;
1.3 设计多模态大模型(文本/图像/视频)融合架构,并充分融合小模型人工智能的能力,具备相关的训练经验,熟悉100种以上的模型特色;
2、核心系统搭建
2.1 开发大模型与小模型混合训练平台以及应用开发的用户级平台,并形成开源快速迭代能力(训推及Agent平台公司已有);
2.2 建立本地化服务器,模型全生命周期管理系统(开发-部署-迭代),并具备能力在竞争中保持行业领先;
2.3 能在阿里、国家超算中心、院校本地化算力服务等云平台大模型训练平台,快速实现大模型或小模型的训练需求;
2.4 能根据高校要求,本地化部署并训练垂直相应的学科大模型,能针对各个专业/实训室训练不同规格的小模型;
3、前沿技术落地
3.1 探索AI最新进展与发展趋势,能熟练掌握发展中的各个模型以及专有app的能力及运用,将之转化为企业商业化价值落地;
3.2 推动LLM与垂直行业知识库、习题、专业数据的深度结合,特别是与教育行业的融合。
【任职要求】
1、基础条件
1.1 985学校硕士及以上学历,计算机/数学相关专业,要求本科学历为985统招;
1.2 4年以上AI系统开发经验,3年以上架构设计经验;
1.3 主导过日活超百万的平台,或日活超2万以上的智能体的AI产品架构。
2、技术能力
2.1 精通:Transformer/BERT/GPT等架构的深度优化;
2.2 了解NVIDIA、华为、平头哥、超算百张卡级GPU集群的效能调优;
2.3 熟练掌握对模型量化/蒸馏/稀疏化等压缩技术;
2.4 掌握不同显卡厂商的底层架构,比如:NVIDIA的CUDA底层优化与芯片级加速方案;
2.5 熟练掌握各种大小模型的区别与场景适用,方便快速根据高校要求训练大小模型。
3、素质要求
3.1具备技术商业化思维,能平衡研发投入与产出比;
3.2 对AI在教育行业落地有深刻认知;
3.3 持续跟踪大小模型最新论文的技术敏锐度。
4、优先条件
4.1 有构建千亿参数大模型的实际经验;
4.3 参与过开源深度学习框架开发。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕