1.人工智能、计算机、通信、网络等专业领域。
2.对Transformer、MOE、多模态、扩散模型等大模型架构有深入理解,熟悉LLM、AIGC、多模态等相关算法的研究与算法优化;
3.精通大模型预训练与微调策略,包括多模态无监督预训练、有监督微调与提示学习;
4.精通信号(语音)处理方法,深入研究自动语音识别、语音合成和语音多模态大模型等前沿技术,部分与电磁信号共性技术可直接迁移至电磁大模型上;
5.精通多模态对齐和知识蒸馏技术,熟练使用DeepSpeed、Megatron等多种分布式训练框架;
6.熟练掌握大模型微调技术,包括LoRA、DPO策略优化,熟悉MoE、AI Agent和RAG技术。
1、根据业务需求,负责领域/场景大模型技术路线论证工作,提供技术解决方案,包括但不限于多模态数据理解、RAG、AI Agent等;
2、与平台工程师、数据科学家、评测工程师等团队合作,开展大模型数据工程、训练与微调、对齐、评估、云边端部署等工作与工具链建设;
3、大模型迭代、训练与优化工作,持续提高大模型在业务场景中的性能水平;
4、负责优化电磁大模型架构,推进多任务应用落地
5、构建电磁大模型的测评基准,测评在电磁多任务效果,推动大模型性能提升
6、负责电磁大模型内存和推理速度优化,降低训练部署成本和推理延时
7、编写项目论证方案、实施方案与项目总结报告等相关技术报告、研发文档、汇报PPT等文档撰写;
8、关注大模型相关技术发展趋势,参与集团公司大模型相关论证工作。