职位详情
大模型算法专家
2-2.8万
同方鼎欣科技股份有限公司
广州
10年以上
本科
07-30
工作地址

宝地广场

职位描述
大模型算法
岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
职位要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。
4. 熟悉LLM相关的算法技术以及推理加速方法。
5. 熟练掌握 python,熟悉 prompt 工程,具备 langchain、langgraph 等开发框架开发Agent 和工作流的经验。
6. 熟悉常用的 RAG 技术,具备行业知识库的搭建经验。
7. 具备数据分析能力,熟悉数据集的创建、标注、增强、清洗的常用技术,熟悉大模型微调、评估、发布、推理的技术及运用。
8. 熟悉底层算力调度框架和原理,具备一定的优化调试能力。
9. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。

1. 丰富的AI项目管理经验:拥有成功领导跨职能团队完成从概念设计到最终部署的AI项目经历。
2. 精通主流AI平台与工具的应用:对包括但不限于阿里云、百度云、腾讯云等在内的国内外主流AI平台有着深入的理解和实际操作经验。能够熟练运用这些平台提供的各种工具和服务来加速模型训练、优化性能以及简化部署流程。
3. 深厚的技术背景与研究能力:对人工智能的基础理论有着深刻的认识,特别是在深度学习、自然语言处理等领域。同时,对于TensorFlow、PyTorch等开源框架有丰富的实践经验,能够快速掌握新技术并应用于实际工作中。
4. 系统架构设计能力:具备构建高效、可扩展的AI系统架构的能力,能够根据业务需求设计出既满足当前需求又兼顾未来发展的解决方案。熟悉云计算环境下的资源调度与管理,擅长利用微服务架构提高系统的灵活性和可用性。

第一学历211优先

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请