【岗位职责】
1、基于主流大语言模型,开发企业级AI应用(如智能对话系统、内容生成、知识库问答等);
2、设计并实现与大模型对接的API接口,优化模型调用效率及响应速度;
3、针对业务场景进行模型微调、提示工程、模型压缩、量化及性能优化,提升模型在垂直领域的准确性和可用性;
4、构建高可用、可扩展的大模型应用架构,集成数据预处理、模型推理、结果后处理等模块;结合LangChain、LlamaIndex等框架,开发复杂AI工作流;
5、设计数据清洗、标注及增强方案,构建高质量训练与评估数据集。实现数据与模型服务的自动化Pipeline,支持持续迭代;
6、与算法团队协作落地前沿技术,与产品团队配合定义需求并推动AI功能落地;
7、跟踪大模型领域最新进展(如Agent、多模态),探索技术落地可能性。
【任职资格】
1、计算机科学、人工智能等相关专业,硕士以上学历;
2、3年以上Python开发经验,精通Django/Flask/FastAPI等框架,熟悉异步编程(asyncio)及高性能服务开发;
3、熟悉主流数据库技术:MySQL/PostgreSQL等关系型数,MongoDB/Redis等NoSQL;
4、具备分布式系统开发经验,熟悉RPC、消息队列(Kafka/RabbitMQ)、分布式缓存等技术;
5、掌握Docker/Kubernetes容器化技术及微服务架构设计;
6、熟悉大模型应用开发框架(LangChain/LlamaIndex/Semantic Kernel等),具备智能体系统开发经验,了解Agent架构设计及主流开发范式;
7、具有两年以上AI应用工程师工作经验,有RAG(机器人、自动化、人工智能)领域工作经验者优先;熟悉机器学习、深度学习、自然语言处理等AI相关技术,具备完整项目落地经历(需提供案例)。
【加分项】:
1、熟悉CUDA加速、模型并行推理优化,或有AWS/GCP/Azure大模型服务部署经验;
2、在GitHub有开源项目贡献,或在顶会发表过相关论文。