职位描述
base深圳或顺德
岗位职责:
1. 基于大模型技术(如Qwen、DeepSeek、GPT、LLAMA等),主导Agent、RAG(Retrieval- Augmented Generation)及知识库系统的架构设计与开发,推动AI产品在业务场景中的高效落地
2. 负责大模型Agent的全流程工作,包括但不限数据处理、模型训练、优化和部署
3. 集成和部署AI模型服务API,确保高性能和可扩展性
4. 持续关注LLM研究的最新进展,提出优化与改进方案并将其应用到业务场景
任职要求:
1. 计算机科学、人工智能、统计学、数据科学等相关专业,硕士及以上学历。
2. 深入理解Agent架构,熟练使用LangGraph、LlamaIndex、Dify等工具链,具备二次开发能力。
3. 熟悉Transformer、BERT、GPT等模型原理,掌握PyTorch/TensorFlow框架及分布式训练技术, 熟悉megatron、deepspeed、vllm等训练或推理加速框架。
4. 精通Python;熟练使用Milvus/Weaviate/PGVector等向量数据库,具备知识库构建经验;掌握 FastAPI/Flask等Web开发框架,熟悉docker,能在生产环境中高效部署模型服务。
5. 具备Prompt工程实践经验,能根据业务场景设计高效指标模版。
6. 有知识库系统或者Agent项目落地经验者优先
加分项: 1. 有工业或工程类仿真软件二次开发经验,如 UG/NX 等,熟悉相关 API、插件机制或自动化流程,有将 AI 能力与工程仿真、设计工具结合的实践经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕