职位描述
-
技术开发与应用 - 负责大语言模型的本地化部署、优化与调试,包括但不限于模型量化、推理加速、资源调优等工作。
- 设计并开发智能体(Agent)系统,实现多轮对话、任务规划、工具调用等核心能力。
- 根据业务需求对开源大模型进行微调(Fine-tuning)、提示工程(Prompt Engineering)优化。
- 搭建和维护模型推理服务,保证高并发场景下的稳定性和响应速度。
全栈产品开发 - 前端开发:参与Web端SaaS平台、微信小程序的功能开发,实现与AI能力的深度集成。
- 后端开发:设计并实现RESTful/GraphQL API,构建高性能、可扩展的后端服务架构。
- 移动端开发:参与Android应用开发,实现AI功能在移动端的流畅体验。
- 负责AI功能模块的全链路开发,从数据处理、模型调用到前端交互的完整实现
系统架构与优化。 - 设计AI应用的整体技术架构,包括模型服务、业务逻辑、数据存储等各层级。
- 优化系统性能,降低模型推理延迟,提升用户体验。
- 搭建监控告警体系,及时发现和解决系统问题。
技术创新与协作 - 跟踪AI领域最新技术动态,评估新技术在产品中的应用可行性。
- 与产品、设计团队紧密协作,将AI能力转化为实际的产品功能。
- 参与技术方案评审,推动技术规范和最佳实践落地。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕