岗位职责
1、 完成短视频、直播、网络图片预处理,训练数据生成等;
2、 完成resnet、yolo等模型训练,可进行图片分类,文字提取等;
3、 基于多模态大模型,完成以文搜图、以图搜图等功能;
4、 完成多媒体相关产品的设计与开发。
任职资格
1、 熟悉C/C++开发,linux操作系统;
2、 熟悉TCP/IP,SCTP、RTMP、RTSP等协议栈;
3、 熟悉操作系统、数据结构常用算法;
4、 英语4级及以上;
5、 熟练使用语言大模型、多模态大模型,了解大模型基本原理,可编写Agent应用,熟练使用resnet、yolo等常见视觉模型。