1.1-2万
绿地原盛国际-3A号楼
岗位职责:
1. OCR识别:开发或优化文档、表格、手写体、场景文字等OCR模型,提升复杂场景下的识别率。
2. 语音转写:开发或优化语音识别(ASR)模型,支持多种方言、嘈杂环境下的准确转写,可能包含说话人分离、标点预测等功能。
3. 智能检索:构建多模态检索系统,结合文本、图像、语音内容,实现语义级别的智能检索(包括向量检索、关键词检索混合)。
4. 负责相关模型的训练、调优、评估及工程化部署。
5. 跟踪前沿技术,并将合适的算法应用于实际产品。
6. 适配支持国产操作系统及国产龙芯/申威CPU架构指令集环境下私有化部署。
任职要求(硬性):
1. 算法基础:扎实的机器学习/深度学习基础,熟悉CNN、RNN、Transformer等模型。
2. 专业领域经验:
o OCR:熟悉DBNet、PaddleOCR、EasyOCR等框架,有版面分析、表格还原经验。
o 语音:熟悉端到端ASR模型(如Conformer, Wav2Vec2),熟悉Kaldi、WeNet、FunASR等工具。
o 检索:精通文本/向量检索技术,熟悉Sentence-BERT、SimCSE等语义模型,有使用Faiss、Milvus等向量数据库的经验。
3. 工程能力:熟练使用Python,掌握PyTorch/TensorFlow框架,有模型部署(ONNX, TensorRT)经验。
4. 加分项:
o 有大规模数据处理和预训练经验。
o 熟悉信创环境国产服务器软硬件适配兼容经验(麒麟系统,龙芯/申威CPU)。
了解多模态模型(如CLIP, Whisper)。以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕