职位描述
岗位职责:
1.技术调研与框架搭建:负责复杂规则(正则表达式、语义规则)扩充的前沿技术调研,完成技术选型,并搭建可扩展的检测基础框架。包括:
深入研究正则表达式进阶技巧与优化模式。
探索与尝试混合错误生成算法(如基于随机序列的编辑操作组合)。
调研并整合语义感知的检测方法与模型。
2.工具开发与方案落地:
开发基于语义感知的易错点智能挖掘工具,提升规则发现效率。
实现能够处理复杂变体与错误模式的正则表达式规则生成与优化。
3.规则应用与评估体系构建:
针对高频正词(正确表述),应用并优化已开发的规则体系。
建立科学、量化的规则质量评估标准与方法,持续监控规则效能。
4.系统迭代与优化:负责对已有规则库进行持续迭代、维护和效果复盘,确保规则的准确性与时效性。
任职要求:
1.必备条件:
本科及以上学历,计算机科学、软件工程、计算语言学或相关专业。
精通Python编程,具备良好的代码设计和开发习惯,有实际项目开发经验。
熟练掌握MySQL,能高效进行复杂数据查询、分析和处理。
深刻理解并能够灵活运用正则表达式,有处理复杂文本匹配与解析的经验。
具备优秀的技术调研、学习能力和逻辑思维能力,能够独立完成技术方案的选型与设计。
2.优先考虑:
有自然语言处理(NLP)、信息检索或文本挖掘相关项目经验。
了解语义相似度计算、文本分类或命名实体识别等基础NLP技术。
熟悉常用的Python数据处理与科学计算库(如Pandas, NumPy)及NLP工具库。
有工具开发、算法优化或规则引擎相关工作经验。
对数据敏感,具备优秀的问题定位和报告撰写能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕