岗位职责:
1. 根据业务需求,使用NLP技术对医学领域的非结构化文本数据、半结构化文本数据进行处理。包括但不限于文本挖掘、抽样、分析、清洗、NER、关系抽取、分类、聚类、文本生成等。
2. 围绕医学知识图谱构建和应用的开发工作。
3. 模型部署、性能调优和加速工作。
4. 探索前沿NLP技术方向。
任职要求:
1. 理工科相关专业教育背景。
2. 熟悉数据科学所需的基本理论,如分类、聚类、回归、统计方法、概率论、概率图模型等。
3. 良好数学与数据结构和算法基础。
4. 精通python、或java等至少一种语言。
5. 熟练使用numpy、pandas、scikit-learn、scipy等数据科学框架,精通至少一种深度学习框架,如pytorch、tensorflow、paddlepaddle。
6. 有独立从数据分析、探索到建模的完整经验,具有独立查阅文档、文献而完成建模的经验。
7. 有NLP项目部署、投产、落地经验者优先