1.8-2.1万
统一企业广场
参与公司 /团队的知识图谱构建:包括实体抽取 (entity extraction)、关系抽取 (relation extraction)、本体 (ontology) 设计等。
使用 NLP 技术 (如 BERT, spaCy, transformers) 对文本进行预处理、标注、训练模型。
构建和维护知识图谱数据库 (RDF, 图数据库如 Neo4j, Knowledge Graph Store);设计 graph schema。
参与知识图谱在具体业务中的应用:例如问答系统 (QA)、推荐系统、RAG(检索增强生成)系统等。
撰写技术文档、数据字典、本体规范等。
(可选) 协助部署知识图谱相关服务 / API 的调试和测试。
基础条件:
计算机科学、人工智能、统计、数据科学、信息管理或相关专业本科 /硕士在校学生。
熟练掌握 Python 编程,有良好的算法与数据结构基础。
对知识图谱 (Knowledge Graph)、语义网络 (Semantic Network) 有兴趣或基础了解。
熟悉 NLP 基础技术 (分词、词性标注、NER、依存分析等) 或使用过 NLTK、spaCy、transformers 等库。
对图数据库 (如 Neo4j)、三元组 (subject-predicate-object)、本体 (Ontology) 有一定了解更佳。
具备良好的学习能力、沟通能力和逻辑思维能力。
加分项:
有使用或训练大语言模型 (LLM) 的经验 (如 GPT、Llama、Claude 等)。
熟悉向量数据库 (vector DB) 或 RAG 框架 (如 LangChain, LlamaIndex 等)。
有参与过数据标注、标注工具 (Label Studio, Prodigy 等) 使用经验。
有开放源代码 (GitHub) 项目经验。
熟悉知识表示 (Knowledge Representation) 本体语言 (如 OWL、RDF) 或 schema 设计。
熟悉dita技术写作
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕