由于领域特殊性和缺乏标准化,学术知识图谱很难构建和维护。
本文讨论了从学术出版物中提取知识用于商业用途的问题。它认为,大多数科学进步都依赖于未在网上发表的隐性知识。专家们多年来一直在绘制内部地图;论文将职业生涯置于信息共享之上。对机构、姓名和作者存在偏见。天真的系统不会考虑方法错误或衍生作品。虽然工具可以帮助学生,但专业人士依赖的是社交网络,而不仅仅是文献。
知识库具有特异性;像文献综述这样的任务很难定义和评估。
我在生物医学文献搜索、发现和推荐网络应用程序上工作了好几个月,得出的结论是,从学术出版物(论文)中提取、构建或综合“见解”或从领域文献语料库构建知识库的价值可以忽略不计。
科学真正发挥作用的内容几乎没有以文本形式发布在网络上