winkNLP是一个用于自然语言处理(NLP)的JavaScript库。专为使NLP解决方案的开发更容易和更快而设计,winkNLP为性能和准确性的正确平衡进行了优化。
NLP被用于各种任务,包括文本分类、情感分析、主题建模和命名实体识别。
综合winkNLP速度 、处理能力、文档和 TS 支持等几个指标,它可能是 npm 上最好的 NLP 包。
WinkNLP有一个全面的自然语言处理(NLP)管道,涵盖标记化、句子边界检测(sbd)、否定句处理、情感分析、语音部分(pos)标签、命名实体识别(ner)、自定义实体识别(cer)。
它将丰富的功能集装入一个不到1500行的小代码库。
- 快速、无损和多语言标记器
- 开发者友好和直观的API
- 内置API以帮助文本可视化
- 广泛的文本处理功能,如词包、频率表、停止词去除、可读性统计计算等。
- 预先训练的语言模型,大小从<3MB开始
- 基于BM25的向量器
- 多种相似性方法
- 词向量整合
- 无外部依赖性
- 可在Web浏览器上运行
- 支持Typescript
点击标题