可识别图像中100种人类语言文本的纯Javascript OCR库包:​​​​​​​Tesseract.js

19-12-21 banq


Tesseract.js是流行的Tesseract OCR引擎的纯Javascript引擎。
该库支持100多种语言,自动文本定向和脚本检测,用于读取段落,单词和字符边界框的简单界面。Tesseract.js可以在任何浏览器中运行,并在服务器上的NodeJS

在GitHub上查看示例代码和API文档
支持图像中中文识别。点击标题见原文中文demo.