Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
什么是规则即代码 (RaC) - brcommunity
经合组织公共部门创新观察站最近发布了一份关于政府中规则的创建和表达的重要讨论文件: "Cracking the Code.",其核心思想是“规则即代码”(RaC),可以理解为两种方式。首先,它是一种改进规则创建过程的方法。其次,它确实建议政府应该以软件和机器
励志故事:比Elasticsearch更快的即时开源搜索引擎typesense
这是作者Kishore Nallan每天上班前或下班后的副项目,每天写一些代码,没有最后期限,没有季度目标,没有里程碑。专注于一件事:每天出现并编写一些代码。有些功能需要一个小时才能实现,有些功能需要几个小时才能实现,有些甚至需要持续数周,但这并不重要,因为没有任何形式的截止日期。<
2021年值得期待的7大NLP趋势 - analyticsindiamag
在本文中,我们尝试预测2021年以后NLP的趋势。 社交媒体情感分析社交媒体上的每时每刻都会生成大量数据。这也带来了一个特殊的问题,即无法完全手动生成所产生的所有这些信息。 事实证明,自然语言处理是这方面的重要工具。作为情感分
机器学习的文本摘要方法概述 - kdnuggets
本文将介绍当前采用的文本摘要的主要方法,并讨论它们的一些特性。文本摘要是自然语言处理的一个令人兴奋的子学科。尽管每天都在使用各种提取摘要的方法,并且每天都在研究这些方法,但是了解以上概念的基础应该可以使您至少在30,000英尺的高水平上对其中任何一种的操作方式有所了解。您还应该可以选
使用 AutoNLP 和 Prodigy 进行主动学习 - huggingface
机器学习中的主动学习是一个过程,在该过程中您可以迭代地添加标记数据、重新训练模型并将其提供给最终用户。这是一个永无止境的过程,需要人工交互来标记/创建数据。在本文中,我们将讨论如何使用
Jina:在云上构建神经网络搜索的更简单方法
Jina可为任何类型的数据构建搜索系统,包括文本、图像、音频、视频等等。通过模块化设计和多层抽象,您可以利用高效的模式来按部分构建系统,或者将它们链接到流中以获得端到端的体验。这是
NLP 中不同词嵌入技术的比较 - KDnuggets
如果计算机可以开始理解莎士比亚,这不是令人难以置信吗?还是像 JK 罗琳那样写小说?这在几年前是不可想象的。url=https://www.ibm.com/cloud/learn/natural-language-processing]自然语言处理[/url
Lingua:能准确检测与辨识自然语言类型的Rust库
它的任务很简单:它会分辨除哪些文本数据是用哪种语言编写的。这在自然语言处理应用程序(例如文本分类和拼写检查)中作为语言数据的预处理步骤非常有用。例如,其他用例可能包括根据电子邮件的语言将电子邮件路由到地理位置正确的客户服务部门。支持中文。Lingua能够报告每种支持的语言可用
自然语言处理NLP七种术语的教程入门资源
在解决任何NLP问题之前,需要深入了解7个术语: 1.标记化Tokenization这是将整个文本分成小标记的过程,切分是基于两个基础,即句子和单词。最佳教程:
HuggingFace在NLP和计算机视觉中的应用 - Reddit
你想做语义分割吗?查看https://huggingface.co/blog/fine-tune-segformer。图像分类?
在Grammarly的生产环境中运行Lisp
Grammarly 是一个应用程序,数百万人使用它来检查他们的电子邮件、论文、笔记等的语法。该产品建立在核心语法引擎之上,每秒可处理一千多个句子,可水平扩展,并且已在生产中可靠地服务了近三年。该引擎是用
自然语言处理入门 - olay
自然语言可以采用文本或语音的形式,机器学习可用于以文本和语音的形式解决涉及人类自然语言的问题。这被称为自然语言处理,它已经有许多迷人的现实世界应用程序。非结构化文本,例如文章、新闻、评论或评论,是自然语言数据的常见来源。必须从非结构化数据中检索有用的信息。为了检索这些有用的数据,我们
如何使用Python、Transformers和scikit-learn对文本进行分类?
电子邮件、社交媒体帖子、聊天、网站和文章的形式生成越来越多的文本。所有这些文本文档都是丰富的信息来源。但由于文本的非结构化性质,理解和分析文本既困难又耗时。因此,大多数公司无法利用这一宝贵的信息来源。这就是文本分类等自然语言处理 (NLP) 方法的用武之地。 文本分类,也称为文本分类
用于训练自然语言处理 (NLP) 和文本模型的 7 个顶级开源数据集 - KDnuggets
以下列表是我们推荐的一些开始学习 NLP 的最佳开源数据集,或者您可以尝试各种模型并遵循这些步骤。 1.
基于自然语言业务规则引擎的客户数据平台:Oracle Intelligent Advisor
Oracle 智能顾问 (OIA),以前称为 Oracle 策略自动化 (OPA),是全球许多企业使用的强大工具,已被领先的银行成功采用,作为银行合规性和风险评估流程的一部分。OIA是一种专门 的决策技术,它解释复杂的策略逻辑以支持其决策和计算。与其他规则引擎相比,Oracl
神经网络为何如此独特有效? -Reddit
神经网络不是唯一的通用逼近器,将神经网络的成功归因于它们作为通用逼近器的地位,但也有许多算法是通用逼近器。例如,决策树也可以是通用逼近器,但它们似乎没有那么成功。为什么是这样?神经网络除了作为使它们与众不同的通用逼近器之外还有什么? 首先,诸如决策树之类的算法没有那么成功,这
机器学习无法解决自然语言理解问题 - thegradient
这是经验和数据驱动的革命,在 1990 年代初期,一场统计革命席卷了人工智能 (AI)——这场革命在 2000 年代达到高潮,神经网络以其现代深度学习 (DL) 的转世而凯旋归来。这一经验主义转向席卷了人工智能的所有子领域,尽管这项技术最具争议的应用是自然语言处理 (NLP)——一个人工智能
真实生产级别的推荐系统 - Nikhil
大规模构建在生产中部署的推荐系统 ,并在用户等待页面加载时在几百毫秒内提供实时请求。要构建这样的系统,工程师必须做出跨越多个移动层的决策,例如: 高级范式(如协同过滤、基于内容的推荐、向量搜索、基于模型的推荐) ML 算法(例如 GBDT、SVD、多塔神经网络等) <
上页
下页
关闭