Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
数据科学教程
DuckDB简介
DuckDB是一个内存分析型关系数据库,主要用于数据分析。由于其列式存储性质(单独存储每列的数据),它被视为分析数据库。相比之下,传统的关系数据库采用基于行的存储,逐行存储数据。 DuckDB 的优点包括: 快速查询——DuckDB利用列式
AI架构师:职责、技能以及如何称为一名AI架构师?
人工智能 (AI)是快速发展的技术领域的主导方式,具有改变人类能力并彻底改变整个行业的能力。人工智能架构师的技能负责在每个突破性人工智能解决方案的幕后协调智能系统的创建和使用。 本文探讨了架构师的角色
使用 SVM 和决策树进行集成学习
集成学习是一种机器学习技术,它结合了多个单独的模型来提高预测性能。集成学习中使用的两种流行算法是支持向量机 (SVM) 和决策树。 什么是集成学习?
本周Github上数据科学Python有趣项目
Github上数据科学有趣的项目、工具和库 openllmetry
Word2vec中的连续词袋 (CBOW)
连续词袋(CBOW)模型是一种用于自然语言处理的神经网络模型。它可用于多种任务,例如语言翻译和文本分类。它用于根据周围的单词来预测单词。我们可以使用不同的优化算法(例如随机梯度下降)在大型数据集上训练该模型。CBOW 模型在训练后给出数值向量,称为词嵌入。词嵌入用于将词表示为数值向量。
贝叶斯回归简介
传统回归分析和贝叶斯概率论结合在称为贝叶斯回归的统计建模技术中。考虑有关模型定义特征的先验知识或假设。当处理稀疏或嘈杂的数据或当您希望对模型参数进行概率声明时,贝叶斯回归特别有用。 与贝叶斯回归相关的主要要素和思想如下: 先验分布:使用贝叶
大模型对AI研究有害?
在 GPT4 之后,大模型LLM 的性能和设计改进进展相对较少:使其变得更好的主要方法仍然只是将其做大,而且所有替代transformer的架构都被证明是不合格的、低劣的,它们将人们的注意力(和投资)从其他可能更具影响力的技术上转移开来。 再加上大量对基本
使用PyTorch演示实现神经网络过程
借助著名的开源PyTorch 框架,可以使用Python创建和训练神经网络。本教程将教您如何使用 PyTorch 创建基本神经网络并对 MNIST 数据集中的手写数字进行分类。 现代人工智能依赖于神经网络,神经网络赋予机器类似于人类的学习和判断能力。回归、
Python与Excel VBA比较
众所周知,Python和Excel VBA各自是两种不同的工具,具有不同的范围,最终都具有编程和数据操作领域的功能。 Python 被认为是一种多功能、高级、通用的编程语言,以其在当今时代广泛的应用而闻名。尽管如此,它仍然是一种强大的语言,可以完成数据操作
AI研究中数学和算法哪个优先?
问题:我现在正在学习扩散背后的方法(DDPM、基于分数的方法和其他方法)。我想知道研究人员究竟是如何提出这个想法的? 发明新方法的过程是这样的吗?我们想制作更好的图像生成器。哦,数据永远都不够......
机器学习中的元学习
元学习的分支,也称为学习学习,被定义为从不同算法中学习的学习算法。其主要目的是在其他算法的帮助下增强算法的性能。这种方法提供了解决深度学习的几个传统问题的机会,例如数据和处理瓶颈以及泛化。 元学习还可以指由机器学习项目的专家进行的模型选择和算法调整的手动过
贝叶斯深度学习简介
在本教程中,我们将学习贝叶斯深度学习的简介。神经网络的概率可以通过使用贝叶斯接口来检查。我们可以通过对标准神经网络工具的简单修改来近似这个概念问题。 贝叶斯定理是数据科学的一部分。它还包括以下学科:计算机科学、统计学和概率。该定理用于根据可用的重要数据计算
PySpark DataFrame教程与演示
PySpark DataFrame 是 PySpark 库中的基本抽象,专为分配的记录处理和操作而设计。它是 Apache Spark 生态系统的重要组成部分,提供了一种强大且绿色的方式来大规模处理结构化信息。 PySpark DataFrame 建立在
使用NumPy演示实现神经网络过程
在不断发展的人工智能(模拟智能)领域,有一个想法经久不衰,并被证明是当今机器学习的基础:人工神经网络(ANN)。这些计算模型在人类思维不可预测的神经元网络的推动下,在从图像识别到自然语言处理的任务中表现出了惊人的能力。在本文中,我们将继续揭开人工神经网络内部功能的神秘面纱,并重点讨论为什么从头开始构
Scikit-learn可扩展学习简介
随着机器学习模型变得越来越复杂和数据集变得越来越大,可扩展性成为从业者和研究人员的一个重要关注点。虽然 Python 的 scikit-learn 库提供了广泛的机器学习算法,但其有效处理大型数据集的可扩展性一直是人们感兴趣的话题。在这篇博文中,我们将探索使用 scikit-learn 实现可扩展学
VASA-1:将图像转换为视频的AI模型
想象一下,让一幅珍贵的肖像栩栩如生,让人物说话并表达情感。 得益于微软突破性的VASA-1 AI 模型,这一未来概念现在更接近现实。这是一种新的人工智能模型,可以将一张照片和一段音频变成完全逼真的深度伪造人类。
机器学习中贝叶斯建模和概率编程简介
贝叶斯(Bayesian)模型直接对不确定性进行建模,并提供了将专家知识纳入模型的框架。 背景传统的机器学习 (ML) 模型和人工智能技术通常存在一个严重缺陷:缺乏不确定性的量化。 这些模型通常提供
Scikit-learn SVM 实现
支持向量机 (SVM) 是用于分类、回归和异常值检测任务的最通用和最广泛使用的机器学习算法之一。在 SVM 实现领域,Scikit-learn 因其易用性和鲁棒性而成为首选库。然而,掌握 Scikit-learn 的 SVM 实现的内部工作原理有时对于初学者和经验丰富的从业者来说都具有挑战性。在这篇
上页
下页