Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
机器学习教程
认知谬论:维特根斯坦的尺子
除非你对尺子的可靠性有信心,否则如果你用尺子量桌子,你也可能在用桌子量尺。你越不相信尺子的可靠性,你得到的关于尺子的信息就越多,而关于桌子的信息就越少。“测量行为”是一个经常出现在量子力学中的概念,但实际上测量无处不在。维特根斯坦的尺子类似一把剃须刀,它规定了可以从测量或判断中获得哪些信息,
系统设计:如何设计一个类似于Tinder的基于位置的社交搜索应用
如何设计一个类似于 Tinder 的基于位置的社交搜索应用程序,如果经常用作约会服务。它允许用户使用滑动动作来喜欢(向右滑动)或不喜欢(向左滑动)其他用户,并允许用户在双方互相喜欢时聊天(“匹配”)。这是
数据科学家会被机器学习工程师取代吗? - KDnuggets
在大多数数据驱动的组织中,只需要基本的数据科学技能即可解决问题。这个角色可以很容易地被机器学习工程师取代——一个具有数据科学算法基本知识的人,他还拥有部署 ML 模型的知识。数据科学家的角色将被 AutoML 等工具取代,而另一些人则将数据科学称为“垂死的领域”,很快就会被数据工程和
Reddit网友谈数据分析师和数据科学家的职业区别
对于那些实际上具备这两个角色所需技能的人,是什么让您决定成为数据分析师而不是数据科学家? 我放弃了成为数据科学家的职业梦想。现在,我使用 SQL 后端构建 .NET 报告应用程序。 我们所说的数据科学在实践中根本不是科学:他
认知谬论:什么是维度诅咒
你的数据越详细,它就越缺乏洞察力。仅向图形添加 1 个额外参数会导致图形的体积呈指数增长,分散包含的数据点并删除它们之间的有意义的关联。维度诅咒现象出现在数值分析、采样、组合学、机器学习、数据挖掘和数据库等领域。这些问题的共同主题是,当维度增加时,体积空间的增长如此之快,以至于可用数
DeepForSpeed: 在《极品飞车》游戏中实现自动驾驶的开源AI
DeepForSpeed是可以在游戏《极品飞车》中实现自动驾驶汽车的机器学习工具。灵感来自英伟达如何用一个卷积神经网络而不是许多花哨的算法组合来制造一辆自动驾驶汽车。使用技术: Python 3.9 Pytorch 1.10 Numpy
dl4j-gans: Deeplearning4j生成对抗网络GNA的示例源码
这个存储库展示了如何在 Deeplearning4j 中训练 som 样本生成对抗网络 (GAN)。要运行 App 示例,请使用以下命令:mvn compile exec:java -Dexec.mainClass="io.skymind.example.App"这个
ploomber:建立ML数据管道的最有效率方式
Jupyter等开发工具在数据科学家中很流行,因为它们提供了一个环境以可视化和交互方式探索数据。但是,在部署项目时,我们必须确保分析能够在 Airflow 或 Argo 等生产环境中可靠运行;这导致数据科学家在他们的notebooks和这些生产工具之间来回移动代码。此外,数据科学家必
Google AI:人类皮层的可浏览千万亿级重建
连接组是生物体大脑中所有神经连接的地图,它有助于理解大脑内神经相互作用的组织。 发布大脑中所有神经元和突触的完整映射非常复杂,2020 年 1 月,谷歌研究院发布了果蝇的“半脑”
用深度学习解决竞争性编码问题 | DeepMind
DeepMind 推出了 AlphaCode,它使用基于转换器的语言模型来生成代码。他们使用 Codeforces 上的比赛验证了性能,其中 Alphacode 处于中位竞争对手的水平。 这是人工智能代码生成系统首次在编程竞赛中达到具有竞争力的性能水平。
TikTok机器学习与数据科学家的面试题 - Reddit
收集了 Tik Tok面试题清单,似乎他们做的是leetcode/hackerrank中等难度的问题: - TwoSum (hackerrank) - 描述偏差和变异之间的区别 - 解释偏差/变异的权衡 - 描述正则化 - 你如何处理不平衡的数
InterPSS :基于TensorFlow的电力系统分析机器学习
该项目旨在探索深度学习 (DL) 在电力系统分析中的应用。Google 的TensorFlow用作 ML 引擎, InterPSS 用于提供电力系统分析/仿真模型服务
DeepETA:优步如何使用深度学习预测到达时间?
Uber神奇的客户体验是:准确的到达时间预测 (ETA)。优步使用 ETA 来计算票价、估计接送时间、将乘客与司机匹配、计划交付等等。传统的路由引擎通过将道路网络划分为由图中加权边表示的小路段来计算 ETA。他们使用最短路径算法来找到通过图的最佳路径,并将权重相加以得出 ETA。
abracadabra: Shazam是如何工作?
Shazam是一款能够识别你周围正在播放的歌曲的应用程序。你在播放音乐时打开该应用,Shazam会记录几秒钟的音频,用来搜索其数据库。一旦它识别出正在播放的歌曲,它将在屏幕上显示结果。Shazam 的创始人在 2003 年发表
以最经济方式运行GPT-3开源模拟:GPT-J
生成式预训练转化器(Generative Pre-trained Transformer简称GPT)是一种NLP语言生成模型,能根据一些初始文本(对话的一部分或某些任务)生成类人文本。最“炒作”的型号之一是 GPT-3。当您看到 GPT-3 生成的内容时,您会感觉“未来就在这里”。<
Ray:用于扩展和分发Python和ML应用的框架
Ray 为构建分布式应用程序提供了一个简单、通用的 API。通过以下方式完成了这一使命:为构建和运行分布式应用程序提供简单的原语。使最终用户能够并行化单个机器代码,而代码更改几乎为零。在核心 Ray 之上包括一个由应用程序、库和工具
系统设计:使用Scala、Spark和Hadoop构建推荐系统
推荐系统是一种广泛使用的机器学习技术,在电子商务(亚马逊、阿里巴巴)、视频流(Netflix、Disney+)、社交网络(Facebook、Linkedin)和许多其他领域都有很多应用。由于这些服务中的数据量很大,现在大多数行业级推荐系统都是建立在 Spark 和 Hadoop 等大数据框架
Data2vec:第一个适用于语音、视觉和文本等多领域的高性能自监督算法
自我监督学习推动了人工智能的许多重大进展,所谓自我监督学习:机器通过直接观察环境进行学习,而不是通过标记的图像、文本、音频和其他数据源进行明确的教导;虽然人们也似乎以相似的方式学习,但是学习的方式存在很大差异方式。这种差异一直是更广泛地应用自我监督学习进步的重大障碍。因为为理解图像而
上页
下页