AI人工智能指南

     

AI直播换脸:安能辨雌雄?

16 26K
AI直播实时换脸 难点是脸部表情,眼睛转动,嘴巴嘴型需要实时生动:点击标题 见视频: .

AI先驱者丹尼尔·丹尼特去世

73 1 4K
塔夫茨大学哲学教授与认知科学研究中心主任丹尼尔·丹尼特(Daniel Dennett)去世(1942-2024),他因其在心灵哲学和其他广泛哲学领域的工作而闻名。丹尼尔·丹尼特涉及与心灵哲学和认知科学.

谷歌照片AI编辑功能即将上架所有安卓设备

25 3K

对于喜欢 Google 相册的 Android 用户来说是个好消息!谷歌将于五月份推出一套功能强大的人工智能照片编辑工具,所有人都可以使用,无需订阅。此更新将改变您在 Android 设备上的照片编辑.

AI研究中数学和算法哪个优先?

23 3K

问题:我现在正在学习扩散背后的方法(DDPM、基于分数的方法和其他方法)。我想知道研究人员究竟是如何提出这个想法的?发明新方法的过程是这样的吗?我们想制作更好的图像生成器。哦,数据永远都不够......

斯坦福大学2024人工智能状况报告

19

斯坦福大学新的人工智能指数报告 [PDF]的主要要点:1.人工智能在某些任务上胜过人类,但并非在所有任务上。人工智能已在多项基准测试中超越人类,包括在图像分类、视觉推理和英语理解方面。然而,它在竞赛级.

近期大模型AIGC概要:Adobe发布AI编辑视频等

14 4K

视频编辑将像简单的文本提示一样简单。Adobe 的最新预告展示了多种令人兴奋的工具和主要集成,这可能会开创视频制作的全新时代。让我们探索一下……在近期人工智能概要中: Adobe 预览 AI 视频功能.

谷歌Aloha Unleashed能进行机器人维修、系鞋带和挂衬衫

24

在过去的一年里,我们一直在开发 ALOHA Unleashed @GoogleDeepmind - 推动我们的 ALOHA 2 机群任务的规模和灵巧性。ALOHA Unleashed:用低成本机器人和.

AGI来了?特拉斯用大模型帮助自动驾驶

48

Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Tesla FSD v13可能会是Grokking语言令牌。Grok-1.5V最让人兴奋的是解决自动驾驶中边缘情况的潜力。使用.

近期大模型AIGC概要:Grok 1.5 视觉升级等

30 4K

埃隆·马斯克 (Elon Musk) 的使命是证明开源人工智能可以与最好的人工智能竞争,而 Grok 的最新升级刚刚向前迈出了一大步。凭借超越顶级模型的新多模态能力,xAI 正在悄悄地展现出自己是人工.

谷歌推出Google Vids新AI视频应用

23 2K

 Google 在其 Workspace 套件中推出了一款革命性工具:Google Vids。这款创新的人工智能视频创作应用程序让每个人都可以进行视频制作,改变企业沟通和讲述故事的方式。要点: Goo.

Poe为AI创建者提供一种收入模式

22 2K

人工智能聊天机器人的世界正在不断发展,而 Quora 的创意之作 Poe 则处于这一发展的最前沿。为了帮助创作者并加速创新,Poe为人工智能机器人创作者引入了按消息定价的收入模式。这意味着开发人员现在.

谷歌推出无限上下文的新Transformer

159 1 5K

谷歌这项研究引入了一种有效的方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到具有有限内存和计算的无限长输入。一个关键组成部分是一种称为“无限注意力 Infini-atten.

​​​​​​​通用人工智能已经到来

28 7K

当今最先进的人工智能模型存在许多缺陷,但几十年后,它们将被公认为通用人工智能的第一个真实例子。什么是通用智能?早期的人工智能系统表现出人工的狭义智能,专注于单一任务,有时执行任务的能力接近或超过人类水.

第一位超越国际数学奥林匹克金牌得主的人工智能

16

本文重新审视了奥林匹克级几何中自动化定理证明的挑战,特别关注 IMO-AG-30 基准。作者认为,Wu 的方法是一种代数方法,以前被认为不如 AlphaGeometry 等合成方法有效,但它表现出了令.

一对好基友用逻辑拯救世界

47 5K

沃尔特·皮茨(Walter Pitts,1923-1969):沃尔特·皮茨的一生从无家可归的离家出走者,到麻省理工学院的神经科学先驱,再到孤僻的酒鬼。麦卡洛克出生于东海岸一个富裕的律师、医生、神学家和.

10款深度伪造软件

49 5K

任何能够访问互联网的人都可以创建看起来真实的假视频。听起来可怕吗?这些逼真、虚假的视频让人很难区分原始视频和虚幻视频。这种创建此类视频或照片的技术被称为“深度伪造Deepfake”。市场上有各种深度造.

大模型对AI研究有害?

55

在 GPT4 之后,大模型LLM 的性能和设计改进进展相对较少:使其变得更好的主要方法仍然只是将其做大,而且所有替代transformer的架构都被证明是不合格的、低劣的,它们将人们的注意力(和投资).

Suno AI创作的灵魂歌曲

36 12K
AI音乐真的越来越好了。Suno AI v3上周发布,人们在创纪录的时间内创作了一些令人难以置信的AI音乐和音乐视频。点击图片聆听 AI创造的灵魂歌曲: .

曾投资大模型Claude的加密货币平台FTX破产

29

资本泡沫从最丰富的地方蔓延到低洼地带,在比特币等加密货币最鼎盛时期,大模型ChatGPT和Claude都未引起人们重视,资金上属于嗷嗷待哺时期。FTX是一个加密货币交易平台,提供多种加密货币的交易服务.

VoiceCraft: 文本生成任何人的语音技术

95 3K

VoiceCraft 能够复制或克隆或甚至编辑你从未听过的语音。它是一种token填充神经编解码语言模型,在有声读物、网络视频和播客等野生数据的语音编辑和零镜头文本到语音(TTS)方面都达到了最先进的.

微软和OpenAI计划斥资1000亿美元打造星际之门超级计算机

53

微软和OpenAI高管在制定一个算力数据中心项目计划:包含一台名为 "星际之门 "超级计算机,配备数百万个专用服务器芯片。为OpenAI人工智能提供动力,初始成本估算高达1000亿美元,是微软去年用于.

美国政府机构设立首席人工智能官

28

为降低人工智能(AI)的风险并利用其优势,美国白宫宣布了 第一项政府范围内的政策:每个联邦机构都必须任命一位首席人工智能官,这位 首席人工智能官必须在人工智能方面具有丰富专业知识。 一些机构已经任命了.

网友展示10个Claude 3 Opus应用场景

88 5K

Claude 3 Opus在竞技场排行榜上已经远远超越GPT-4人们正在寻找使用Claude来增强工作流程的各种方法。10个例子: 1、claude-prompt-engineer一个能创建最佳Cla.

AI已进入谷歌图片

36

Google Photos刚刚升级了AI这是类似ChatGPT的编辑!这里有5个AI功能:1.魔法橡皮擦:它使用Gen AI来填充从照片中删除对象时的细节: - 打开Google Photos应用。 .

AI已进入谷歌地图

43

谷歌刚刚宣布进行大规模升级。人工智能已进入谷歌地图以下是 6 项强大功能 1.对话式搜索 新的人工智能结果可提供详细信息,帮助用户发现新地点。2.身临其境的视图: 用户现在可以体验 3D 格式的路线,.

本周15个AI机器人最重要的发展

41 3K

人工智能和机器人技术一直在以令人难以置信的速度发展。以下是本周发生的15个最重要的发展:1. 英伟达推出Project GR00T,帮助机器人了解世界 2.英伟达还推出了NVIDIA Blackwel.

9款AI女友应用推荐

125

人工智能女友成为新常态这些应用程序的留存率非常高。有些还筹集了数百万美元甚至还有人工智能驱动的 "唯粉"。以下是 9 款为你寻找下一个女朋友的应用程序: 1. Character AI筹集1.5亿美元.

本周11个大语言模型工具如MindGraph

87 8K

本周大模型、AIGC和数据科学的有趣项目、工具:1、Grok-1马斯克的Grok 公开发布。Grok-1 目前设计有以下规格: 参数: 314B 架构: 8 名专家的组合 (MoE) 专家利用率:每个.

VSCode中6个AI顶级插件

378 2K

Visual Studio Code (VSCode) 是通往一系列 AI 驱动的编码支持的门户。探索精心挑选的 VSCode 顶级扩展,这些扩展利用人工智能的强大功能,包括 GitHub Copil.

英伟达推出下一代Blackwell GPU,成本和能耗降低25倍

38

英伟达Nvidia推出了下一代 Blackwell 图形处理单元 (GPU),其能耗提高了 25 倍,并且 AI 处理任务的成本更低。英伟达Nvidia GB200 Grace Blackwell S.