AI人工智能指南

     

阿里巴巴推出EMO:会说话的肖像

176 2

阿里巴巴集团智能计算研究院推出:EMO:Emote Portrait Alive - 在弱条件下使用音视频扩散模型生成富有表现力的肖像视频我们提出了 EMO,一种富有表现力的音频驱动的肖像视频生成框架.

AI为Spring Boot整个代码库添加了注释

55

以下是变更摘要,详细点击标题:此次代码变更为整个 Spring Boot 代码库添加了注释。此 PR 的内容完全使用自定义微调 AI 模型创建。我们正在对我们的工具进行大规模实验,在数百万行代码上运行.

除OpenAI之外微软再投资法国Mistral

54

Mistral Large具有顶级推理能力,现在可以在 Azure 上使用了。Mistral 获得了微软的投资,以帮助其新的人工智能语言模型商业化。微软宣布与估值20 亿欧元(约合 21 亿美元)的法.

SORA 参加一级方程式赛车

55 6K
网友讨论:1、方向盘与车辆行驶方向不相符时,您就知道是 SORA。2、这项技术是模仿,而不是模拟。尽管如此,确实令人印象深刻3、当一个人开车,计算你转弯时所需的速度时,你计算的是汽车的质量惯性和速度的.

AI少女舞蹈

99 9K
转发到bilbili,点击这里网友评论:1、看来人工智能也正在抢走那些视频网红的工作。2、这只是一个女孩跳舞的滤镜。不可能完全是根据提示生成的,连 SORA 都没有那么好。3、这显然是一个应用了 eb.

陶哲轩:好的数学

81 4K

数学纯粹是逻辑性的!但数学的教学、它的价值、它的用途和它的运作方式充满了细微差别。那么什么是“好”数学呢?作为菲尔兹奖、数学突破奖和麦克阿瑟奖学金的获得者陶哲轩是当今最受尊敬、最多产的数学家之一。他与.

本周Github上Continue、htmz等7个有趣项目

55 8K

本周Github有趣的项目、工具和库:1、Continue使用大模型 帮助编码的最简单方法 —,Continue 是 VS Code 和 JetBrains 的开源自动驾驶仪。Continue是VS .

谷歌宣布开源其Gemma模型

54

Gemma 专为负责任的人工智能开发而打造,采用与创建 Gemini 模型相同的研究和技术。谷歌在为开放社区贡献创新方面有着悠久的历史,例如Transformers、TensorFlow、BER T、.

大模型“长上下文”将取代RAG吗?

230

该推文讨论了长上下文long-context模型与RAG模型的优劣势。作者针对对长上下文模型的一些质疑进行了回应,包括成本、检索与推理的结合、支持的token数量、缓存和速度等方面。作者认为长上下文模.

昨日AIGC发生5个热点事件

53 2K

昨日人工智能领域发生的五件HOT事件:1、Sora 还可以生成涉及一系列事件的故事!Sora索拉还可以生成涉及一系列事件的故事,尽管它远非完美。在这段视频中,我要求金毛猎犬和萨摩耶犬穿过纽约,然后出租.

本周人工智能7件事

54

1、据报道,软银创始人、亿万富翁孙正义(Masayoshi Son)希望筹集1000亿美元,以启动“Project Izanagi”。 这家人工智能芯片公司的目标是与英伟达竞争,并向AGI迈进。 30.

实现符号逻辑推理的最佳方法是什么?

57 2K

这篇文章描述了在人工智能领域工作的人所经历的个人启示,特别是在LSTMS(长短期记忆)和GRUS(门控递归单元)等机器学习模型的背景下。这是一个简化的解释想象一下,你正试图教计算机理解和使用基本逻辑,.

OpenAI Sora真的有自己的物理模型吗?

248 1

关于 OpenAI 的视频生成模型 Sora 是否具有 "物理引擎"(OAI 自己声称具有 "世界模拟 "功能),有很多猜测。就像关于 LLM 中世界模型的争论一样,这个问题既非常有趣,又有些定义不清.

Oreilly报告:2023年IT行业总结

322 1 6K

要点: 软件架构领域的内容使用量整体下降,但企业架构和事件驱动架构的使用量出现增长。 微服务的使用量下降,反映出许多开发人员对微服务的失望,并主张回归单体应用。 编程语言方面,Python和JavaS.

本周人工智能发生的9件大事

65

谷歌刚刚对《Bard》、谷歌地图和 Imagen-2 进行了大规模的人工智能升级。 此外,亚马逊、Sam Altman、佐治亚理工学院、Meta、Arc 和 Anthropic 也在人工智能领域取得了.

学习机器学习与应用机器学习的区别

57

开发新的机器学习技术所需的技能与有效应用机器学习所需的技能几乎没有重叠。有点像芯片设计与软件工程几乎没有重叠。这就是建模者与机器学习工程师之间的区别商业应用通常与研究和理论有很大不同。对于机器学习来说.

谷歌最新AI芯片训练大模型速度快2.8倍

81

谷歌最新推出的TPU v5p人工智能加速器,以及它与英伟达的GPU的比较。TPU v5p是谷歌最强大的定制人工智能加速器,比之前的版本快了很多倍,甚至能与英伟达的H100 GPU相媲美。要点: TPU.

使用Python学习AI:初学者路线图

87 5K

人工智能(AI)是人类文明的突破性发展。随着时间的推移,机器的边界正在向人类智能推进。人工智能反映了人类大脑,从符号推理到复杂的神经架构。这些架构是使用 Python 构建的。Python是一个强大的.

lumiere:用于生成真实视频的时空扩散模型

50

Google Lumiere刚刚通过其庞大的视频扩散模型改变了AI视频游戏。 与现有的模型不同,Lumiere在一个单一的,一致的通过生成整个视频,这要归功于其先进的时空U-Net架构。点击标题Lum.

电子邮件服务与人工智能大模型的结合

57

谷歌 Gmail 的下一个人工智能更新可以用你的声音写电子邮件。如果撰写完美的电子邮件不是你的强项,谷歌可能会提供帮助,为 Gmail 提供新的人工智能语音功能,这将使 Android 用户起草电子邮.

《自然》:2024年值得关注的七项技术

259

《Nature》杂志在未来一年将关注以下七个技术领域:包括蛋白质设计、深度学习、以及对抗深度伪造技术等。这些领域的进展将在未来引起关注,涉及的内容包括脑-计算机接口、纳米材料的3D打印等。蛋白质设计的.

每个初学者都应该知道的 50 个人工智能术语

84 6K

看到一个技术术语而不理解它的含义是很常见的。随着人工智能极其先进并日益进步,如果您与人工智能或任何技术工作没有直接关系,一些人工智能术语并不容易理解。因此,即使你是一个想要学习一些基本术语的初学者,或.

近两周10个令人难以置信的AI工具:

184

过去两周出现的最令人难以置信的AI工具:Genie:多模式文本到3D生成器Cognysys 2.0:自动创建工作流并根据提示执行任务 https://cognosys.ai MultiOn:AI个人代.

MagicVideo-V2:抖音的多阶段高美感视频生成

332 1

抖音字节跳动(T!kTok)刚刚发布了一个巨大的文本到视频AI,它的性能超过了所有领先的模型。抖音推出一种名为MagicVideo-V2的多阶段高美观视频生成方法。它集成了文本到图像模型、视频运动生成.

CES 2024上的AI亮点

176

以下是CES 2024前两天AI方面亮点: 一个AI助手,取代你的智能手机应用程序的rabbit.tech 人工智能驱动的捆绑式鞋子被称为“Moonwalkers”,可以让你走得更快  FitXR S.

大众将在汽车中安装ChatGPT解闷

94

请准备好接受由ChatGPT幻觉导致的一些虚假的导航,其实真实导航也经常在复杂高架和野外出现幻觉。大众汽车宣布计划从 2024 年第二季度开始在其车辆中安装 OpenAI 的 ChatGPT,从而加入.

机器人迎来了chatGPT时刻

130 1

Figure_robot(人工智能机器人)和 Archer Aviation(纽约证券交易所代码:ACHR)e/acc创始人Brett Adcock在1月7日宣布:实验室刚刚在人工智能方面取得突破 机.

基础认知框架:强化学习+代理

70 4K

本文介绍了TAME(Technological Approach to Mind Everywhere)框架和强化学习(RL)的概念,旨在将生物学和人工智能领域进行交叉研究。这种将生物学和强化学习相结.

2024年10个令人印象深刻的AI工具

232

2024年你应该尝试的10个令人印象深刻的AI工具: 1.语音识别 http://Lovo.ai 2.幻灯片 http://Decktopus.com 3.视频 http://Elai.io 4.图片.

健谈机器人通过AI陪伴帮助老年人对抗孤独

84

Intuition Robotics公司近期成功推出了第一批ElliQ机器人,这是一款专门设计用于缓解许多美国老年人所经历的孤独感和孤立感的人工智能设备。这一创新设备在美国老年人社区中引起了广泛关注。.