大语言模型LLM - 第23页

保罗·格雷厄姆（Paul Graham）在他的新文章中表示，人工智能将产生负面影响，把人们分成两个世界：能写的人能思考不能写的人不能思考写作虽是一项困难的技能，但它是清晰思考的关键

“服务即软件”(Service as Software：SaaS)是一种利用人工智能和自主软件代理来处理传统上由人类完成的端到端任务的概念。这种模式不同于传统的软件即服务 (SaaS)，它专注于自动化整个工作流程、做出决策和自主完成任务，而不仅仅是提供需

Jlama 是一个基于 Java 的推理引擎，适用于 huggingface 上的许多文本到文本模型：Llama 3+、Gemma2、Qwen2、Mistral、Mixtral 等。它旨在用于将 gen ai 集成到 java 应用程序中，就是可

来自《科学美国人》的文章《你不需要语言来思考》探讨了语言和思维之间的关系，特别是语言

语言学研究中最酷的结果之一：所有的语言在说话时都以相似的速度传递信息（39比特/秒）。说得快的语言每个音节的信息密度更小！不同语言之间存在巨大的差异，包括音素、音节数量和音高复杂性。尽管如此，所有自然语言都

Claude 现在可以使用电脑了。最新版本的 Claude 3.5 Sonnet在经过适当的软件设置后，可以按照用户的命令

使用大模型 LLM时，提供元认知指导（例如：举例说明、逐步推理等），它就会更容易被使用。更驯服，更少出现幻觉。这就是元提示：

Transformer 架构已在各种神经网络模型的背景下得到广泛讨论，包括它们与卷积神经网络 (CNN)、Hopfield 网络和状态空间模型的关系。以下是最近关于这些主题的研究的主要见解的总结。 1、

微软 365 Copilot 在澳大利亚公共部门进行的为期六个月的评估显示，尽管这款人工智能助手的实施面临着重大障碍，但它每天可以为员工节省多达一小时的时间。要点：澳大利亚政府在 56 个机构中对 Microsoft 365 Copil

大型语言模型（LLMs）的核心能力在于处理和预测一系列离散的标记（tokens），而不仅限于自然语言中的单词或短语。这种能力使得LLMs可以被应用于多种领域，包括图像处理、音乐生成、药物发现等，只要这些领域的问题能够被转化为标记流的建模问题。

人工智能搜索工具 Perplexity 正在为其 Pro 和 Enterprise Pro 订阅用户推出一项新的“内部知识搜索”功能。此功能允许用户同时搜索公共网络内容和内部知识库，从而有可能加快信息检索速度。首席执行官 Aravind Srinivas

每周 AI 更新（10 月 16 日至 10 月 22 日）：来自 Perplexity、Anthropic、Nvidia、Mistral、Meta、Google 等公司的重要新闻：过去一周的主要更新。《纽约时报》起诉 Perplexi

微软研究院和中国科学院大学的研究人员推出了 BitNet b1.58，这是一种 1 位语言模型，有望在大幅降低成本和功耗的同时实现高性能。 1Bit 大语言模型称为1位大型语言模型（1-bit Large Lang

Meta 正在开发自己的网络搜索引擎，以使其更加独立于 Google 和微软的 Bing。该技术将主要用于向公司自己的 AI 聊天机器人提供最新信息。据 The Information 援引一位熟悉该项目的人士的话报道，Meta 正在开发一种搜索引擎，该

Anthropic 宣布对其 Claude AI 模型进行升级，包括增强型 Claude 3.5 Sonnet 和新版 Claude 3.5 Haiku。该公司还推出了一项新功能，使模型能够直接与计算机界面交互。升级后的 Claude 3.5 Sonne

使用这个项目，我们在 minecraft 服务器中添加了 Claude 3.5 Sonnet 和 Opus。

Meta 正在探索超越 OpenAI 最新模型的数学重点的不同形式的人工智能推理。尽管“广大公众”可能认为人工智能中的推理是一个单一的概念，但它实际上包含了几种因应用而异的类型：数学推理：解决数学问题规划推理：制定策略和计划

Nvidia 推出了一种新的大型语言模型，该模型在对齐基准测试中的表现优于其他模型。该公司通过结合评估和偏好模型的特殊训练程序实现了这一目标。新模型名为 Llama-3.1-Nemotron-70B-Instruct，基于 Meta 的开源 Llama