Hermes把几个大模型摞在一起用,跑分能比最强单个模型高出一大截。 Hermes 现在允许您将多个前沿模型堆叠到一个虚拟模型中。在 Nous Research 的基准测试中,它的性能优于 Opus 4.8 和 GPT-5.5。
18 小时 前 33 1 5K
Anthropic指控阿里巴巴通过近2.5万个虚假账户,在六周内发动了超2880万次交互的“模型蒸馏攻击”,以窃取其Claude模型的核心能力。这出AI界的“猫鼠游戏”背后,既有技术博弈,也有知识产权
颠覆认知!大脑切换语言不靠翻译,竟靠几何地图? 说两种语言的人,脑子里并没有装两套独立词典。最新研究发现,大脑对不同语言的单词反应神经不同,但概念间
DeepSeek的思维链偷偷用土耳其语骂人,这事让全网炸锅了。当用户点开模型内部推理过程,赫然看见一句包含土语脏话的抱怨。这不仅是搞笑段子,更撕开了AI安全与对齐问题的真实一角。
Qwythos-9B-Claude-Mythos-5-1M这个这9B模型居然有1M上下文?!Qwythos-9B是个基于Qwen3.5的微调模型,有1M上下文,号称超长推理能力。评论区吵翻了,有人说它
表面上,中国开发者用上美国顶级AI模型,还得靠“中转站”把官方价格打下来。但这门生意的利润大头,其实是把用户和模型的对话记录打包卖掉。便宜模型的背后,是用你的隐私和生物信息买单。这套绕过封锁的
Obsidian和Notion让位了?这个AI原生编辑器把Claude直接焊在文档里 Inkeep团队发布了OpenKnowledge,一款开源的A
Claude Code之父认为:未来的团队将不再按职位划分,而是按五种人格角色组合。错配人格和产品阶段是团队低效的根源,AI 让这些角色变得更纯粹,也更需要人的决策手感。
2 天 前 72 1 6K #DeepSeek时刻
DeepSpec发布:让大模型生成提速6倍,输出质量却一点没变差 DeepSpec不是新模型,而是给现有大模型配了一个“秘书”。秘书提前把下一段内容
 AI模型跑得快,全怪它学会了“抢跑” 你以为AI生成文字是一个字一个字“想”出来的?错了。DeepSeek最新研究表明,让大模型学会“猜”后面会写啥,再批
Hermes 手机App正在路上! Hermes Agent正在开发官方移动客户端,打破命令行和第三方消息平台的限制,让用户能在iOS和Androi
OpenCode里DeepSeek Flash当主力干杂活,GLM 5.2当子代理只负责动脑思考,一个配置改动让便宜模型包揽七成调用,贵模型只处理关键决策,账单直降70%响应还更快。
这周(截至6/28)GitHub涨疯了的十个项目,看完我直接把收藏夹删了 看完这周GitHub飙升榜,我脑子里只有一个想法:过去几年我学的那些编程套路,可能
这只鸟不讲鸟语,它让AI自己教自己写代码。 你以为是又一款开源模型?错了,这是AI第一次在训练时自己动手改“考卷”的出题思路。当别的模型还在死记硬背
美国政府在帮Gemini 3.5 Pro“保送”?这剧情比想象中离谱 大家都觉得AI模型肯定是越强越好,最好能拳打OpenAI脚踢Anthropic。但最近
美国人想要卡死AI出口,觉得这样就能锁死亚洲科技树。结果呢?两周之内,东京和北京几乎同时拍出了各自的新模型,直接对标被禁的美国顶尖产品。 你以为这是
 750 tokens一秒,这速度是来拯救我ADHD的吧 OpenAI这次放了个大招,搞了个叫GPT-5.6 Sol的旗舰模型,放在Cerebras上跑出了
一语道破科技玄机:更多