• 我对在本地运行大型语言模型 (LLM) 的可能性感到兴奋。我决定为此买一张显卡,并想分享我使用 NVIDIA RTX 5060 Ti 16GB 的初步体验。简单来说,这是我的第一张专用显卡。我之前没有任何对比数据,所以一切对我来说都比较陌生。 我在
  • 在各种硬件(3090、4090,以及几台 Mac)上进行了各种速度测试和基准测试,速度比较:4090 VLLM、3090 LCPP、M3Max MLX、M3Max LCPP 与 Qwen-30B-a3b MoE 观察 比较快速处理速
  • Qwen3 现已在 Unsloth 中进行微调 - 速度提高 2 倍,VRAM 减少 70% 大家好!现在,您可 icon
  • DeepSeek R2 的病毒式小道消息:DeepSeek R2:单位成本下降97.3%,即将发布。 其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能 icon
  • 将推出的MI 450 X IF 128可能会打破CUDA的护城河,甚至可能比NVIDIA的VR 200 NVL 144更好!这将是AMD有史以来第一个机架级架构! AMD搞了个“超级显卡群”——MI450X IF128,能一口气连128块显卡,速度爆炸(每 icon
  • Qwen3 是一个“推理”模型,所以它每个提示都以一个包含其思维链的区块开头。Qwen3就是个爱动脑筋的'小机灵鬼'!每次你问它问题,它都会先在心里默默嘀咕一阵(就是那个标签里的内容),把解题步骤都想明白了才回答你。 < icon
  • 前几天我试用了新出的Qwen3-30B大模型,在Ollama上跑得跟蜗牛爬似的!气得我直接换了LM Studio这个软件,结果我的RTX4090显卡直接起飞了,每秒能处理100多个词,快得跟开了挂一样! 经过一顿猛如虎的测试后,我激动得差点从椅子上摔下来— icon
  • 联想今天搞了个大新闻!他们推出了一款叫ThinkStation PGX的"AI开发神器"——别看它身材小巧(也就跟普通台式机差不多大),里面可是藏着堪比科幻电影的超级算力!这玩意儿就是专门给搞AI的学霸、极客和大神们准备的,开箱就能直接开干! 硬核 icon
  • AI芯片热潮引发的BT基板材料短缺事件揭示了全球半导体产业链的深层联动效应,其影响已从先进封装环节蔓延至存储控制器和SSD市场。 最近科技圈出了件离谱事——因为AI芯片太火爆,台积电像饿虎扑食一样抢光了做芯片"包装盒"的BT塑料布(学名基板材料), icon
  • RTX 5060 Ti 16GB对于游戏来说很糟糕,但对于AI来说似乎是一颗未经雕琢的钻石 我最近以“仅”499美元的价格购买了一台RTX 5060 Ti 16 GB-虽然它不是游戏的首选(评论相当苛刻),但对于AI工作负载?这张卡片可能是一个隐藏的宝石。 icon
  • 沙特土豪联手AI巨头搞大事!18000块顶级AI芯片即将落地沙漠王国! (前方高能!用最接地气的方式带你吃瓜这个科技大新闻) 1️⃣ 沙漠里的AI超级工厂沙特国有公司HUMAIN(可以理解成"沙特国家队" icon
  • Llama 4 Maverick在单个RTX 4090上以45 tk/s的速度本地化-我终于让它工作了! 我刚刚完成了一个后续的演示,我从Meta的4000亿参数,128个专家Llama 4 Maverick中获得了每秒45个以上的令牌,我想分享完 icon
  • 微软研究人员表示,他们已经开发出一种可在 CPU 上运行的超高效 AI 模型 微软的研究人员说,他们造出了目前为止最大的“1比特”人工智能模型,这个模型也叫“bitnet”。 这个模型叫 BitNet b icon
  • David Sacks(大卫·萨克斯)解释人工智能如何在四年内发展一百万倍: David Sacks(大卫·萨克斯)是美国硅谷的知名企业家、投资人和科技评论家,以直言不讳的风格和对技术趋势的敏锐洞察著称。他的背景和观点让他成为AI、创业和宏观经济领域的重量 icon
  • 【爆炸新闻!英特尔放大招了!】 专为硬核专业人士打造的"战斗法师"显卡来啦! 英特尔刚刚官宣要推出Arc Pro Battlemage系列显卡,其中顶配的B60 24GB版本直接甩出王炸——内存是游戏显卡B580的两倍!(24GB啊朋友们,能同时开 icon
  • 【上周科技圈疯狂撒钱现场】1️⃣ 80亿美刀! OnlyFans这棵摇钱树想把自己卖了,价格够买8万套学区房!(老铁们猜猜哪位土豪接盘?) 2️⃣ 65亿撒出去! OpenAI壕气收购苹果设计大神Jony Ive的公司,联手搞神秘黑科技!Ive疯狂 icon
  • 甲骨文砸400亿美金抢购英伟达Nvidia最强芯片 做数据库的甲骨文公司(就是那个名字很古老的ORCL)要豪掷400亿美金(约合2880亿人民币!),把Nvidia(做显卡的NVDA)最新款"核弹级"GB200芯片打包带走!这手笔比双十一清空购物车 icon
  • 英特尔推出299美元的Arc Pro用于推理工作站! 英特尔甩出两张新显卡:Arc Pro B50和B60。B50是"经济适用型",16GB超大显存,只要299美元(约等于少买20杯奶茶);B60则是"超级学神",24GB icon