Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
芯片半导体
DeepSeek R2+华为芯片=便宜97.3%
DeepSeek R2 的病毒式小道消息:DeepSeek R2:单位成本下降97.3%,即将发布。 其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能
Qwen3在不同硬件芯片上的测试
在各种硬件(3090、4090,以及几台 Mac)上进行了各种速度测试和基准测试,速度比较:4090 VLLM、3090 LCPP、M3Max MLX、M3Max LCPP 与 Qwen-30B-a3b MoE 观察 比较快速处理速
本地AI:Qwen3+Unsloth=2倍速+少70%显存
Qwen3 现已在 Unsloth 中进行微调 - 速度提高 2 倍,VRAM 减少 70% 大家好!现在,您可
RTX 5060 Ti 16GB:本地AI性价比之王
我对在本地运行大型语言模型 (LLM) 的可能性感到兴奋。我决定为此买一张显卡,并想分享我使用 NVIDIA RTX 5060 Ti 16GB 的初步体验。简单来说,这是我的第一张专用显卡。我之前没有任何对比数据,所以一切对我来说都比较陌生。 我在
Qwen3-8B:本地推理小钢炮
Qwen3 是一个“推理”模型,所以它每个提示都以一个包含其思维链的区块开头。Qwen3就是个爱动脑筋的'小机灵鬼'!每次你问它问题,它都会先在心里默默嘀咕一阵(就是那个标签里的内容),把解题步骤都想明白了才回答你。 <
Qwen3终结AI本地模型选择困难症!
前几天我试用了新出的Qwen3-30B大模型,在Ollama上跑得跟蜗牛爬似的!气得我直接换了LM Studio这个软件,结果我的RTX4090显卡直接起飞了,每秒能处理100多个词,快得跟开了挂一样! 经过一顿猛如虎的测试后,我激动得差点从椅子上摔下来—
1块GPU同跑50个大模型:2秒切换快照
我们搞了个AI模型"闪电启动器",让大模型像Windows休眠功能一样秒开秒关! 以前跑AI大模型特别麻烦——每次用都要重新加载,像开电脑等系统启动一样慢,而且显卡内存根本塞不下几个模型。现在我们搞出了新方法,2-5秒就能唤醒一个AI(130亿到650亿参
RTX 5060 Ti游戏翻车?AI潜力竟是隐藏神卡!
RTX 5060 Ti 16GB对于游戏来说很糟糕,但对于AI来说似乎是一颗未经雕琢的钻石 我最近以“仅”499美元的价格购买了一台RTX 5060 Ti 16 GB-虽然它不是游戏的首选(评论相当苛刻),但对于AI工作负载?这张卡片可能是一个隐藏的宝石。
印度黑科技Kompact AI:CPU搞定大模型
当我提到“大型语言模型”时,你首先想到的是什么?可能是像 ChatGPT、Gemini、Claude 或 Meta 的 LLaMA 这样的模型——对吧?如果我问你这些模型的驱动力是什么?答案几乎总是相同的——GPU 。昂贵、耗电的 GPU,通常都来自一家公司:NVIDIA。
谷歌TPUv7硬刚英伟达GB200!
在 Google Cloud Next 25 大会上,谷歌隆重推出第七代张量处理单元 (TPU) Ironwood。它是可扩展性最强的定制 AI 加速器,也是首款专为推理而设计的加速器。 谷歌TPUv7: 每秒能算4.6千万亿次浮点
苹果M3+Llama 4=本地AI天作之合!
Llama 4 + Apple Silicon 简直是天生一对。 原因在这儿:就像 DeepSeek V3/R1 一样,新的 Llama 4 各种版本都是超大的稀疏 MoE 模型。它们有海量的参数,但每次生成一个token词的时候,只有很少一部分参
沙特狂买1.8万AI芯!DeepSeek建算力中心
沙特土豪联手AI巨头搞大事!18000块顶级AI芯片即将落地沙漠王国! (前方高能!用最接地气的方式带你吃瓜这个科技大新闻) 1️⃣ 沙漠里的AI超级工厂沙特国有公司HUMAIN(可以理解成"沙特国家队"
单卡RTX 4090爆走Llama 4 Maverick
Llama 4 Maverick在单个RTX 4090上以45 tk/s的速度本地化-我终于让它工作了! 我刚刚完成了一个后续的演示,我从Meta的4000亿参数,128个专家Llama 4 Maverick中获得了每秒45个以上的令牌,我想分享完
微软bitnet:可在CPU上运行的超高效AI
微软研究人员表示,他们已经开发出一种可在 CPU 上运行的超高效 AI 模型 微软的研究人员说,他们造出了目前为止最大的“1比特”人工智能模型,这个模型也叫“bitnet”。 这个模型叫 BitNet b
AI算力暴增:Python原生支持CUDA加速
英伟达终于给自家的CUDA工具包装上了原生的Python支持。要是你对编程、人工智能感兴趣,或者单纯爱看黑科技突破,这回可算来着了!Python这几年火得不行,GitHub 2024年调查显示它已经干掉了JavaScript,成了全球最受欢迎的编程语言。
英特尔24G显存AI卡即将发布
【爆炸新闻!英特尔放大招了!】 专为硬核专业人士打造的"战斗法师"显卡来啦! 英特尔刚刚官宣要推出Arc Pro Battlemage系列显卡,其中顶配的B60 24GB版本直接甩出王炸——内存是游戏显卡B580的两倍!(24GB啊朋友们,能同时开
硅谷大佬狂言:AI四年超神100万倍
David Sacks(大卫·萨克斯)解释人工智能如何在四年内发展一百万倍: David Sacks(大卫·萨克斯)是美国硅谷的知名企业家、投资人和科技评论家,以直言不讳的风格和对技术趋势的敏锐洞察著称。他的背景和观点让他成为AI、创业和宏观经济领域的重量
贸易战惊现豁免,手机电脑免税
就在白宫一边到处打贸易战一边忙着安抚全球市场的时候,特朗普政府突然宣布:手机、电脑这些电子产品不用交巨额"对等关税"了!这下可把苹果这些科技巨头乐坏了。 海关周五半夜发的通知说,智能手机、路由器、芯片机、无线耳机还有部分电脑,都不用交特朗普对中国货加征的1
上页
下页