关于ZAKER Skills 合作
钛媒体 1小时前

算力正在下沉家庭

文 | 半导体产业纵横

过去十年,我们经历了 " 存储下沉 " 的完整周期。从企业机房的 SAN 阵列,到办公室的文件服务器,再到客厅里的 NAS 服务器,数据所有权一步步回归个人。驱动这个过程的根本原因是成本与形态的博弈,当硬盘足够便宜、设备足够安静、功耗足够低时,没有人愿意把家庭照片存在某个可能随时关停的公有云里。

既然存储可以回家,算力为什么不能?今天,AI 算力正在经历与十年前存储下沉完全相同的拐点。2024 年,群晖发布了首款搭载专用 NPU 的 NAS。这不是一个孤立事件:威联通、极空间、绿联等几乎所有主流 NAS 厂商,都在 2025 年把 " 本地 AI" 写进了产品路线图。NAS 这个曾经只负责 " 存东西 " 的盒子,正在变成 " 想东西 " 的脑子。这就是 " 家庭算力枢纽 " 的雏形。

为什么需要 " 家庭大脑 "?

六十年前,IBM 360 大型机占据整个房间,计算是少数精英的特权;三十年前,PC 走进千家万户,通用算力实现了全民普惠。而今天,当 AI Agent 需要 7 × 24 小时在线、当大模型推理动辄需要数十 GB 显存、当家庭隐私数据再也不愿流经云端—— AI 算力,也正在经历一场从机房到客厅的下沉运动。家庭,正在成为 AI 落地的终极边缘节点。

首先是隐私问题,家庭场景汇聚了用户高度私密的数据与个性化习惯,从家人的照片视频、健康记录,到日常的消费偏好、作息规律,这些数据往往具有不可外传性。而多数现存设备或依赖云端难以独立处理复杂本地任务,或偏重通用计算而缺乏持续在线的主动智能。

除了隐私问题,经济账是关键。当前主流云端 AI 服务普遍采用订阅制。以家庭多成员、多设备、多 Agent 的场景计算,每月动辄数百元的 "AI 税 " 累积起来,两年就能买一台本地算力设备。而家庭 AI 中枢,可以 7 × 24 小时运行本地大模型,一次性投入即可拥有终身算力产权。

而真正让家庭算力枢纽从 " 锦上添花 " 变成 " 刚需 " 的,是即将到来的 AI Agent 时代。AI Agent 不是搜索引擎,不是 " 你问我答 " 的对话框。真正的 Agent 是持续在线、主动感知、自主执行的数字生命体。很多家庭场景对延迟和可靠性的要求极为苛刻。云端方案哪怕只有百毫秒延迟,在 Agent 语境下也是 " 迟钝 ";网络中断更是致命。只有本地算力,才能提供真正的实时响应与断网自治。

现在的家庭网络架构,本质上是 " 每个设备自带脑子 ":手机有 NPU,电脑有 GPU,智能音箱有专用语音芯片。这就像早期每个房间单独装一台空调,各自为政、效率低下。而家庭算力枢纽要做的,就是打造 AI 时代的 " 中央空调 ":一个强大的统一计算核心,通过家庭局域网为所有终端设备按需供 " 智 "。这个模式在技术上已经没有不可逾越的障碍,真正的挑战只剩下三个:成本、形态和生态。

家庭算力枢纽的 N 种可能

家庭算力枢纽应该长什么样?目前市场上已经演化出多条不同的路线,它们代表了对 " 家庭 AI" 的不同理解。

首先是越做越像服务器的 NAS。NAS 厂商是最先嗅到风向的一批人。2025 年以来,绿联、极空间、威联通几乎将所有新品都贴上了 "AI" 标签。

AI NAS 的优势在于,用户已经有数据存储需求,算力是 " 顺带 " 提供的,迁移成本极低。但其瓶颈也明显,传统 NAS 的 CPU(如 Intel N305、N355)AI 算力有限,通常只能流畅运行 7B 以下小模型,面对 30B 以上的实用级模型往往力不从心。

另一种形态是迷你主机 /AI BOX。与 NAS 的 " 存储思维 " 不同,迷你主机 /AI BOX 更看重算力。2026 年初,苹果 M4 Mac mini 的全球缺货事件,堪称算力下沉家庭的标志性时刻。开发者社区发现,这台 3000 元级别的迷你主机,凭借 38 TOPS NPU 算力、16-32GB 统一内存架构、超低的待机功耗,成为运行本地 AI Agent 的理想载体。此外,锐龙 AI Max+ 395(代号 "Strix Halo")是 AMD 向家庭算力枢纽投下的重磅炸弹。16 核 Zen5 CPU、40 单元 RDNA3.5 GPU、50 TOPS NPU,配合最高 128GB 统一内存——其中最高 96GB 可专属分配给 GPU 作为显存。这意味着,一台巴掌大的机器可以本地运行 Llama 3.1 70B-Q8、GPT-OSS-120B 等千亿参数模型。迷你主机的优势在于纯粹的算力密度与架构先进性,但劣势是存储扩展性通常弱于 NAS,且需要用户自行搭建软件生态。

还有一种可能性是 AI 原生中枢。2026 年 5 月 18 日,摩尔线程发布了 MTT AICUBE。它不把自己定义为 NAS,也不定义为 PC,而是 " 家庭 AI 中枢 "。AICUBE 搭载自研 " 长江 " 智能 SoC,集成全大核 CPU、全功能 GPU 与双核 NPU,提供 50TOPS 异构 AI 算力与 32GB 高速统一内存(带宽 120GB/s)。AICUBE 的野心在于生态闭环:从芯片(长江 SoC)到系统(MTT AIOS)到智能体(小麦)到存储(全闪 AI NAS),全部自研。这种垂直整合让它可以做出传统 PC 厂商做不到的体验——比如 " 二维拓扑记忆系统 ",让 AI 真正拥有长短期记忆融合能力,越用越懂家庭成员的偏好。

三条路线的本质分歧在于:AI NAS 相信 " 数据是核心,算力是附属 ";迷你主机相信 " 算力是核心,存储可外接 ";而 AICUBE 相信 "Agent 才是核心,算力与存储只是 Agent 的四肢与肠胃 "。

统一内存架构或许是版本答案

家庭算力枢纽能不能普及,瓶颈从来不是 CPU 频率,而是内存墙。传统 PC 架构中,CPU 有自己的 DDR 内存,GPU 有自己的 GDDR 显存,两者之间通过 PCIe 总线通信。当大模型推理时,数据需要在内存和显存之间频繁搬运,这不仅消耗带宽,更消耗功耗与时间。更关键的是,对于参数量动辄数十亿的大模型,显存容量直接决定了能跑多大的模型。消费级独立显卡通常只有 8-16GB 显存,运行 Stable Diffusion 3.5 Large 都可能捉襟见肘。

统一内存架构(UMA)正是打破这堵墙的关键。UMA(Unified Memory Architecture)让 CPU、GPU、NPU 共享同一个物理内存池,通过片上高速互连动态分配资源。这带来了多项优势:首先是零拷贝通信,CPU 预处理的数据,GPU 可以直接读取,无需通过 PCIe" 搬运 ";其次是显存弹性扩容,系统内存可动态划拨给 GPU 使用,可以加载更大的模型;最后是带宽效率跃升。

目前,三大芯片厂商都在全力推进统一内存架构在消费级市场的落地。AMD Strix Halo 把这套逻辑做到了消费级。128GB LPDDR5X-8000 统一内存,通过 GTT(图形转换表)让 GPU 直接访问系统内存,其中约 96GB 可以分配给 AI 推理。这让它成为第一款能在单机上运行 70B 全精度模型的消费级处理器。NVIDIA DGX Spark 搭载的 GB10 芯片同样采用 128GB 统一内存,带宽高达 273GB/s,可分配约 100GB 作为显存使用,不过这款产品目前更多面向专业 AI 开发者。苹果M4 Max 的统一内存带宽超过 500GB/s,是三者中最高的。但苹果的封闭生态意味着你无法自由安装模型、无法扩展硬件、无法选择操作系统。对于家庭算力枢纽这种需要长期迭代、灵活部署的场景,封闭性是个致命伤。

从 " 存储共享 " 到 " 记忆共享 "

家庭算力枢纽的终极价值,不在于它能跑多大的模型,而在于它能解决一个当前 AI 生态的顽疾:失忆症。

今天的 AI 设备都是一座座 " 智能孤岛 "。手机上的助手不知道 PC 里的文档,音箱不知道电视的观看历史,每个设备都要重新学习你的偏好。家庭算力枢纽的颠覆性意义,就在于它可以成为整个家庭的统一记忆层,所有设备通过本地网络连接到同一个算力中枢,实现真正的语义级记忆共享,而不是云端账号那种简单的 " 同步文件夹 "。摩尔线程的 " 小麦 " 智能体已经展示了这种可能性:其二维拓扑记忆系统将短长时记忆深度融合,能够精准关联人与事、过去与现在。

要实现这种真正的 " 家庭记忆 ",需要构建一套三层架构体系:

第一层是统一向量数据库。家庭的所有非结构化数据——照片、文档、聊天记录、健康数据——被转化为向量嵌入,集中存储在枢纽上。任何设备的 AI 请求,都先查询这个 " 家庭知识库 "。

第二层是跨设备 Agent 协作。手机负责采集(拍照、录音),PC 负责生产(写作、编程),电视负责展示(相册、视频),音箱负责交互(语音入口)。它们不是各自运行 AI,而是把感知任务本地处理,把推理任务交给枢纽,把结果返回端侧呈现。

第三层是上下文继承。通过家庭局域网的身份识别(谁在哪个房间、用什么设备),枢纽维护一个持续的对话状态。你在客厅开始的问题,在卧室可以继续——因为 " 记忆 " 不在设备里,而在枢纽里。

这个模式还有一个副产品:本地 Agent 的算力供给。现在的 AI Agent 要么跑在云端,要么跑在本地 PC。家庭算力枢纽提供了一个中间态:足够强大的本地算力(70B 模型 + 向量数据库),足够低的延迟(局域网毫秒级),足够高的隐私(数据不出家门)。算力枢纽让 "Agent 私有化 " 从极客实验变成了家庭标配。

未来的家庭数字基础设施,将由三个底座构成:

网络底座:路由器(已经普及);

存储底座:NAS 或本地服务器(正在普及);

算力底座:家庭 AI 枢纽(即将普及)。

三者合一,就是 " 家庭边缘节点 " 的终极形态。它知道你全家人的喜好,管理着你所有的数据,驱动着你所有的智能设备,且永远不需要把隐私交给云端。

从大型机到 PC,从交换机到路由器,从企业存储到 NAS ——历史反复证明,算力的终极归宿不是远方的数据中心,而是用户触手可及的地方。算力正式下沉家庭。这不仅是技术的迁移,更是数字主权的回归。

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容