2025-11-14 17:07:16 中华网
随着人工智能技术的飞速发展,AI 大模型在理解人类语言方面取得了显著进展,能够越来越贴合人们日常的交互需求。与AI大模型的优秀表现相比,当下智能家居行业体验却显得不那么“智能”。
目前,多数智能家居系统依赖预设规则引擎,用户必须手动配置诸如 “温度>30℃开空调”等等诸多触发条件,使得整个智能家居交互过程显得既机械又繁琐。如果能把大模型的能力接入进来,则会简单且智能很多。比如你直接说 “当我读书时,帮我打开台灯,播放舒缓的音乐”,系统在识别到读书动作时就会自动完成操作。
小米认为,AI 与物理世界的深度结合是智能科技的下一站,而我们在 AIoT 领域的所有积累,都是为了迎接这一时刻的到来,「大模型+智能家居」是行业大势所趋。
11月14日,小米发布智能家居未来探索方案 Xiaomi Miloco(全称 Xiaomi Local Copilot),行业率先探索由大模型驱动全屋智能生活。基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则,实现更广泛、更具创意的智能联动。

探索方案不仅重构了家庭智能交互范式,还高度重视隐私安全问题,端侧部署大模型保障用户隐私不被侵犯。目前,Miloco 已面向全社会开放,并在 GitHub 上线,开发者可部署、体验,参与技术共建。
GitHub地址:https://github.com/XiaoMi/xiaomi-miloco
Miloco 让家拥有 “理解生活” 的能力
传统智能家居的体验瓶颈,本质源于 “规则预设固化” 与 “生态协同不足” 的双重制约。用户需手动配置繁琐的自动化规则,且不同品牌设备间缺乏统一联动标准,最终不得不花费大量精力 “适配系统”。
而探索方案的核心目标,是为家庭赋予一个能理解生活细节的 “AI 大脑”—— 它可保存 “雨天关窗”“睡前调温” 等场景偏好,能读懂 “想睡个好觉” 背后对温度、光线、噪音的综合需求,更能实现跨生态设备协作,在持续交互中优化体验,真正做到越用越贴心。
这种 “懂生活” 的能力,得益于 Miloco 对大模型技术的场景化落地。作为智能家居未来探索方案,Miloco 将自研大模型能力部署到家庭边缘设备,结合米家摄像机的实时视觉信息,通过标准化的 MCP 协议封装,实现米家生态与 Home Assistant(全球最大开源智能家居社区)生态的无缝打通,同时开放支持第三方 IoT 平台接入,让 “用自然语言定义全屋智能” 从概念走向实用。
硬核技术架构,筑牢体验基石
Miloco 的全屋智能差异化体验,依托于Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型与四层完整架构的坚实支撑,从交互、感知、生态、安全四个维度优化全屋智能的交互逻辑与扩展能力,构建更贴合用户需求的智能家居解决方案。
核心支撑:Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型
作为 Miloco 智能体验的技术核心,Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型为全屋智能赋予了“感知+理解”的核心能力,是实现场景化智能联动的关键所在。
Xiaomi MiMo-VL-Miloco 端侧视觉语言模型,基于小米自研 MiMo-VL-7B 大模型优化构建,凭借强大的视觉 - 语言融合能力,赋予家庭摄像头“理解画面”的感知力。轻松实现全屋视觉问答(比如查询 “看看画面里有什么”“看看我的猫在哪”)、规则智能触发(当有人在读书时,打开台灯;当有人在玩手机时,发送米家通知提醒)、复杂联动控制(看看小孩有没有在玩手机?在玩手机的话音箱播放“该写作业了”;根据画面中人的心情状态去设置灯光颜色),还能完成场景化动态推理(当画面里面有人时,根据画面中人的穿衣风格来生成赞美文案,然后用智能音箱播报生成的赞美文案;当画面里有人在睡觉,根据画面中人是否盖被子来调整空调的温度)。
这一技术突破推动智能家居从“单一条件触发”的初级阶段,正式迈入“多维度场景感知”的高阶形态,而这一核心能力的落地与延伸,均依赖于 Miloco 的四层完整架构体系。
四层完整架构:保障系统稳定与扩展潜力
从用户交互到硬件支撑, Miloco 构建了全链路技术体系并实现全部开放—— 开发者可修改和扩展体系中任何一层的能力,确保功能稳定落地与未来灵活扩展,更为 “开放共创” 预留出足以承载无限创意的充足空间。

用户层:负责用户与系统的交互,当前已支持 WebUI 交互方式,后续将规划 App 端接入,进一步降低使用门槛;
应用层:作为系统 “决策中枢”,承接用户层需求,负责能力调度、大模型管理、云端服务协同及 MCP 服务适配;
能力平台层:提供信息源接入、设备控制、空间建模、存储记忆、多模态理解等底层能力,为上层应用提供技术支撑;
硬件层:涵盖算力、存储、网络等基础硬件支持,确保端侧计算高效运行,保障数据处理的实时性与安全性。
Miloco 的开放性打破了生态壁垒 ——开发者可借助其大模型能力,联动 Home Assistant以及第三方平台的设备,探索更具想象力的全屋智能场景。同时,方案坚持 “隐私安全优先” 原则,所有视觉数据可在家庭端侧完成计算,不向外部服务器传输,从技术层面保障 “家庭隐私不外流”,打消用户数据安全顾虑,真正实现 “开放与安全兼顾”。
探索体验新方向,推动智能家居进入大模型时代
探索方案 Miloco 的发布,是小米将大模型技术落地家庭场景的重要实践,更是对智能家居体验升级的一次探索。通过端侧大模型与全链路开放的结合,为行业提供了一种新的技术思路:让智能家居告别传统 “硬编码规则” 的局限,转向 “对话式交互 + 视觉感知” 的人机交互新形态。
这种新形态的核心,是从 “人适应设备” 到 “设备适应人” 的转变:用户无需学习复杂操作,可通过自然语言轻松设置自动化;设备不再是孤立的控制单元,而是能主动理解场景、协同工作的 “生活辅助伙伴”。
未来,小米将持续迭代 Miloco 的技术能力,与全球开发者共同推动全屋智能行业向着更开放、更智能、更贴合用户需求的方向发展。