引言
物联网行业的一个共识是:硬件决定了产品的下限,软件决定了产品的上限。然而,无论是消费级的智能硬件,还是企业办公空间中的照明、空调、门禁等系统,当硬件团队完成原型设计或设备选型之后,软件部分的开发往往成为项目交付的最大变量。从芯片适配到用户手中的 App,从单一设备控制到多系统协同,这个过程中存在大量被低估的技术复杂度和组织协调成本。
本文试图从工程管理的角度,拆解物联网设备智能化的全链路,分析效率瓶颈的根源,并探讨一种可能的优化路径。
一、典型项目的开发链路
一个智能硬件产品从立项到量产,软件部分的开发通常涉及以下环节:
芯片/模组选型 → 硬件驱动开发 → 云端服务搭建 → 智能体/AI 能力开发 → App/小程序开发
1.1 各环节涉及到的工作
以一个中等复杂度的 IoT 设备(如带语音交互的智能灯具)为例:

汇总来看,消费级单品的软件部分开发周期通常为 3-6 个月,涉及 3-5 个不同技术背景的团队;而企业级设备系统的集成周期往往以年计,涉及设备厂商、系统集成商、企业 IT 部门等多方协作。 这还不包括跨团队的接口对齐、联调测试和迭代优化时间。
1.2 多技术栈协同的隐性成本
上述环节并非简单的串行关系,而是高度耦合的网状依赖:
设备端的通信协议需要与云端的消息格式保持一致
AI 能力的输出需要被设备端和 App 同时消费
App 的交互逻辑需要与设备的实际响应能力匹配
任何一端的变更都可能引发其他端的联动修改
在实际项目中,跨团队的接口对齐往往占据大量时间。一个典型的场景是:设备端工程师定义了一套 MQTT 消息格式,后端工程师在实现时发现缺少某些字段,App 工程师又在联调时发现交互流程与预期不符。这种「边做边改」的模式在行业内十分普遍。
二、效率瓶颈的三重因素
2.1 技术栈碎片化
物联网智能化涉及的技术栈跨度极大:
设备端:C/C++、Linux/RTOS、MQTT、低功耗设计
云端:微服务、数据库、缓存、消息队列、容器编排
AI 层:大模型 API、语音识别、自然语言处理、向量数据库
客户端:跨平台框架、原生开发、UI/UX 设计
很少有工程师或单一团队能够同时精通以上所有领域。消费级项目依赖嵌入式、后端、AI、前端等多个团队的协作;企业级项目则进一步涉及设备厂商、系统集成商、企业 IT 部门等多方。团队之间的知识壁垒和沟通成本,往往导致信息传递失真和决策延迟。
2.2 AI 能力接入门槛
语音交互、自然语言理解、多模态感知等 AI 能力,已经成为智能设备的标配功能。然而,这些能力的接入并非简单的 API 调用:
语音识别:需要处理不同口音、噪声环境、唤醒词优化等问题,涉及 ASR 引擎的选择和调优
大模型对接:需要设计 Prompt 工程、上下文管理、意图解析等模块,保证交互的准确性和响应速度
多模态交互:视觉理解、手势识别等能力需要额外的模型部署和端侧优化
对于消费级硬件厂商而言,组建一个具备以上能力的 AI 团队成本较高——需要同时覆盖算法工程、Prompt 工程、语音识别调优、多模态融合等多个方向,而这类人才在当前市场上供给有限。这意味着厂商要么承担较高的人力成本,要么在 AI 能力上妥协,使用现成的通用方案,难以形成产品差异化。
对于企业用户而言,AI 能力接入还面临额外的门槛:
数据安全与合规:企业设备数据往往涉及商业机密,不能简单上传至公有云大模型服务,需要私有化部署或本地模型推理能力
与既有系统的集成:AI 能力的输出需要被企业内部的 ERP、工单系统、BI 平台消费,而非仅仅面向终端用户的交互界面
权限与审计:企业场景要求 AI 决策可追踪、可审计,需要额外的日志、权限控制和多租户隔离机制
2.3 场景扩展性受限
当前智能设备市场面临两层「孤岛」问题。
消费级场景的「单品孤岛」:智能硬件产品大多以单品形态存在,用户购买后只能使用设备本身的功能,难以与其他设备协同工作。这带来几个层面的问题:
用户体验层面:用户家中可能存在多个品牌的智能设备,每个设备都有自己的 App 和控制方式,操作体验碎片化
商业价值层面:单品的使用场景有限,用户购买动力不足,复购率低,品牌难以建立长期粘性
技术层面:跨设备协同需要统一的通信协议和任务调度机制,从零构建这套体系的技术门槛较高
企业级场景的「系统孤岛」:办公空间或商业楼宇中,照明、空调、门禁、安防往往来自不同厂商,各自运行在独立的控制平台上。企业想要实现「人来灯亮、人走空调节能」这类跨系统联动,需要投入大量工程做定制集成——逐一对接各厂商的私有 API、编写硬编码的联动规则、维护脆弱的中间件管道。一旦某个厂商升级接口或更换设备型号,整个联动链路可能断裂。这种集成模式的维护成本极高,且难以随业务需求灵活扩展。
三、工程视角的解决思路
面对上述瓶颈,工程上的优化思路可以从三个层面展开。
3.1 AI 原生的智能体生成
将通用能力平台化的思路并非全新。过去十年,各类 IoT 平台已经在连接层做了大量标准化工作——统一设备接入协议、提供云端消息通道、封装设备管理 API。这些平台解决的是「让设备连上网」的问题,但「让设备具备智能交互能力」的部分,仍然依赖厂商自行开发。
具体而言,传统 IoT 平台的局限体现在:
设备建模仍需手工:工程师需要在平台上手动填写属性、指令、事件的定义表单,这个过程与后续代码开发是割裂的
AI 能力需要自行集成:语音识别、大模型对话、意图解析等模块,平台通常只提供基础 SDK,具体的 Prompt 工程、上下文管理、多轮对话逻辑仍需厂商自行实现
调试依赖实体硬件:没有硬件原型就无法验证交互流程,导致软硬件开发串行,延长了迭代周期
AI 技术的成熟使得平台化可以更进一步——从「连接管理平台」演进为「智能体生成平台」。在这种新模式下,AI 介入了核心开发环节,显著降低了各环节的工作量:
设备建模阶段:厂商用自然语言描述设备能力——消费级场景,如「这是一个支持亮度调节和色温切换的台灯,可以语音控制开关」;企业级场景,如「这是办公楼 3 层的照明系统,包含 50 个可调光灯具和 10 个光照传感器,需要根据人流量自动调节亮度」。系统自动解析并生成标准化的设备规范。不再需要人工准备产品规格。
开发阶段:基于设备规范,平台自动生成完整的设备端 SDK(含 MQTT 连接、消息收发、指令解析)。厂商只需将生成的 SDK 集成到目标硬件平台,根据具体 MCU 做少量适配,即可快速完成设备端开发。
调试阶段:无需等待硬件原型,在线模拟器可以根据规范虚拟出设备的完整行为,支持语音、视觉、屏幕等多模态交互的端到端调试。产品经理可以在研发早期就验证交互体验,将反馈前置。
生态互联阶段:设备不再只是被管理的数据节点,而是具备自主决策能力的智能体。通过 A2A 协议,设备可以自动发现周围的智能体、协商任务分工、自主完成跨设备协作,无需人工编写复杂的联动规则。
这种平台化的核心差异在于:传统平台平台化的是基础设施,AI 原生平台平台化的是智能本身。 厂商接入平台后,获得的不仅是一条数据通道,而是一套可直接运行的设备智能体能力。
3.2 统一设备模型定义智能体能力边界
传统开发模式下,设备端、云端和客户端各自维护一份数据结构,三者之间通过文档或口头约定保持一致。这种方式的脆弱性在于:任何一方的变更都可能破坏契约。更合理的做法是引入统一的设备模型作为「单一事实来源」。
在智能体生成的语境下,设备模型不再是单纯的数据结构定义,而是智能体的能力边界描述。设备规格定义了智能体能够感知什么、能够执行什么、能够报告什么:
属性(Properties):智能体感知的环境状态,如亮度、温度、电量
指令(Commands):智能体可执行的操作,如开关、调节、重启
事件(Events):智能体主动上报的状态变化或异常告警
基于统一的设备规格,可以自动生成设备端的 SDK 代码框架(数据结构和消息处理逻辑),厂商只需将生成的 SDK 集成到目标硬件平台,根据具体 MCU 做少量适配。这种"定义即开发"的模式,将设备能力描述与代码生成打通,消除了人工翻译环节,减少人为错误的同时,也让智能体的能力边界清晰可验证。
3.3 引入 Agent-to-Agent 协议作为跨设备协作的基础设施
跨设备协同的核心挑战在于:如何让来自不同厂商、运行在不同平台上的设备智能体相互理解和协作?
一种可行的方案是引入 Agent-to-Agent(A2A)协议。A2A 协议定义了设备智能体之间的标准通信方式,包括:
自动发现:新设备接入网络后,自动向周围的智能体广播自身能力
任务协商:多个智能体通过标准化消息协商任务分工,无需中央控制器统一调度
自主协作:智能体根据协商结果独立执行各自负责的任务,并将执行结果反馈给相关方
这种分布式协作模式的优势在于:它不依赖某个中心化的平台或厂商,任何支持 A2A 协议的设备都可以平等地接入网络,实现真正的跨品牌互联互通。
消费级场景的典型示例是「离家模式」:用户发出指令后,安防 Agent 自动启动布防,灯光 Agent 依次关闭各房间灯具,空调 Agent 调整至节能模式,清洁 Agent 开始扫地作业。整个过程由各个智能体自主协商完成,无需人工预设复杂的联动规则,也不需要某个中央控制器统一调度。
企业级场景同样适用。例如「会议室节能模式」:会议预约系统向会议室 Agent 发送空闲通知,照明 Agent 自动调暗灯光,空调 Agent 切换至节能温度,窗帘 Agent 关闭遮光帘以维持室内温度。各 Agent 基于 A2A 协议自主协商执行,无需人工编写跨系统的联动规则,也无需为每个会议室逐一配置。
四、Device Agent 的工程实践
Device Agent 并非停留在方法论层面的概念,而是基于以上思路构建的完整工程方案。它将第三章所述的 AI 原生平台化、统一设备模型和 A2A 协议整合为一套可落地的工具链,同时依托 EMQ 在物联网基础设施领域的长期积累,为设备智能体提供可靠的运行底座。
4.1 核心架构的落地
Device Agent 的工程实现对应前文的两层核心思路:
智能体开发层:将自然语言建模、设备规范生成、SDK 自动生成、在线模拟器整合为统一的开发环境。工程师只需描述设备能力,即可一键生成可编译运行的设备端 SDK,并在模拟器中验证交互体验,无需切换多个工具
生态互联层(A2A Network):将 A2A 协议内嵌于设备接入流程中,设备上线即具备自主发现、任务协商、跨设备协作的能力,无需额外开发协作逻辑
设备接入、连接管理、数据持久化等基础设施能力作为底层支撑,由平台自动处理,厂商无需关注。
4.2 基础设施底座
Device Agent 的核心优势不仅在于上层功能的完整性,更在于底层基础设施的可靠性:
基于 EMQX 的电信级消息引擎
EMQX 是业界广泛部署的 MQTT 消息服务器,具备支撑千万级设备并发接入的能力。Device Agent 以此作为设备连接的基础设施,继承了其分布式架构、多活高可用保障和长期稳定运行的行业落地经验(覆盖智能网联汽车、能源电力等对可靠性要求极高的场景)。这意味着设备智能体从第一天起就运行在一个经过大规模验证的消息通道之上。
MQTT 标准协议
设备端与云端之间的通信采用 MQTT 标准协议,而非私有协议。对厂商而言,这意味着:
无供应商锁定风险,设备可以接入任何支持 MQTT 标准的平台
现有基于 MQTT 的设备可以低成本迁移至 Device Agent
丰富的开源生态和成熟的调试工具链可直接复用
私有化部署与数据主权
数据安全是智能硬件厂商和企业用户的核心关切。Device Agent 支持私有化部署,设备数据可以完全存储在厂商自有或企业指定的基础设施中,满足数据不出域、合规审计等要求。对于企业用户而言,这意味着设备智能体的推理和协作可以完全发生在本地网络中,无需将敏感的业务数据上传至公有云。私有化部署对于面向企业客户、政府项目或涉及敏感数据的场景尤为关键。
4.3 效率提升的实质
综合以上能力,Device Agent 对开发效率的提升体现在两个层面:
消费级场景——工作量的重新分配:原本需要嵌入式工程师、后端工程师、AI 工程师、前端工程师协同完成的 3-6 个月工作,现在由平台自动生成通用代码,厂商只需聚焦在差异化功能(如特定传感器的驱动、独特的业务逻辑)上。一名熟悉硬件的工程师即可主导从设备定义到可运行代码的全流程。
企业级场景——集成复杂度的降低:原本需要系统集成商逐一对接各厂商私有 API、编写硬编码联动规则、维护中间件管道的长周期项目,现在通过标准化的设备智能体规范和 A2A 协议,不同厂商的设备可以「即插即用」式协作。企业 IT 部门无需深度介入每一家设备厂商的技术细节,即可实现跨系统的智能化联动。
反馈周期的缩短:在线模拟器使得软硬件开发从串行变为并行,产品经理可以在硬件原型就绪前验证交互体验。这种变化将迭代周期从周级压缩到天级甚至小时级。
五、结语
物联网设备智能化的效率瓶颈,本质上是技术栈碎片化、AI 能力门槛高和场景扩展性受限三重因素叠加的结果。无论是消费级硬件厂商还是企业级设备集成方,解决这些问题的关键都不在于招聘更多工程师或学习更多技术,而在于将如何高效利用 AI 来快速实现行业内的通用需求。
Device Agent 正是在这一思路下构建的:通过自然语言定义设备智能体的能力边界,通过自动化生成替代重复编码,通过 A2A 协议让设备智能体自主发现、协商并完成跨设备协作——从单品智能到系统智能,从封闭生态到开放互联。
我们将在 5/20 正式线上发布 Device Agent 产品,欢迎读者报名参加。
