阿里云发布多模态交互开发套件旨在将通义大模型植入各类硬件终端网经社电子商务研究中心电商门户互联网+智库

当前位置：100EC>产业数字化>阿里云发布多模态交互开发套件旨在将通义大模型植入各类硬件终端

阿里云发布多模态交互开发套件旨在将通义大模型植入各类硬件终端

作者：来源：网经社发布时间：2026年01月09日 09:37:28

(网经社讯)阿里云近日发布了多模态交互开发套件，旨在将旗下通义系列大模型的能力，更便捷地集成到各类硬件终端中。该套件集成了千问、万相、百聆三款基础大模型，并预置了覆盖生活、工作、娱乐、教育等多个场景的十余款智能体（Agent）和工具（MCP），可应用于AI眼镜、学习机、陪伴玩具、智能机器人等设备。

据网经社云计算台（CC.100EC.CN）了解，该套件的推出，源于行业对硬件设备智能化提升的需求。目前，仅靠基础大模型难以同时满足硬件对低成本、低时延、功能丰富及高质量效果的综合性要求。阿里云此套件意在为硬件企业和解决方案商提供一个开发门槛较低、响应速度快、场景覆盖面广的平台。

在技术层面，该套件适配了30多款主流的ARM、RISC-V和MIPS架构终端芯片，以满足市面上大多数硬件设备的快速接入需求。阿里云表示，未来通义大模型将与玄铁RISC-V进行软硬全链路的协同优化，以实现模型在RISC-V架构上的高效部署和推理。

在模型优化方面，除通义模型家族外，阿里云还针对多模态交互场景推出了专用模型，支持全双工语音、视频、图文等交互方式，端到端语音交互时延可低至1秒，视频交互时延可低至1.5秒。

该套件还接入了阿里云的百炼平台生态，用户可添加其他开发者提供的工具或智能体模板，并通过A2A协议兼容第三方智能体，以扩展应用能力边界。现场展示的应用方案包括，在AI眼镜场景中，可实现同声传译、拍照翻译等功能；在家庭陪伴机器人场景中，可实现实时监测异常、视频内容查找定位以及与机器人对话控制设备等。

根据国际研究机构Gartner发布的生成式AI（GenAI）技术创新指南报告，阿里云在GenAI云基础设施、GenAI工程、GenAI模型及AI知识管理应用四大维度均位列“新兴领导者”象限，是入选全部四项的亚太唯一厂商。

浙江网经社信息科技公司拥有18年历史，作为中国领先的数字经济新媒体、服务商，提供“媒体+智库”、“会员+孵化”服务；（1）面向电商平台、头部服务商等PR条线提供媒体传播服务；（2）面向各类企事业单位、政府部门、培训机构、电商平台等提供智库服务；（3）面向各类电商渠道方、品牌方、商家、供应链公司等提供“千电万商”生态圈服务；（4）面向各类初创公司提供创业孵化器服务。

网经社“电数宝”电商大数据库（DATA.100EC.CN，免费注册体验全库）基于电商行业18年沉淀，包含100+上市公司、新三板公司数据，150+独角兽、200+千里马公司数据，4000+起投融资数据以及10万+互联网APP数据，全面覆盖“头部+腰部+长尾”电商，旨在通过数据可视化形式帮助了解电商行业，挖掘行业市场潜力，助力企业决策，做电商人研究、决策的“好参谋”。