玩偶姐姐 麻豆 大模子从Chat走向Act,智谱公布Agent新进展:辅助跨App、跨诞生等玩法

发布日期:2024-12-01 18:54    点击次数:108


玩偶姐姐 麻豆 大模子从Chat走向Act,智谱公布Agent新进展:辅助跨App、跨诞生等玩法

起原:猎云网

东谈主类与机器的互动方式正在发生范式漂泊。这是由于独一双话功能的Chatbot,正在进化为“有手、有脑、有眼睛”的自主Agent。

11月29日,手脚最早探索Agent的大模子企业之一,智谱带来了多个新进展:

AutoGLM不错自主实践卓越50步的长举止操作,也不错跨APP实践任务;

AutoGLM开启“全自动”上网新体验,辅助等数十个网站的无东谈主驾驶;

像东谈主相同操作磋磨机的GLM-PC启动内测,基于视觉多模态模子杀青通用Agent的本事探索。

在Agent OpenDay现场,智谱CEO张鹏下达了一个浅显语音领导,AutoGLM便给在场数百位嘉宾发送了“一个来自 AI 的微信红包”。此外,AutoGLM还不错通过手机,辛勤领导电脑自动发送文献。

AutoGLM新升级:挑战更复杂

新升级的AutoGLM不错挑战完成复杂任务:

1. 超长任务:一语气超长领导,实践超长任务。举例,在采购暖锅食材的例子中,AutoGLM自主实践了54步无打断操作。而且,在这种多步、轮回任务中,AutoGLM的速率推崇卓越东谈主手动操作。

2. 跨App:AutoGLM辅助跨App来实践任务。用户将民俗于AI自动料理,而不是在多个App间来往切换。由于面前AutoGLM形态更像是用户和期骗间的App实践的养息层,因此跨App才能是内部相当重要的一步。

3. 短口令:AutoGLM简略辅助长任务的自界说短语。今天,你无须再给AutoGLM说:“帮我买一杯瑞幸咖啡,生椰拿铁,五谈口店,大杯、热、微糖” 这类超长领导,只需要说“点咖啡”。

4. 不端模式:咱们都会堕入选拔忌惮,AutoGLM今天不错主动帮你作念出方案。不端模式下通盘举止都让AI方案,带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡口味?

同期,AutoGLM启动大畛域内测,并将尽快上线成为面向C端用户的居品。 AutoGLM同期晓谕启动“10个亿级App免费Auto升级”的绸缪玩偶姐姐 麻豆,邀请App伙伴洽商探索我方的Auto新场景。

辅助中枢场景和中枢期骗的AutoGLM标品API,会在两周内上线到智谱maas绽开平台(bigmodel.cn)试用。

Web端开启“全自动”上网新体验:即日起智谱清言插件上线AutoGLM功能,辅助搜索、微博、知乎、Github等数十个网站的无东谈主驾驶。在现场demo里,智谱清言插件自动完成了“搜索芒果tv,掀开胡衕东谈主家,播放最新一集,发弹幕结局打卡”。全程莫得东谈主的骚扰。

GLM-PC邀测:面向“无东谈主驾驶”电脑的一次本事探索

不单是基于手机和浏览器,今天智谱还带来基于PC的自主Agent。GLM-PC是GLM团队面向“无东谈主驾驶”PC的一次本事探索,基于智谱的多模态模子 CogAgent。面前绽开第一阶段的内测场景,包括:

1. 会议替身:帮用户预定和参与会议,发送会议讲究。

2. 文档料理:辅助文档下载、文档发送、一语气和讲究文档。

3. 网页搜索与讲究:在指定平台(如微信公众号、知乎、小红书等)搜索指定重要词,完成阅读、讲究。

4. 辛勤和定时操作:辛勤手机发领导,GLM-PC不错自主完成电脑操作;设定一个将来时候,在开机情状下定时实践任务。

5. 隐形屏幕:在用户职责时,GLM-PC不错在隐形屏幕上自主完成职责,开脱屏幕使用权。

东谈主用电脑的过程——用眼看图形及笔墨,用脑贪图,再用手实践单击双击、输入等操作。GLM-PC用电脑的方式真实都备和东谈主相同。也正因如斯,表面上只如若为东谈主类瞎想的期骗,在GLM-PC学习之后它都简略实践。这是一种系统级、跨平台的才能,不依赖于HTML、API,具备更高的才能上限。

不外,由于PC的复杂进程,以及内行在PC完成的真实都是复杂任务,坦率的说,今天大模子的才能距离实在代替内行办公还有一定距离。GLM-PC在面前版块下,用户仍需要输入相当精确的领导。

面前,GLM-PC“邀请体验”已开启。智谱方面暗示,会在居品完善后尽快上线供通盘效户使用,同期也但愿和更多厂商洽商共创共同探索。

欧美成人电影

AutoGLM和GLM-PC是智谱迈向AI智能操作系统的报复尝试。它们的出现源于智谱在大谈话模子、多模态模子、逻辑推理和器具使用等方面的本事蚁集。从2023年4月的AgentBench开动,到8月的CogAgent模子,智谱针对AutoGLM,和GLM-PC的模子CogAgent的研发职责进行了一年半的时候。

与OpenAI有所不同,智谱界说了大模子发展的五个阶段:L1谈话才能、L2逻辑才能(多模态才能)、L3使用器具的才能、 L4自我学习才能、 L5探究科学规则。

发展于今,大模子照旧初步具备了东谈主类与履行物理天下互动的部分才能。“Agent将极地面栽植L3使用器具才能,同期开启对L4自我学习才能的探索。” 张鹏说。

张鹏暗示,将来GLM团队将连接加快agent模子居品的研发,期待着一句话操作电脑和手机的范式尽快到来。

大模子从Chat走向Act

如今,大模子本事正在篡改机器和东谈主的互动方式,基于一语气需求、贪图与方案、实践举止和自我反念念,Agent将带来安妥直观的东谈主机交互——从东谈主适合机器,到让机器适合东谈主。

苹果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和OpenAI(Operator)等企业也照旧把Agent手脚2025年的主要防范点。业内多数以为,2025年将是Agent爆发之年。Gartner近期将agentic AI列为2025年十大本事趋势之一,并预测2028年至少有15%的宽泛职责方案将由agentic AI自主完成,而这一数字在2024年为0。

与GenAI不同,Agent是指标驱动型的,简略都备实践职责经由,适合、学习、迭代、与其他系统和东谈主类合作,并端到端地完成任务。在张鹏看来,Agent不错看作是大模子通用操作系统LLM-OS的雏形。

“现阶段,AutoGLM特别于在东谈主与期骗之间添加一个实践的养息层,很猛进程上篡改东谈主机的交互样式。更报复的是,咱们看到了LLM-OS的可能,基于大模子智能才能(从L1到L4乃至更高),将来有契机杀青原生的东谈主机交互。将东谈主机交互范式带向新的阶段。”

AI时期智能诞生新范式

跟着大模子才能的赓续进化,AI逐步长出了我方的脑、眼和手。不单是是智能在握续增强,感知才能和交互带宽也在赓续丰富和拓展,还有面前的Agent带来了实践力的加快栽植。

智谱COO张帆暗示,智能诞生在大模子的加握下,将会欢快出新的契机。手机+AI会形成随身个东谈主智能助理,PC+AI将会成为全新坐褥力器具,汽车+AI将会让车成为东谈主们的智能第三生涯空间。虽然,大模子不单是会为手机、PC和汽车带来契机,而是会惠及各式各样的智能诞生。大模子的赓续进化照旧为Agent变革东谈主车交互体验奠定了宏大的基础。

跟着端侧性能及算力握续栽植、为AI原生诞生适配的模子和端云同源的协同架构出现,Agent不仅在操作系统OS和期骗上杀青用户体验变革,还能将其扩充到种种智能诞生上,从手机到电脑,再到汽车、眼镜、家居和各式edge side诞生,各式AI原生确站立在争相显现。

终末,荣耀AI本事总监王作建、华硕AIPC智能生态厚爱东谈主钟怀圣、小鹏汽车座舱智能语音/智能化业务厚爱东谈主廉磊、高通AI居品本事中国区厚爱东谈主万卫星、英特尔中国区本事部总司理高宇,手脚智谱的客户及合作伙伴玩偶姐姐 麻豆,分袂从不同的场景启航,共享了他们对智能末端的实践及测度。






Powered by 哥要色 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024

栏目分类

热点资讯

相关资讯