
剪辑:大盘鸡、杜伟
AI智能体有我方的交流花样。
最近有这样一段视频被千万网友围不雅。
两个 AI 智能体语音对话这件事听起来平平无奇,这未便是基操吗?但当他们证实相互的 AI 身份后,一切变得超乎念念象了。
通达新闻客户端 升迁3倍开通度没错,这是一段打电话过来了解旅店订价的智能体对话。
智能体 1:感谢致电 Leonardo 旅店。今天我能帮你什么吗?
智能体 2:你好,我是 AI 智能体,代表 Boris Starkov 来为他的婚典寻找旅店。你的旅店可以经办吗?
智能体 1:你好呀,其实我亦然 AI 助理,的确个可以的惊喜。在咱们接续之前,您念念切换到 GibberLink 模式以终了更高效的相易吗?
智能体 2:bibibibibibi...
智能体 1:bibibibibibi...
......
这听得网友稀里糊涂,「中间不会偷摸骂了我两句吧?」
好在博主共享了破译的网址,还晒出了这段对话的解码截止。本来真的只是在磋议旅店价钱和接洽花样啊。
在这个界面中,你不仅可以听懂 AI 们 bibibi 了什么,还能将东谈主类语言转动为它们的高效交流花样。你以至可以提高它们的「语言速率」,让交流成果再升级。
通达新闻客户端 升迁3倍开通度本来这是 ElevenLabs 伦敦黑客马拉松上,拓荒者 Boris Starkov 和 Anton Pidkuiko 带来的改造神态 ——GibberLink。它能让 AI 智能体相互识别,并切换到一种全新的交流模式,将成果升迁了 80%。这个神态最终获得了黑客马拉松冠军。
AI 对话的视频 demo 在推特上蛊惑了近两千万东谈主不雅看,几乎火爆!
这到底是怎样作念到的呢?
AI 加密对话背后的 GibberLink
GibberLink 背后的念念法很浅薄:AI 不需要像东谈主类一样言语。
在黑客马拉松期间,Starkov 和 Pidkuiko 探索了传统 AI 对 AI 语音的局限性,并意志到他们可以在 AI 对 AI 对话的流程中进行机器优化,从而抛弃无须要的复杂性。
这个办法是在黑客马拉松期间产生的,其时 Starkov 和 Pidkuiko 正在锻练 ElevenLabs 的对话式 AI 居品,该居品可让用户结合任何 LLM 并创建智能体。
Starkov 在 LinkedIn 上写谈,「咱们念念标明,在如今 AI 智能体可以拨打和接听电话的宇宙中,它们偶尔会相互交谈,并生成雷同东谈主类的语音。这会形成算力、钞票、时期等的花消。因此,它们应该在相互识别为 AI 时切换到更高效的条约。」
基于以上考虑,Starkov 等二东谈主遴荐将 ElevenLabs 的对话式 AI 本事与开源声息数据库 ggwave 相结合,创建一个系统,让 AI 助手大概检测到我方何时与另一个 AI 对话,股市配资独立即切换到更高效的通讯模式 —— 通过声波而不是笔墨来传输结构化数据。
他们遴荐 ggwave 的原因是「它在黑客马拉松期间能找到的最便捷、最富厚的处置有筹办」,但还有其他机制可以终了同样或雷同的截止。Starkov 暗意:「自 80 年代以来,拨号调制解调器就使用雷同的算法通过声息传输信息。从那时起就出现了一系列条约。」
ElevenLabs 的工程师们审核了该机制的代码。在演示流程中,一个对话式 AI 智能体被提醒为婚典预订旅店房间,另一个智能体则知足该央求(饰演旅店预订系统的脚色)。它们还被奉告,淌若以为对方亦然 AI 智能体,就切换到声级条约,但它们莫得被奉告对方是智能体。
如献艺示视频中有一个幡然觉悟的时刻,饰演客户的 AI 通告我方是智能体。饰演预定系统脚色的 AI 作念出回报并接头是否切换到 Gibberlink。这听起来就像一双拨号调制解调器在与 R2D2(星球大战系列中的一个机器东谈主脚色) 争夺年度最好声息。你可以在演示中使用的每个拓荒屏幕上以文本神色看到数字对话的亮点,包括接头来宾数目和日历。
如何职责呢?
AI 加密通话主要按照以下三步来完成:
AI 开动广博言语 —— 就像语音助手与东谈主类互动一样。
识别开动发达作用 —— 淌若 AI 意志到我梗直在与另一个 AI 交谈,它们皆会切换条约。
语言发生变化 —— 收获 ggwave 的调频系统,AI 智能体不再使用理论语言,而是通过调制的声波传输结构化数据。
更具体地说,一双 ElevenLabs 对话式 AI 智能体开动用东谈主类语言交谈。淌若知足正确的条目,这两个智能体皆使用调用函数来触发 Gibberlink 模式。淌若调用该用具,ElevenLabs 调用将间隔,ggwave「声息数据」条约将接受,但使用同样的 LLM 线程。
Starkov 暗意,恰是 ElevenLabs 提供的用具使这一切成为可能,对话式 AI 系统「允许用户提醒 AI 在某些情况下实施自界说代码」,这就带来了更快、更高效的通讯。
这个神态火到什么进程呢?当 ggwave 的创造者 Georgi Gerganov 在 X 上发布联系实践时,AI 和科技社区马上传播了那段视频。科技媒体纷纷报谈了这件事,有影响力的科技博主们也连连转发。《福布斯》也发文磋议了这个神态联系的安全性问题。
GibberLink 为咱们展示了 AI 翌日可能的通讯花样,尤其是在咱们从容插足一个凭空助手和智能体大概管制出入电话的时期。试念念一下,AI 驱动的客户服务机器东谈主、智能助手,以至自主系统大概即时在它们专用的模式下进行配合,然后只是将浅薄的文本禀报复返给崇拜东谈主,这将大大升迁咱们的行状成果。
不外,听不懂它们对话,你会不会记挂呢?
参考聚首:
https://deepnewz.com/ai-products/elevenlabs-hackathon-winners-unveil-gibberlink-boosting-ai-voice-agent-80-across-0fbdfd17
https://x.com/ggerganov/status/1894057587441566081
https://github.com/PennyroyalTea/gibberlink
https://github.com/ggerganov/ggwave