云上资讯 · 生活

语言助理想用情感与ChatGPT & Co.竞争

  

  

  这个语音助手应该是敏感的:BUD-E。(图片来源:Adobe Stock - Damian Sobczyk)

  在目前存在的许多人工智能项目中,这是大规模人工智能开放网络(LAION),称为他的新项目BUD-E (Buddy for Understanding and Digital Empathy)。

  负责流行的人工智能训练数据集的德国非营利组织正在计划一个完全开放和情商高的语音助手。为此,他们与

  宾根ELLIS研究所(欧洲学习与智能系统实验室)合作。

  该项目的目标是创建一个可扩展的架构,充分利用新兴的生成式人工智能技术,特别是大型语言模型,如OpenAI的ChatGPT。但这更具体地意味着什么呢?

  BUD-E能做什么?LAION专注于实现自然互动,为更长时间、更有吸引力的对话奠定基础。

  根据LAIONs的博客文章,BUD-E应该具有以下功能:

  实时响应用户查询

  自然的声音,同理心和情感部分情报

  长期的公司之前对话的文本

  现实主义贯穿始终与多个说话者交谈,被打断,等等确认和停顿以供反思

  本地服务nsumer硬件

  BUD-E的撰稿人维兰德·布伦德尔(Wieland Brendel)强调,有必要超越传统的、笨重的聊天界面,正如他在TechCrunch的一封电子邮件中所说:

  “与[Assistenten]的大多数交互依赖于难以使用的聊天界面,[并且]与这些系统的对话感觉生硬和不自然。

  这些系统在发送控制音乐或开灯的命令方面很好,但它们不是长时间、引人入胜的对话的基础。

  另一方面,BUD-E的目标是为语音助手奠定基础,使其对人类来说感觉更自然,能够模仿人类对话的自然语言模式,并记住过去的对话。

  你可以在这里听到这个还很年轻的项目的声音:

  推荐编辑内容

  此时,您将找到来自YouTube的外部内容来补充本文。您可以显示它,并再次隐藏它与单击。

  我同意向我展示YouTube上的内容。

  YouTube内容链接

  里面有什么?LAION结合了各种开放模型,包括微软的Phi-2 SLM(小型语言模型),哥伦比亚的文本到语音的StyleTTS2和英伟达的语音到文本的FastConformer。

  然而,为了让BUD-E像知名语音助手一样快速做出反应,仍然需要强大的显卡。

  我什么时候能到那儿?即使是现在!BUD-E是一个开源项目,你可以访问github的Ubuntu和Windows (MacOS正在进行中)。然而,语音助手还处于早期开发阶段。

  未来会怎样?在博客文章中,LAION还提出了一个雄心勃勃的路线图,展示了他们在GitHub上与社区合作的计划。除其他外,这些包括:

  减少延迟和最小化系统需求

  更自然的语言和答案

  跟踪公司跨越几天的谈话,没有NTHS和年数

  改进的语音助手功能

  提高多模态和情绪部分公司ntext理解

  扩展到多种语言?和扬声器

  但正如TechCrunch在上面链接的文章中所报道的那样,LAION还有更多的计划。因此,他们正在考虑制作动画形象。通过网络摄像头对用户进行面部分析也引发了争议。

  这可以更好地理解人们的情绪和情绪,但在这一点上,数据保护官员可能会敲响警钟。然而,LAION的联合创始人Robert Kaczmarcshyk强调,安全起着重要作用:

  ?[Wir]我们严格遵守欧盟人工智能法案中包含的安全和道德准则。[…]这种对透明度的承诺不仅有助于及早发现和纠正潜在的偏见,而且有利于科学诚信