从类人交互到语音定制和可访问性,了解如何创建更智能、更以用户为中心的聊天机器人。
人工智能的兴起改变了我们对产品设计和开发的看法。 GPT 和 Gemini 等平台使得创建具有前所未有的复杂性的聊天机器人成为可能,使尖端技术更接近日常应用。但这不仅仅是工具或功能的问题,而是我们设计本身方式的转变。
对于设计师来说,人工智能的引入标志着新篇章的开始,需要我们重新思考传统流程并采用全新的方法。构建人工智能驱动的产品远不是一个即插即用的过程;它需要仔细关注用户体验,更深入地了解用户行为,并致力于打造超越功能的解决方案。借助人工智能,我们有绝佳的机会与用户进行更个性化的联系,打造定制体验,满足他们的独特需求、偏好和限制。
在过去的一年里,我一直专注于设计人工智能驱动的聊天机器人,并在此过程中收集了宝贵的见解和经验。在本文中,我将分享一些关于如何让聊天机器人体验更加真实、自然和用户友好的想法——这是人们在对话式人工智能中真正寻求的品质。
在可视化聊天机器人方面有几种不同的思想流派。不露面的聊天机器人,比如 GPT、Gemini 或 Google Assistant,通常用简单的插图或图标来表示——尤其是在文本模式下,它们的小头像尺寸需要清晰、可识别的设计。在语音模式下,这些聊天机器人有时会采用抽象的组合,例如 GPT、Gemini 或最近更新的 Siri 的视觉风格。这种方法对于旨在集成到各种特定产品中的人工智能模型很常见。 (郑重声明,我是 Siri 新外观的粉丝!)
随着我们更深入地开发更专业的产品,化身策略往往会发生变化。在这些情况下,由角色头像代表的聊天机器人并不罕见。虽然有些人可能会觉得这种方法过于字面意思,但它可能非常有效,特别是在客户服务等环境中。然而,这种策略存在一个潜在的陷阱:如果化身看起来非常像人类,但没有完全达到感觉真正人类所需的真实感水平,它就有可能进入“恐怖谷”。这是一个奇怪的时刻,虚拟形象感觉几乎像人类,但还不够,给用户带来尴尬或不安的体验。我将在以后的帖子中进一步探讨这个问题。
选择正确的设计
如果您不确定采用哪种方法,请考虑允许用户在设置中自定义聊天机器人的外观。提供一些不同的选项,包括抽象和文字表示,并让用户选择他们的偏好。这种方法不仅可以提供个性化的体验,还可以提供有价值的见解——通过分析结果数据,您可以识别趋势并做出更明智的设计决策。
随着 ElevenLabs 等产品的进步,我们现在拥有强大的工具来微调聊天机器人语音响应的语气和风格。设计师可以决定是否希望聊天机器人以中性、通用的语气进行响应,采用更柔和的耳语风格,甚至根据特定上下文动态调整其语气和语调。
为什么这种级别的定制如此重要?有两个原因。首先,在现实生活中,我们说话的方式很少是线性的。人类是情感生物,背景几乎总是影响我们的沟通。例如,我们道歉时使用的语气与庆祝时使用的语气非常不同。为了让体验感觉更真实(并可能提高用户参与度 – 尽管有一个警告,我将在本条目的末尾详细说明),将聊天机器人的说话风格与单词的重量和内容保持一致至关重要谈话的背景。
良好的沟通不仅仅在于言语本身。根据55/38/7公式,只有7%的沟通是通过文字传达的。其中 38% 来自语音提示,55% 来自非语言提示。这使得聊天机器人必须以一种人性化和情感化的方式做出反应。这不仅仅意味着将语气与上下文相匹配;还意味着将语气与上下文相匹配。它还要求聊天机器人在更深入、更情绪化的层面上解释用户的输入,以确保真正自然的交互。
聊天机器人说话风格的另一个重要方面是它的口音。对于英语国家以外的用户来说,通常会有一种“标准”英国口音的感觉,有时(尽管越来越少)与标准发音 (RP) 相关。然而,在英国境内,有近 40 种不同的地区口音,每种口音都有其独特的特征和身份,展示了英语语音的真正多样性。
ChatGPT 语音模式最令人惊讶和有趣的更新之一是它采用口音的能力。但它不仅仅只是为你的助手选择口音,这已经是一个常见的功能。现在,您可以要求助理用混合口音说话,例如在爱尔兰生活多年的波兰人的口音。 GPT 处理得非常好,将强烈的东欧发音与典型的爱尔兰英语独特的节奏和语调相结合,从而产生了真实且高度有趣的互动。
现在,假设您正在为英国不同地区设计一个客户服务聊天机器人。您的聊天机器人可以采用每个地区的当地口音,而不是提供一刀切的声音,从而为用户创造更具关联性和定制化的体验。例如,纽卡斯尔的聊天机器人可以使用乔迪口音,而伯明翰的聊天机器人可能采用布鲁米风格。这种程度的定制不仅可以增强用户参与度,还可以增加文化熟悉度,使互动感觉更加个性化和真实。
目前,没有任何可用模型提供广泛的地区口音(这是不幸的),但 GPT 确实包含有限的英语口音选择。随着这一领域不断进行的实验,区域口音定制的未来看起来很有希望。
在聊天机器人消息长度方面,GPT 和 Gemini 等平台通常旨在平衡简洁性和深度。默认情况下,这些模型会优先考虑简洁的响应,同时确保它们完全解决用户的查询。例如,简单的问题通常会得到平均约 20-50 个单词的答案。
然而,并非所有聊天机器人都需要遵循这个公式。例如,讲故事的聊天机器人可能需要更长、更吸引人的叙述来娱乐用户,其目标不仅仅是提供信息。
为什么这很重要?
使消息风格与产品的目的和对话的背景保持一致至关重要。同时,过长的段落可能会让人感到不知所措,特别是如果 UI 的设计不能有效地处理它们。深思熟虑的文本显示策略和交互在确保 UI 和 UX 一致的流畅用户体验方面发挥着至关重要的作用。
看看 GPT、Claude、Gemini 和 Grok 等流行的人工智能模型,我们可以观察到向用户显示信息的方式存在显着差异:
- GPT 和克劳德以类似打字机的方式呈现文本,其中的单词看起来就像是实时打印出来的。虽然这增加了活力元素,但对于对视觉刺激或时间压力更敏感的用户来说可能会感到压力。
- Gemini 采用了不同的方法,在生成响应时显示闪烁的预加载器,这会让人感觉更具有预期性且不那么刺耳。
- Grok 和 Pi.ai(基于 Claude 构建)以更加微妙和精致的方式脱颖而出。它们的文本显示流畅且令人愉悦,使体验特别舒适,尤其是当生成的内容很长时。
管理认知负荷
聊天机器人设计的另一个关键方面是通过减少视觉混乱和保持注意力来管理认知负荷。例如,像 Pi.ai 这样的平台会随着新响应的生成而将旧响应移出视野。这种方法可以保持界面干净,并允许用户专注于最相关和最新的信息,而不会被混乱的聊天历史记录淹没。
语音聊天机器人中较少探索的模式之一是提供调整响应速度的设置。虽然屏幕阅读器用户通常使用类似的工具,但它们在语音聊天机器人的背景下仍然是新颖的。
现在,想象两个简单的滑块:一个控制整体响应速度(聊天机器人说话的速度),另一个调整句子或段落之间的停顿。
这个解决方案既简单又非常强大,但这是人工智能聊天机器人尚未充分探索的领域。 (如果您遇到过提供类似功能的聊天机器人,请在评论中告诉我!)
这种定制可能特别有帮助:
- 有听力困难的用户需要更慢、更清晰的响应。
- 非母语人士通常会受益于较慢的讲话和较长的停顿以利于理解。
- 存在认知障碍的用户,更审慎的节奏有助于理解。
- 高压力情况下,较慢且平静的反应有助于减少焦虑(例如,心理健康或危机支持聊天机器人)。
集成此功能不仅可以提高可访问性,还可以创造更加个性化和用户友好的体验。这是一个很小的补充,但有可能产生很大的影响。
在人与聊天机器人交互方面,目前存在三种主要的 UI 模式:
- 语音到语音模式:这是最自然、免提的选项,用户无需与设备交互即可进行物理通信。
- 按住通话模式:用户按住麦克风按钮与聊天机器人通话。
- 记录模式:大多数消息应用程序中常见的一种常见模式,用户记录消息并将其发送给聊天机器人(或某人)进行处理。
从通信的角度来看,免提语音交互感觉最自然。然而,即使使用 ChatGPT 等先进模型,它也带来了重大的用户体验挑战。一个值得注意的问题是,聊天机器人仍然难以准确检测用户何时结束讲话。
增强语音交互
在最新版本的 GPT 语音聊天机器人中,偶尔还是会出现这样的情况:如果用户在句子中间暂停来收集想法,助手可能会过早介入。虽然这可能会中断对话流程,但 GPT 提供了一些可以显着改善体验的功能:
- 可中断性:用户可以在助手响应中中断。它会立即停止说话并恢复收听,从而使用户能够无缝地继续。
- 可调整的聆听时间:用户可以请求助理留出更多时间进行回复。此功能有助于确保思考暂停不会导致中断,从而使对话流程更加顺畅。
这些功能使最新的 GPT 版本成为最先进的语音聊天助手之一,在解决语音间交互中的常见挑战方面取得了显着进展。
可靠的语音输入方式
如果您正在设计聊天机器人界面,尤其是语音交互界面,那么承认这些挑战非常重要。在目前的技术阶段,最可靠的输入方法仍然是:
- 保持通话按钮:一种简单且熟悉的方法,可最大程度地减少检测用户何时结束讲话时的错误。
- 录音模式:一种实用且广泛接受的异步语音输入解决方案。
虽然免提语音到语音体验正在迅速改善,但它还不是完美无缺的。目前,采用更受控制的交互模式(例如按住通话或录音模式)进行设计将提供更安全、更一致的用户体验。最终,随着技术的进步,语音间的交互可能会变得无缝——但我们还没有做到这一点。
上述所有要点不应被视为设计过程的明确建议。由于我们仍处于机器人时代的早期阶段——而聊天机器人本质上是机器人的一种形式——我们无法完全预测用户将如何适应它们。一些聊天机器人可能会以更自然、类似人类的语气表现出色,而另一些聊天机器人可能会以僵化的机器人方式表现更好。
当我们浏览 UX/UI 设计的新篇章时,很明显不存在通用公式或一刀切的解决方案。创建高性能聊天机器人的关键在于遵循迭代过程:设计、测试、学习和重复。只有通过这个循环,我们才能完善和适应,以满足用户不断变化的需求和偏好。
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除