产品智能化的设计思考 | 张爽

  • 经验类型经验/观点
  • 经验属性原创文章
  • 经验版权署名-非商业性使用
16729 2 230 2019-01-07

本文根据UI中国第十届用户体验设计大会上,搜狗桌面事业部设计总监张爽现场演讲整理而成。


Image title



什么是人工智能


人工智能对于设计师而言一直是个黑盒。


人工智能其实就是数据+算法,通过神经网络的技术,机器可以从外界获取数据,通过不断的学习实践,最后能产出类似于人的智能,AI智能音箱,无人驾驶、无人超市、人脸识别都是属于AI的范畴。同时,AI不仅是一种技术,更是一种应用,慢慢延伸到各种领域的应用中。



人工智能的主流研究方向


现在AI的主流的研究方向分为三类,一是对人的智能的模拟,比如视觉的图象识别、语音识别,还能够和人进行语言对话。给机器看一张图片,机器可以告诉我这是一只狗,一只什么品种的狗,在什么样的环境下。更进一步地,机器通过学习会产生推理判断能力。比如在金融领域,机器会帮助我们判断未来的风险,在医疗领域,我们可以让机器看X光片,从而判断未来可能会发生的病变,帮助人们提升疾病预防的意识。在这方面,机器有着很多优势。曾经有一个说法,AI的机器在一天看的X光片的数量比一个有经验的老大夫10年看的的还要多。所以AI的使用会大大的释放人的劳动。第三个方向,机器通过自己的预测会产生一些自主的反馈,进行机械控制、任务规划。比较典型例子的就是自动驾驶,机器通过学习大量已经标注好的信息对周围的环境实现判断,最终具备无人驾驶能力。



如何创造产品的智能体验?


现在AI已经应用到了各个领域,越来越多的产品中会用到AI。我们如何利用AI创造智能的体验呢?


下面我会从两方面与大家分享:第一部分,结合输入法案例介绍我们在产品智能化中的设计实践。第二部分跟大家聊聊在技术变革的大背景下我们的设计师会遇到哪些挑战。



智能体验设计实践


影响工具产品体验的因素


作为工具型的产品,用户的核心诉求其实就是高效,用户希望通过使用我们的产品快速的帮助他完成目标,而我们的产品也希望用户可以实现快速的操作,养成使用习惯,对产品形成依赖。这里有两个因素会影响用户体验——用户和场景。


首先我们的用户都是一群什么样的人?不同职业和不同年龄的用户,他们的需求不同、心智模型不同、情感诉求不同。最重要的是用户需求所产生的场景是什么,在这个场景下他们的目标、行为动机是什么,有什么痛点。比如用户需要一座桥,他要桥做什么,目的是到河对岸去,到对岸干什么,不同的目标会产生不同的接下来的行为。所以我们在进行智能化产品设计的时候首先要考虑用户场景。


Image title


接下来我们来看看输入法。提到输入法大家会想到什么?会想到键盘、打字,汉字,其实输入法的本质是人机输入的入口,而输入法的作用会随着互联网的变化而发生变化。PC时代输入法主要作用是解决拼音和汉字的对应问题,在此之前汉字输入是个很大的困难,过去使用五笔输入需要用户背诵大量的内容,而有了拼音输入法后,拼音是每个人都会使用的,那个年代主要解决的问题是拼音和汉字的匹配问题。到了移动时代,我们已经没有键盘了,我们使用的是虚拟键盘,这个键盘是定制的可以变化,同时手机上有很多的传感器可以调用,最重要的是PC和移动时代用户打字的场景发生了变化,PC时代50%的打字量在办公软件,核心场景是编辑,在移动时代90%的打字量在聊天软件,核心场景在聊天。



聊天场景下的用户诉求


我们看看聊天的场景下用户有哪些需求。我和我的朋友在网络中聊天,我看不到你,触碰不到你,听不到你,这个时候我希望朋友快速的回复我。同时我跟我的朋友聊天目的是为了获取信息、分享信息,把我的想法分享给我的朋友。最后,我有表达的需求。我希望有个性化的表达方式能代表我的心情和想法。那么输入法怎么满足这些需求呢?


Image title


首先是快速,我们过去通过调整词频的方式来达到快速回复,通过了解用户的使用习惯进行候选词前后顺序的调整,甚至根据用户的地理位置判断他要说的词,但是这些都还是需要用户输入。到了AI时代呢?有没有办法不需要用户输入,直接进行选择就可以上屏了,当然可能。


我们可以在用户输入前根据朋友发来的信息进行下一步的回复的预测,还可以根据双方聊天的状态判断用户接下来要说的话,同时对于他说的话进行补充,这是在输入之前进行智能的预测。


第二个需求就是信息的获取和分享。当用户在聊天过程中讨论到的话题是我们不了解的领域,遇到这个情况我们会怎么做?通常是跳出当前聊天的界面,返回桌面找到某一个垂直类的APP进行搜索,查询相关信息,最后分享链接出来,这是很冗长的操作链条。而输入法可以检测到用户聊天内容,根据用户打的字进行相关内容的预测推荐。比如我朋友问我,你刚才放的什么歌很好听啊,我回答是李健的贝加尔湖畔,这个时候我可以点击输入法相关的内容推荐,直接把这首歌分享给朋友。

  

我们来拆解一下聊天场景下的用户操作流程,我们把它分解为输入前、输入中,输入后,我们可以在用户输入前智能判断他要说的话,让他不用输入,在输入后通过了解上下文的含义进行相关内容推荐。


Image title


第三个是个性化的表达。如何在聊天中更能准确的表情达意、更幽默风趣,其实是用户更深层次的需求。用户双方看不到,听不到,只能看到对方头像和回复的内容,这就是为什么表情包变的非常流行。输入法也可以根据输入的内容进行表情包的推荐,这是个性化表达的第一个需求。第二个需求——不是所有的人都很会表达。所以当用户输入完成后,我们给他提供可供替换的更恰当的词汇甚至诗词。比如一个互联网的码农,他收到女朋友的微信,问他“我美吗?”,这基本上是一个送命题了,而输入法可以根据这个问题推荐美相关的词汇,从而帮助用户解决生活中沟通的烦恼、输入的烦恼。


在内容推荐的过程中,输入法会结合用户当前的状态,开心、难过、无聊等场景下,结合用户的属性,整合后台相关资源,通过人工智能的算法,给用户提供精准推荐。而在产品的落地上,设计师要承担的其实是全局的系统性的框架设计。包括输入时机、卡片样式、字体大小、停留时长,我们在这几个方面都进行了反复尝试。



预测式设计的原则


在进行智能化设计的时候其实有一个巨大的变量,就是预测的准确性,如果预测的准会觉得很好用,如果预测不准,对于用户的当前输入行为就是个干扰,所以我们进行AI设计的时候,要遵循预测式设计的三点原则:


1、不干扰用户操作,平衡用户的注意力。

2、降低用户风险,风险有两个方面,一预测的准确性,二是我们可能推送的内容有视频音频,但不希望用户耗费流量形成损失,所以我们需要平衡推荐的准确度。

3、清晰表现预测内容,从而管理用户的预期。


总结起来,聊天场景下的智能输入:用户输入前,通过智能预测的方式判断用户接下来产生的行为和输入的文字。在输入的过程中,根据聊天当中说的话提供相关内容推荐,让信息的获取和分享更方便。在输入完成之后,输入法可以进行语言上的修饰,帮助用户更好的传达情感。


Image title


这就是我们整个输入法在AI实践当中的经验。接下来跟大家探讨一下在技术变革的大背景下,我们设计师会面对哪些挑战。



变革中的挑战


挑战1:机器的性格   


随着AI的发展,尤其是智能语音的发展,产品慢慢的向自然交互的方向转变。而工具型产品的发展方向其实是个人助理,交互的对象也慢慢的从机器变成了人。为什么说是工具变成了人?因为人天然的会对事物进行情感的投射,我们会认为一个智能的有声的产品是有生命的,会对他有情感期待。所以我们交互方式也从人机交互转向了人人交互。人人交互实际上应该叫沟通,除了信息的沟通,还有情感的沟通。如果一个语音的产品没有情感沟通,我们会觉得他是冷冰冰的,这种体验很不友好。那么怎么设计AI的情感呢?



虚拟形象的情感反馈


在设计的时候,我们需要结合这款产品当前所处在的环境及服务的对象,对它进行性格设定。比如我们的虚拟助理是面向小朋友的讲故事的产品,它的性格就应该是活泼开朗的。如果设计的产品是个全技能的语音助手,它的性格就应该是温和、顺从的,这也就是为什么现在绝大部分的AI音箱被设计成了女性的声音。而我们在设计汪仔机器人的时候,它的应用场景不同,表现的性格特点不同。他的声音态度、视觉反馈、动作配合、语言交互等等的所有的一切都需要围绕产品所处在的环境和服务的人群。


Image title


汪仔的首秀是在 “一站到底”节目上,“一站到底”是一个抢答类的节目,节目的目的是为了表现人和AI的比拼,看看谁更聪明,谁抢答的速度更快,所以在这样一个环境中,汪仔所赋予的就是一个竞争性的、对抗式的性格。他的表情、语气态度都是为了表现竞争。


当汪仔出现在一个服务性的场景的时候,它表现出来的就是一种温和友好的性格,希望获得人们的喜爱。这里需要注意一点,在一个单一目的明确的场景,我们的产品性格必须是统一的,只有统一的性格才能让用户对他的行为产生预期,否则会觉得他很不稳定。而在不同的场景服务不同的人群,他的性格需要符合目的的需要。这是我们在AI时代的第一个挑战,机器的性格。



挑战2:新的应用场景


第二个挑战是由于AI的发展,会产生各种各样的新的服务,新的产品,我们的设计师会面临新的产品的应用场景。比如搜狗同传,搜狗同传是我们用语音识别和机器翻译技术打造的一款同传产品,通过机器实现同声传译,从而解放人的劳动。过去的会议同传一般会配两个同传的工作人员,为什么是两个呢?因为同传是很耗费脑力的工作,最多半个小时要换一个人。现在通过机器来做同传,可以把同传结果投射到大屏幕上,用户也可以通过机器听同传的语音,甚至可以选择美音男声、美音女声。这里设计师要做的工作就是同传字幕的设计


我们理想当中的字幕设计其实就像电影字幕一样,一行中文,一行英文,看起来很清晰。但是实际的展示效果,我们发现同传的字幕是一段一段的呈现,会出现大量的空白,造成用户阅读上的不连贯。


Image title


要想解决这种问题,我们先来看看机器同传的原理是什么样的。


机器同传首先需要进行现场的拾音,然后进行语音的预处理,再进行语音识别,把它转化成文字。而后进行文本的预处理,再进行机器翻译,最后合成语音。这是很长的过程。而这里我们还有一个文本的处理——文本顺滑的工作。因为我们人在语言表达的时候加了一些重复性的话语,如果把这些话语直接进行翻译,会让翻译不准确,需要把这些重复性的内容去掉。所以机器的翻译可能会有很长的时间差,他不能一行中文一行英文一一对应。


Image title


那么怎么解决这个问题呢?


我们把字幕从一行变成了两行,把目标语言的翻译变成了两行,这是我们后来的解决方案。我们可以通过两行的展示让整个阅读更加的顺滑,不会出现跳跃的情况。


机器翻译还有第二个特点,它在文本识别的时候也不会像人一样一字一句的展示,它是一小段一小段识别的,中间还有跳跃的纠错的过程,那么在展示区域足够的大屏幕上,我们也把这个过程进行了展示,告诉用户机器同传的过程。那么这就是设计师面对的第二个挑战——新的应用场景。



挑战3:技术的局限


AI可能在很长的时间内都不会达到我们人所预期的那样,在这期间我们处在弱人工智能的状态,机器需要大的算法和获取才能工作。比如设计语音类的产品,我们有一个很好的功能——可以帮助用户复刻自己的声音,形成个性化的语音包,这是很有趣的功能。但是实现的过程中遇到一个问题,用户需要阅读大段的文本完成语音包的生成,这个体验很不好,设计师需要在这个过程中设计一些环节,一些鼓励性的话语,一些游戏的环节,甚至一些运营的解决方案,帮助产品平滑用户体验的链条。这就需要我们设计师不断的了解技术实践的方法和技术的边界在哪里。


最后想跟大家聊聊在AI时代我们设计师应该怎么样面对AI。曾经有人担心AI到来了,我们设计师的工作会被取代,答案是一定的,但是被取代的只是重复性的模式化的工作,AI的发展实际上会大大的释放人的创造力,扩充我们设计的领域。我们也需要在AI不断发展的过程当中发挥我们的专业的知识,同时结合各个领域的知识去解决人们最根本的需求。我想这就是设计师在AI时代的价值。




全部评论:2

更多作品

发表评论

取消

点击右上角
分享给朋友吧

分享到

取消

每人每天仅限5票,快给你心仪的作品鼓励的一票。

投票