人工智能时代,语音和视觉则成为了一条全新的路径
人工智能首页 > AI资讯 > 正文

人工智能时代,语音和视觉则成为了一条全新的路径

2018-08-25 阅读888次

  在 PC 年代以及移动互联网年代之后,人工智能正在成为人类下一个开展阶段的主旋律。但跟着年代的更迭,人机交互的方法也在悄然发作着变化。

  PC 年代的主角是鼠标键盘,移动互联网年代是触控,到了人工智能年代,语音和视觉则成为了一条全新的途径,这一同也意味着人机交互的开展正在向着「以人为中心」的方向发作改动。

  从 2014 年建立至今,小鱼在家现已走过了四个年初。在曩昔的几年里,以人为中心的家庭应用场景一直是其坚持去做的工作,而陪同、记载以及帮手这三个功用也一直贯穿在小鱼在家各个产品中。

  本年一月份,在美国举行的 CES 展会上,小鱼在家联合百度正式发布了拥有长途视频通话以及语音交互功用的 VS1 智能视频音箱。它不只让人机交互这件工作变得愈加简单,一同也为家庭运用场景供给了更多的可能性。

  那么,在人工智能年代,小鱼在家是怎么去考虑人机交互这件工作的?新技能的应用,又将为产品端带来哪些全新的可能性?在极客公园举行的 Rebuild 2018 大会上,小鱼在家创始人&CEO 宋晨枫给出了他的答案。

  以下是小鱼在家创始人&CEO 宋晨枫在极客公园 Rebuild 2018 科技商业峰会上的讲演实录(经过极客公园编辑,略有删减):


  十年前我离开了微软回到国内,榜首次创业,做的榜首个公司是 3D 虚拟国际途径,这家公司在 2011 年的时分卖给 YY。2014 年我离开了 YY,创办了小鱼在家,期望用人工智能改动家庭日子。咱们用了四年的时刻,三个城市二百多号人,融资超越了 10 亿元。本年咱们跟百度推出了新产品,进入到了现在的智能音箱商场。

人工智能时代,语音和视觉则成为了一条全新的路径

  跟着人工智能技能的不断推演,咱们实践上不断从头界说咱们这个产品,寻觅真实可以落地家庭的品类。咱们笃定家庭这个场景,实践上有两个最中心的原因。

  榜首个原因是我国家庭的问题多、时机大,像咱们 70、80、90 这一代独生子女,大部分不好爸爸妈妈日子在一同,由于很忙,也没有太多的时刻陪同孩子。实践上每个家庭都需求一个靠谱的家庭帮手,终究形状可能就是机器人。咱们在科幻著作里看到,不论是《钢铁侠》中的贾维斯,仍是《西部国际》里的接待员,我情愿去信任,这个就是咱们的未来。当然还需求许多的时刻和途径完成它。

  第二个原因,正是技能的行进在给咱们时机去从头界说产品,去重塑用户体会,再开立异的品类,技能才是这一切的根本驱动力。曩昔的几年,语音、语义、机器人视觉都有巨大的腾跃,我信任科技还会继续的以指数级的速度去开展。今日人工智能在算法、在算力、在数据,都在快速演进着。

  创业公司要看五年,想三年,好好做好一两年。咱们期望咱们进入这个商场范畴,开展到五年的时分,能进入到迸发期。三年的时分现已开端高速开展,这样可以让咱们提前两年去探究、去验证,等时机降临的时分,咱们现已准备好了。

  小鱼在家用了三年的时刻,做了 2.5 代的产品去验证,去了解用户的需求,去提升咱们的认知,去补充咱们的才能。在第三代产品的时分,小度在家带屏智能音箱发布之后,咱们基本上踩对了点。但这这个过程中,咱们也犯差错,我想把咱们怎么考虑产品规划和技能道路规划的一些主意,共享给咱们。


  以用户需求为导向,寻觅差异化价值

  先说说产品道路,一路走来咱们都在职业的最前沿,没有他人成功的经历可以学习,只好被逼着去考虑产品的最中心逻辑,要从用户动身,去考虑咱们在哪里可以去建造差异化的价值,而且还可以远远超越用户的预期。

  榜首代产品咱们定位是家庭智能陪同机器人,这代产品咱们选的这个点,就是一个一呼即通的家庭陪同体会,可以让在外的家人,经过他的手机,三秒回到家里陪同他的老人和孩子。榜首代产品里边的帮手,是一个十分辅助的功用,其时的技能并不成熟,体会还十分的糟糕。咱们的榜首代产品,用户的口碑十分好,但实践上销量并没有到达预期,后来咱们总结有两个过错:

  榜首,咱们没有考虑本钱,把产品做得太贵了,其时卖 3000 多块钱。

  第二,就是这个品类的定位,咱们一味的去寻求完成咱们作为产品司理的一些主意,没有考虑供应链,成果就是把受众缩小了。一同,咱们给用户设置了十分高的心思预期,却没有到达。

  第二代产品兼顾鱼主要是处理咱们的本钱和定位的问题。首先本钱降了一半,然后咱们尝试了两个定位,一个就是陪同孩子,别的一个就是视频通话。但咱们最终仍是抛弃了这个产品。首先是孩子的留存比较难,其次是公司的资源有限,咱们没有办法去拓展那么多的产品线。

  经过前两代产品,咱们总结了三点经历:

  榜首,用户对语音交互给他们带来的便利性,其实是十分的认可的。尤其是老人和孩子,他们在家里会十分自然地开端和一个设备进行语音对话。

  第二,家庭场景里边的这种内容消费需求是巨大的,而电视和平板电脑其实只满意了他们的部分需求。谁可以在家庭的场景下,可以愈加快捷地把家人所需求的内容,愈加快速精确地推送,实践上有可能成为在家庭场景下,用户消费内容的一个新宠。

  第三,用户最重视的价值,正是咱们榜首个产品做的「家庭的陪同」。分离其实几乎是我国家庭的常态了,可以三秒钟回到家里,彻底推翻了之前这种靠打电话然后等候接听的这种体会。


  咱们在做第三代产品的时分,其实语音技能现已是相对成熟了,咱们也看到在我国的商场,智能音箱这个品类现已有快速开展的预兆,于是顺势进入到这个途径里边去。

  小度在家是个百倍易用的带屏智能音箱,在它身上语音交互、屏幕辅助,加上摄象头的辨认,这些才能组合产生了化学作用。它不但可以一望而知地把用户问询的答案展现在他的面前,还可以把语音答复和屏幕展现动态协作,比如说你听歌的时分可以翻滚歌词,比如说介绍一个人物的时分,显现他的图片。比如说他念字发音的时分,把这个字的笔顺显现出来等,还可以通知你有什么功用,接下来你可以怎么向它发问,去探究愈加丰厚的内容和效劳。咱们这一次其实和百度的深度协作,也引入了十分有价值的内容和效劳,比如说百度查找、百度地图、百度百科、图片等等。

  小度在家仍是一个智能小电视,咱们可以彻底用语音控制,想看什么片子直接说就行了,再也不用摇控器。咱们让视频通讯愈加快捷,可以语音控制,你可以语音去拨打和接听,当然仍然支撑多方高清视频同话,还有一叫即通的功用,推翻了家庭之间陪同的体会。咱们更可以随意摆放,比如说在厨房边煮饭边追剧,在餐桌边吃早饭边看新闻,放在书桌上面边写邮件边看国际杯。

  在我看来,智能音箱的商场战役,不只仅是产品比拼,而是包含品牌、途径、内容以及效劳在内,整个生态的比拼。

  在技能开展道路上的考虑

  接下来说一下咱们在技能开展道路上的考虑。咱们地点的这个范畴,语音和语义是改动智能交互的中心技能。其实 2014 年之前,做语音技能的公司不多,而深度学习把咱们都拉回到了同一个起跑线上。

  其实经过和百度的深度协作,在包含小度在家甚至更早的小鱼在家这些产品上,咱们现已打造了十分好的语音交互体会。而处理语义了解,成为了未来开展的中心。

  前边我从前讲到,小鱼在家历来是以用户为导向,假如在某些方向上咱们做不到最好,可是对用户体会十分有协助,那么咱们会尽力去和可以做到最好的厂商协作。

  由于许多这些技能,未来可能都会变成一些敞开的根底才能,假如咱们做的没有他人好,反而会变成行进道路上的包袱。咱们只要专心用户价值,扩展用户规划,在用户体会遇到问题的点上,去找到技能打破的方向才是更好的挑选。

  对于一家做硬件产品的公司而言,其实终究仍是需求去看产品的出货量。从小鱼在家的视点来讲,可以顺利经过做硬件的雷区走到今日,其实自身就是一个巨大的壁垒。


  「多模态交互体会」是人工智能落地最高效的一种形式

  最终,说一下咱们在多模态方向的探究。记住 2016 年在美国做演示的时分,其时吴恩达说过这样一句话:人和机器沟通最高效的方法是经过语言,而机器跟人信息传达最高效的方法是经过语音和视觉的辅助。

  咱们在曩昔 3.5 代产品的时分做了 4 次大的迭代,Fish UI 4.0 的实践上是一个巨大的革新。咱们把语音交互变成了设备最主要的沟通方法,而触屏变成了彻底的辅助功用。

  毫无疑问,多模态交互是人工智能落地的愈加高效的形状。在小度在家的产品发布会上,李彦宏将现在的无屏音箱比作了收音机,而带屏智能音箱则是电视。咱们信任,跟着整个的生态、内容效劳的演进,以带屏智能音箱为代表的多模态交互,会是未来人工智能交互的干流交互形状。

  今日人工智能仍旧处于向前开展的年代,技能的行进会继续的推动着咱们去重塑用户体会,从头界说品类。咱们以为,人类对智能音箱这个品类的认知,在未来会发作很大的改动。

  而人工智能落地家庭,会带来巨大的、原生的新的途径时机。多模态的交互给一切在座的开发者,都供给了一个十分巨大的开展空间和舞台。改动国际的不只仅是技能,更有技能背后的价值观、任务和愿景。最终期望咱们一同打造人工智能落地家庭的未来。



随意打赏
WeixinPathErWeiMaHtml
ZhifubaoPathErWeiMaHtml