快速一键发布
手机号码*
验证码*
联系方式只用于平台与您联系,牛选时刻保障您的隐私安全
需求描述*
确认发布
取消

拉上阿里云,Rokid开放平台会有什么不同?

亿邦动力网   亿邦动力网阅读:276赞:02017-10-12

Rokid发布了两套分别搭载Linux和Android操作系统的开发套件,完全开放给开发者及合作伙伴使用。

【亿邦动力网讯】科大讯飞、百度、思必驰、Rokid……“百箱大战”的结出来的果子难道是开放平台?

今天,Rokid创始人兼CEO祝铭明在云栖大会上宣布,Rokid(若琪)将与阿里云共同推出全栈语音开放平台,为业界提供一站式语音解决方案。

此次,Rokid发布了两套分别搭载Linux和Android操作系统的开发套件,根据需要选择阿里云或Rokid的语音服务,双方共享海量语音技能,完全开放给开发者及合作伙伴使用。

这套方案不仅适用于智能音箱,也能够覆盖语音全行业:玩具,汽车,电视,机顶盒等任何设备,都可以搭载,已经开始为海尔,长虹,暴风,中兴等知名厂商提供语音解决方案。

在云栖大会的演讲中,祝铭明强调并未被阿里巴巴收购,但其透露成立之初便在与阿里云紧密合作。

据亿邦动力网了解,祝铭明曾在阿里巴巴工作四年,后创办Rokid,如今公司已经推出两代智能音箱产品,用户每日平均使用时长1小时,日活50%以上,复购率为85%,累积了数万名用户的体验。

为什么要开放?

祝铭明:AI技术有一个特点,当你打造完一个产品以后,如果一家公司做端对端的细节打磨会沉淀出一个全栈的技术能力,这个能力一定是过剩的。

因为AI时代无法像手机时代一样单一的产品形态去赢得整个战场。我们能够做好自己的1到2个产品就是非常不易了,所以我们也会专注在自己的产品方向,专注在自己极致的产品体验的产品。

所以当一家公司不可能分散各种精力去做不同产品,你要具备全栈能力的话要怎么办?

我们有三年的积累,以及我们对于用户体验的理解和细化,我们将这种能力在今天通过阿里云的大平台分享给整个产业。

这个方案是什么样?

Rokid的语音智能的解决方案有什么特点?

祝铭明:我们就将我们在产品上这么多年的打磨的能力百分之百分享给所有人,所以定位成一个ALL-IN-ONE全栈语音智能方案,之前往往是指硬件软件以及端上的体验,我们还包括云端的内容以及跟阿里云合作,整个IOT都会打包在这个方案里边给到大家。

硬件

上面是一个LED灯的指示,有12个LED灯可以指示方向和状态,我们有两颗、四颗跟六颗麦克风,都集成在此。

整个解决方案包括通信、技术、蓝牙、GPU、CPU以及麦克风贞烈、信号处理、整套算法,还包括跟云端的合作,跟IOT设备的互联互通。

一个3.5毫米的音频输出,传统的耳机输出,这是接口。这么小的设备里边是可以接Micro HDMI显示输出,可以直接接电视接显示。Type-C电源调试,还可以对外输出充电。

合作伙伴的开发板,这个开发板可以用在一些交互比较复杂和丰富的产品上,电视、车载等任何比较有想象力的产品上。

用这样的开发板开发会是一种什么样的场景?你有一台笔记本,可以进行USB充电,接上耳机,所有的东西都在了。

定义的是要精简、漂亮、强劲、完整,这是一个完整的开发套件。如果你们用这个方案,你们自己可以打造完全属于自己的。如果大家真的不愿意做更多的变化,唯一需要的是加一个壳子。

工程师基本上就用这个在开发和享受的,甚至有爱好者拿这个东西,就把他家里的传统的普通音箱变成了智能音箱。

这是扩展板,有一些特殊按钮的操作,它有GPIO口,还有红外遥控接收,还有USB2.0的扩展口,还有Type-C。

软件

在软件之上,语音和语义大家比较关心,Rokid会将什么样的能力开放给整个业界?麦阵技术、信息分析处理、语音识别、语音合成、语义理解、自定义唤醒词,自己要花几十万,甚至上百万,每一个用户不需要训练,就可以进行直接的定义,这在全球是一分为二的技术。

如果你设计这个产品,已经不需要喊若琪或其他东西,包括用户想要叫它叫什么就可以。

声纹识别可以让你认识家里的每一个人,个性化语音合成,当你用一个人的声音3到5分钟,训练的时候这台设备就可以完全适应。

还有一个技术是语种识别,当你跟它讲中文,它就跟你讲中文;当你跟它讲英文,它就跟你讲英文,不需要重新配置和重启。包括大家对于自己的特定场景的自然语言的一些对话,大家可以做医疗、咨询、客服、餐饮等任何方面的东西,我们会提供这样的引擎给大家。所有的东西都全面开放。

所以,Rokid有什么,你们就有什么。这个开发套件的整套方案将和Rokid共享整个平台,我们产品具备的能力第一天就同步出来。

内容和服务

今天不仅仅是有基本的东西,如果大家有兴趣还可以挑选这么多内容和服务。这里边也列出来了一些,音乐、有声书、儿童故事、新闻、IOT、实时翻译、购物和支付、天气、医疗、时间日历、行事历、闹钟、汇率、外卖、快递等。

最近美国最新做了一个成果,完全支持无限制对话的语言游戏,你们买我们的产品升级以后就可以玩游戏《狼人杀》,可以进行主持,还可以做小孩的数学教学活动,这都是突破当前语音和语义能力的无限制多人对话的技术,这种技术都会提供给大家,就在这个套件里边。

拿这个套件可以做什么?

祝铭明:大家可以看到阿里小智、小米、Lifesmart、Broadink,以及正在因为合作的合作伙伴,这个产品已经具备了这些能力。

在端上,语音的结构和麦阵与性能是直接相关的,这些东西有很多公司要花一年甚至两年的时间才能够调优,今天我连ME、EE都会用到它。包括AI端上计算(信号处理、自定义唤醒、噪音、回声消除等)都会在架构上完成。包括我们最近上GPU的人工智能的芯片里进行处理。当然包括操作系统,你要开发自己的应用,保证计算能力的情况下,可以尽量地制造出更贴近老百姓价格的产品。

所有的设计都是开放的,如果你觉得Rokid不够好,你觉得自己的能力够强,也可以将它换掉,我们会把所有的东西向大家开放。

当然,这些能力还不足够好,所以在端之外还有一个语音的概念。包括AI的计算服务,语音识别、语义世界、语种识别等诸多的语音的计算全部会公开。

这里有两套方案,一套是阿里自己的DST人工智能方案,一套是Rokid的方案。如果你有本事也可以换掉,因为这些都是开放的。包括我们的游戏、音乐、有声读物、新闻、天气等智慧的东西都会向大家开放。第三方的内容和服务也会有,所以我们有完整的全栈的开放。所有的东西都不会被绑死。

70%操作系统和框架代码,100%的EE和ME设计全部免费。所以这是我们希望给产业带来的一个不一样的概念。

标签:

作者: 亿邦动力网

来源: 亿邦动力网

免责声明:本文仅代表作者本人之观点,电商头条网发表或转载此文只是出于传递更多信息之目的,其原创性以及文中陈述文字和内容未经电商头条网证实;电商头条网对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如其他媒体、网站或个人从电商头条网下载使用,必须保留电商头条网注明的“稿件来源”,并自负版权等法律责任。电商头条网倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至电商头条网客服邮箱;service#hotniu.cn(请将#改成@),我们将及时沟通与处理。
侵权投诉反馈邮箱:service#hotniu.cn(#改成@)

  • 今日头条
  • 本周头条
  • 本月头条