.

米唐科技宋少鹏亚马逊帮我找到了基因智东

智东西文

寓扬

随着小米AI音箱元的价格涌入市场,以及阿里京东围绕智能音箱掀起的价格战,国内智能音箱的生存土壤似乎已不容乐观。

而在深圳这个出口导向的城市上演着另一种玩法,众多智能音箱品牌商接入亚马逊Alexa或者GoogleHome,出口海外,力求在国际这个更加成熟的市场中分一杯羹。

米唐科技就是一家专注于智能语音的方案提供商,亚马逊Alexa的官方合作伙伴,目前正在帮助数十家客户落地智能语音交互产品,推动数十万台智能音箱销往海外。米唐科技的发展,代表了不同于国内方案商的另一条差异化之路。

(米唐科技创始人amp;CEO宋少鹏)

10月底,一次偶然的机会,智东西在深圳参加一个会议,偶遇了米唐科技的CEO宋少鹏,其中他关于语音交互与智能音箱的演讲内容让人眼前一亮。会后智东西便与宋少鹏展开一场对话,看看这家公司的海外创收之路。

一、看好音频联网离开谷歌创业

宋少鹏在音频领域已经呆了17年,可谓“沙场老兵”。他本科与硕士都在华南理工大学度过,研究生阶段就从事音频信号处理的研究。而毕业后,他就一头扎进音频信号处理这个领域,在Zoran芯片公司做了8年的数字信号处理(DSP)。全球第一个全套杜比单芯片解决方案就来自这家公司。

后来,年他去了微软亚洲硬件中心,从事硬件产品的研发制造,做过智能摄像头以及Kinnet体感设备等。

而在这期间他发现,智能手机因为连接了网络,给用户带来了无尽的内容、社交、娱乐,进而广泛流行。手机之后,汽车、电视也在连接互联网,继而收到欢迎。

一直做音频产品的宋少鹏发现,在年音频设备还没有联网,但他坚信音频产品的“互联网化”一定是趋势,问题是如何联网,如何承载娱乐、社交。

带着这些思考,宋少鹏在微软内部便开始尝试,但当时行业环境不太成熟,大公司的体制也存在一定的限制。在年认可这个方向后,他便带着团队出来闯荡一番,并在年成立米唐科技。紧接着智能硬件的热潮就来临了。

目前米唐科技是一个由30人组成的精干团队,团队成员来自微软、华为、哈曼、富士康、凡客等,提供全栈式智能语音解决方案,包含嵌入式软件、硬件、App/Skill、电声、产品交互设计等环节,“经常一个人干个人的活”,宋少鹏形容到。

二、亚马逊帮他们找到了基因

年刚成立公司时,米唐科技以品牌和产品切入市场,尝试将音频产品连接互联网,接入了国外的流媒体音乐内容,并通过触控、体感的操作方式优化用户体验,进而销往海外。“它的外形就像一个APP”,宋少鹏形容到。

(方糖WiFi音箱)

这款产品就是方糖WiFi音箱,经历了年的研发,年就销往海外。为了增加销售,年同期米唐团队也推出了同样设计的蓝牙音箱,以谋得更多的利润。而一年数万台的销量显然不能带给米唐更多的发展。

这时亚马逊Alexa平台则成为了米唐的转折点。最初亚马逊Echo以MVP(最小可用原型)的形态交付用户,语音识别和语义理解都仅能满足流媒体播放的简单需求,但是经过一两年的打磨,到了年Echo的体验就好了很多。这时候亚马逊也将Alexa语音交互平台开放出来,宋少鹏第一时间就找到亚马逊,把他们的音箱接入Alexa。

“当时有好多家在接Alexa,我们用了三四个月就搞定了,是全球最早通过亚马逊认证的第三方音箱产品”,宋少鹏谈到。最初,米唐通过的是亚马逊Alexa的按键认证,原因在于原来的方糖音箱不是为远场设计的,采用近场的方式硬件不用做改动,用户通过固件升级就能够享受Alexa的服务。紧接着,年他们的单麦克系统方案支持的深圳Wi-Fi音箱企业DOSS再次通过了Alexa远场认证。

“通过亚马逊的认证后,Alexa团队的人就主动找到了我,问我一年能够卖多少,我说几万台,亚马逊就说做他们的技术方案商,可以帮米唐一年卖几百万个解决方案”,宋少鹏笑称这是亚马逊帮团队找到了方向。

因为米唐是一个技术导向的团队,更加擅长做技术,因此通过与亚马逊的合作,米唐也进行了自身的一次转型,从做C端产品转做B端的方案。米唐也针对亚马逊Alexa的认证标准做了团队的调整,比如增加了用户体验设计,这也是亚马逊所看重的。

三、单麦方案也能比拼亚马逊谷歌

由C端转向B端,米唐科技也由最初的品牌产品转向为客户提供整套语音交互的解决方案。

当讲到其产品时,宋少鹏瞬间便从口袋里掏出了一个PCBA板说:“这就是我们的产品,软硬件一体化的解决方案。”这让我瞬间想到了度秘景鲲曾说的,口袋里没有开发板的工程师不是好工程师呀。

(米唐科技提供的PCBA板)

他介绍到,开发板上的主要芯片模块是定制的,集成了主控+WiFi+蓝牙+降噪模块,交付给业界的包括硬件、软件(整个嵌入式系统、信号处理、声学设计、交互设计等),提供一站式服务,就这个开发板接上麦克风、功放模块、喇叭、电池就是一个Alexa的兼容机,三四个月就可以交货。

而在拾音环节的麦克风阵列上,米唐主要做1麦、2麦、4麦的解决方案。这时宋少鹏又打开手机现场展示了一段在一个嘈杂展馆内的应用情况,现场有三台智能音箱,分别是亚马逊Echo、GoogleHome和使用米唐1麦方案的智能音箱。可以发现在嘈杂的现场环境下,大约1.5米的距离处,使用米唐方案的音箱可以做到80%的唤醒,而Echo和GoogleHome只有60%左右。

通过这样一个案例,可以看到米唐科技的单麦方案效果还是不错的,这也是目前亚马逊Alexa平台唯一通过的单麦克解决方案。“我们在信号处理算法方面有较深的积累”,宋少鹏也谈到,除了技术外,做单麦主要是成本的考虑,包括实际成本、以及生产制造的隐形成本。

当谈及米唐科技相对于同行的优势时,宋少鹏谈到了三个方面:其一米唐做整合垂直的算法,集成商没有他们有算法,有算法的没有他们集成的深;其二米唐能够提供技术、软件与交互的全套方案;其三米唐在算法上“挖”的更深,包括采集、音效等全软件的算法。

针对算法,他也强调了全栈算法的优势。比如,目前很多智能音箱都开始支持通话功能,但是通话语音处理的策略是低延迟高保真,而语音识别可以延迟长一点,尽可能处理掉噪音,尽管处理的算法差不多,但策略完全不一样,这时就要从整体去考虑。

四、面向B端客户提供解决方案

通过亚马逊Alexa的合作,米唐科技的商业模式也由原来的面向C端转向面向B端,为客户提供整套语音交互方案,但同时既有的方糖音箱也独立销售,只是米唐已将全部投入都放在方案上。

具体而言,针对没有技术的客户,米唐能够提供一整套解决方案;针对研发能力较强的公司,米唐也可以出售部分软件,一起完成硬件落地的工作。

而在服务品类上,从今年起,也由智能音箱服务于整个制造业,音箱、耳机、车载都是米唐的发力方向。公司目前正在服务数十家各种类型的企业研发制造语音交互产品,一年出货量累计可达数十万台。

在营收方面,宋少鹏谈到,品牌产品的营收已经占到个位数,基本都在方案上。由于去年整个Alexa的产品没有出货,也主要以投入为主,今年的营收则比去年多了好几倍,目前已经实现了收支平衡。

五、苹果谷歌“包袱”太重

我们总谈到,一家公司的基因有时候就决定了能不能做成这件事。而宋少鹏则用基因论分析了为何亚马逊可以在智能语音上一举成名,相反在语音领域走在前面的苹果和谷歌却慢了很多。

在宋少鹏看来,苹果谷歌的“包袱”太重。比如苹果的Siri尽管很早就推出了,但是它是围绕触摸屏来做的,你问它什么都给你用“文字”来显示,Siri的所有创新都是围绕苹果的既得利益来做的,而正是使苹果取得成功的触摸屏也成为了它进入语音交互时代的“包袱”。谷歌也是如此。

但亚马逊是没有既得利益的,因为它做手机、做平板都失败了。亚马逊的出发点就是语音,它需要找语音最能落地的场景,而美国人对音乐、音箱有天然的需要,以及流媒体的体验,因此音箱就成为一个可落地的点。正因为亚马逊没有既得利益,它从零开始,充分考虑场景和用户体验,才能做到这么成功。

其实这样的例子比比皆是,比如如果


转载请注明:http://www.abachildren.com/xgyy/5031.html