喜提上亿元A轮融资,语音AI芯片羽翼丰满,政通人和蓄势待发
【慧聪教育网】2022 年开年,思必驰旗下的芯片设计企业深聪智能(全称:上海深聪半导体有限责任公司)宣布完成上亿元人民币的 A 轮融资。雅迪科技集团、珠海大横琴集团、元禾控股、苏州工业园区科创基金及思必驰科技股份有限公司联合参投。
这条融资消息不仅对于深聪有着重要的意义,对于整个语音 AI 行业,也是一剂重磅。
我们知道,语音 AI 是人工智能的技术的制高点,行业成熟度高、市场潜力巨大。尤其是在离大众最近的消费级 IoT 领域,正在成为各种终端设备至关重要的入口,在物联网场景中将极大受益。
伴随着这些年语音 AI 市场的变化,深聪在设备本地端用算法定义芯片的优势逐渐地凸显,一度创下五个月流片、成立三年出货数百万片、营收实现数千万元等多项骄人的业绩,各种奖项更是不胜枚举。
这样一家从 AI 独角兽企业思必驰独立出来的芯片公司,是如何在短短的四年里,从破茧而出到羽翼逐渐丰满,其成长的动力和养料来自哪里?在全球资本、芯片、消费电子行业都遭遇疫情和贸易壁垒重创的两年里,又是如何保持蓬勃的生长力?
带着这个课题,我们和深聪智能董事长周伟达做了一次深度交流。
1、一代芯片:从算法中破茧而出
2017 年是「百箱大战」的一年,2018 年是语音算法「硬」化的一年……那些熟悉语音 AI 发展历史的人们,无不被那些年略带魔幻的色彩所感染。
思必驰、云知声、出门问问、Rokid、百度、阿里等以算法取胜的公司,纷纷将算法做进芯片中,推出 AI 专有芯片或模组,以「软硬兼施」的「芯片级算法」,迅速引发了业界的关注。
究其本质,是这些 AI 算法公司在赋能和改造非智能产品的过程中,需要更好地适应算法的硬件载体,一方面便于调优算法,提高效率;另一方面则是出于更优的商业模式的考虑。
但当这些公司纷纷在发布会上慷慨陈词、对新生的 AI 芯片一番赞美之后,我们看到了市场上出现的对立态势:一面是新兴算法公司对于「不做芯片,必死」的豪壮,一面又是传统芯片公司对于 AI 公司推芯片「有量吗」的不屑。
深聪一代芯片 TH1520 就是在这样的背景下诞生的。之后,它发展得很快:
2018 年 3 月,携手中芯国际搭建团队
2018 年 8 月,成功流片
2018 年 11 月,芯片点亮验证
2019 年 1 月,深聪一代 AI 芯片 TH1520 正式亮相
2019 年 4 月,量产光罩流片
2019 年 7 月,量产版芯片点亮
2019 年 12 月,因为这枚芯片,深聪荣获「年度 AI 芯片领域最具影响力企业」
目前,深聪的芯片已在智能家居白电、黑电、车载、穿戴、办公、楼宇等场景逐步实现了产业化落地。
复盘 TH1520 这颗为深聪立下汗马功劳的芯片,周伟达为我们总结了三点成功之处:
首先,一代芯片市场定位明确,瞄准的就是那些需要智能化的产品市场。其次,基于思必驰全链路「云+芯」的能力,一代芯片在语音 AI 体验上获得了市场认可。再次,则是速度致胜,快速推出、快速量产、快速应用。
2、二代芯片:用算法定义芯片,羽翼逐渐丰满
伴随着一代芯片的快速落地,整个行业对于语音产品的发展趋势和使用体验,也逐步表现出更多的认可。
此时的市场需求也开始出现变化。最初只有大厂敢上语音 AI 功能,并且还只是一些拳头高端产品,用于探索市场。但从去年开始,中低端产品语音智能化的速度加快了,甚至一些中小品牌甚至白牌产品,为了跟大品牌去打竞争、打差异化,也主动在语音 AI 体验这个方向上寻找差异化。
响应市场需求,2020 年 5 月,深聪全新定义的二代芯片 TH2608 正式推出。相较于一代,二代在各方面都有了显著变化。
定位的变化:
一代芯片是基于通用的 Arm 芯片实现语音交互,是依附于主控芯片的专用芯片;而二代芯片则是以语音专用芯片为主、通用芯片为辅。
这一变化与市场需求的变化是息息相关的。周伟达告诉深圳湾,在前两年和客户打交道的过程中,深聪团队发现,智能家居、智能车载、智能会议等产品在加入语音专用芯片之后,原有的系统还需要增加连接类和控制类的功能,比如空调等带有开关的家电。
过去的做法是需要通过多个芯片组合完成的,而如今,深聪将这些功能集成在语音 AI 芯片内了,除了语音交互功能外,还加入了 MCU,包括控制、显示、Wi-Fi、蓝牙等模块都被集成在一个 SoC 方案里。
侧重点的变化:
越来越多的用户开始习惯用语音交互代替遥控器,比如,用语音命令开关家电、用语音命令接听和拨打电话、用语音命令调用手表的功能等。市场对于低功耗的具备离线语音交互功能的需求快速增长。
为同时满足市场对于离线专用芯片和语音主控芯片的不同需求,深聪在推出二代芯片时,准备了两颗不同的芯片,它们都将陆续在今年上市。
算力的加强:
深聪的算法能力包括指令识别能力、情绪识别能力、声纹识别能力、语音合成能力等。在这些能力之上,深聪陆续推出了超远场降噪、全双工交互、直面唤醒、以及多语种和多方言混合的 AI 模型。
分布式组网,唯一唤醒
通过算力的提升,降低算法所占用的资源和消耗。一代芯片本地占用的空间是 3M 左右,而到了二代芯片,通过计算效率的提升,内存降到了原先的三分之一。
算力的提升体现在芯片架构的变化上,一代芯片采用的是指令加速,有时候为了弥补算力不足还需要外挂两个 DSP,而二代芯片直接用的独立 NPU。
多维交互,下一个方向:
当下,AI 芯片在多模态方面的演进路线也十分明显,这也成为了深聪下一代芯片的规划重点。
周伟达指出,语音、图像、手势等交互方式的交融极大程度降低了用户的 AI 体验门槛,而伴随着元宇宙概念的兴起,从语音合成到 2D 动画合成,再到 3D 数字人合成,将进一步提升用户的交互体验。
深聪正在从以循环网络为主的语音序列信号处理,逐渐过渡到以 CNN 和卷积网络相结合的信号处理,并逐步实现算法的芯片化。实际上,深聪二代芯片已经能够支持大规模的 CNN 加速运算了。
3、算法厂商 vs 芯片厂商:殊途同归后的竞争
从周伟达的总结中我们可以看出,以深聪二代芯片为代表的语音专用芯片,正在进化为功能更加强大的、带有多个处理单元的、单芯片系统集成方案,同时软件也从驱动进化为操作系统。
这种一颗主芯片 + 少量外围芯片的 SoC 交钥匙方案,将成为芯片行业发展的必然趋势。也是类似语音 AI 这样的专用芯片在未来 10 年的必然之路。
从中我们还可以看到,语音 AI 这样的「外围」芯片,正在以一种「反客为主、逆向包抄」的方式,做能力整合。而传统的嵌入式芯片厂商如 MTK、高通等,也正向 AI 方向做集成。
最初算法厂商的确在 SoC 能力上不如传统芯片厂商,在 AI 专用芯片方向上切入,最后再与传统芯片厂商殊途同归。最终比拼的就是各家的产品和市场竞争力。
而对于 AI 厂商和芯片厂商「殊途同归」后的竞争格局,深聪非常有信心。
一方面,在周伟达看来,未来 AI 在 SoC 中地位将逐步增强,甚至成为大头,在 SoC 有限的空间和资源中,代替传统的已经成熟的模块。
另一方面,AI 厂商用算法驱动芯片设计,在产品方案上具备更多创新性,芯片验证也更加灵活。
所以,曾经不被看到的 AI 算法厂商做芯片,在深聪这里已经是「别有一片洞天」了。
4、下一波市场先机:远程会议、两轮电动车,语音 AI 落地新场景
疫情的发展为语音 AI 开辟了很多新的落地场景,远程会议就是其中最重要的应用方向之一,也是深聪在家居和车载之外,新开辟的一块市场。
去年思必驰发布了会议场景使用的轻便级智能全向麦克风产品,兼具智能降噪、录音存储和语音转写等功能,针对远程会议办公场景,解决远场麦克风降噪和会议音效问题。据悉,思必驰针对学习会议场景的全新品牌也将在近日推出。
思必驰会议魔方 M1 | 远程会议已是日常,多功能会议魔方可以帮忙
深聪快速发现市场刚需,快速切入市场,通过合作研发的方式,快速拿下了 40 多个项目,目前已经上市的产品超过了 20 款。
除此之外,在深聪的融资公告中,新一轮的投资方雅迪科技集团将采购深聪的芯片用于两轮电动车的智能化升级。
相比电视、小家电、可穿戴、会议办公等领域,两轮电动车是一个崭新的语音 AI 应用的新领域。也是语音 AI 应用落地的一个非常好的新市场。
从市场规模来看,两轮电动车比四轮乘用车的总量还要多;从使用场景来看,语音 AI 又能解决骑行中双手被占用时、人与设备交互的刚需。
在前期的调研中,深聪发现,诸如骑行中接打电话、骑行中的专有路线导航等,都是用户急需使用的功能。
在落地的过程中,深聪借鉴了很多在四轮电动车做车载语音的经验,再就两轮电动车的独特使用场景做改造。
同时,鉴于两轮电瓶车都要配备头盔,如何将头盔与电动车做智能化连接,从而实现更多进阶的智能骑行功能,这成为深聪的研发方向。
与其他 AI 公司不同的是,深聪面向两轮电动车的智能语音解决方案,还没有推出之前,就已经有了成熟的客户、潜在的大市场。
5、落地有声:产品核心竞争力 + 服务!服务!服务!
在深聪的重要客户里,美的、海信、雅迪、盯盯拍,几乎每一个客户都代表了一个应用领域。在语音 AI 芯片的产业化落地中,深聪在很多领域都拿到了市场第一。
截止目前,深聪智能的智能芯片解决方案已经广泛用于智能家居、智能车载、智能办公等方向。同时深聪芯片积极拓展海外市场,目前已经获得 Amazon AVS 认证和 Microsoft Teams 认证,去年采用深聪智能芯片的第一款智能空调也已经在海外市场正式上市销售了。
在智能家居方向,目前深聪智能的芯片解决方案已经覆盖电视、空调、冰箱、洗衣机、油烟机、蒸烤箱、热水器、浴霸、智能魔镜、电视盒子、投影仪、智能中控、智能面板、智能音箱、取暖桌、茶吧机、智能晾衣架、扫地机、空调伴侣、智能插座、智能语音遥控器、语音电梯、智能楼宇对讲机等全系列产品。在车载方向,已经支持双音区方案、四音区方案、智慧屏、行车记录仪、智能报警器、车外语音控制器等产品。在智能办公方向,落地的产品主要有会议音箱、视频会议 Soundbar、智能云台、智能商显、智能平板、智能终端机、智能售票机等。
在被问及拿下这些关键客户和重点市场的关键砝码时,周伟达简单概述了前面提到的产品核心竞争力之后,重点强调了深聪内部是非常重视服务的。
鉴于语音产品的创新性和复杂性,需要团队分工协作、全程参与,这就要首先具备服务的心态。
其次是要将产品方案标准化、工具化。客户甚至不用写一行代码,直接将深聪的芯片拿过去做一些简单的配置,就能体验到语音功能。而对于验证和优化,也是可以直接在产品内完成的。
纵观行业竞品,无论是云知声、讯飞聆思、百度鸿鹄、阿里平头哥,各自都有算法的积累,也都在 AI 方向上用软件定义硬件,但最终谁将取胜,就要依赖于市场定位、产品体验、落地能力等综合竞争力了。
其实,语音这个市场足够大。周伟达拿出了一些市场数据给我们参考,比如,电视的语音交互渗透率已经达到了 60%~70% 了,但空调只有 1-2% 渗透率。所以,市场是有足够的空间让大家去发挥的。
6、展望:政通+人和,然后是走好自己的路
虽然周伟达曾多次出现在深圳湾的技术交流活动上,但在他的简历上,我们还是第一次留意到有这样几个带有学术背景的标签——博士、教授、论文、专利。
本来可以成为科学家的理工男,但是却走上了创业的道路。这不禁让我们想起了最近热议的话题——科学家创业。
对此,周伟达认为,一方面,科学家做高科技产品,相对普通创业者来说还是有一定的背景优势的,但做学术和做企业是很不一样的。
做企业是商业化行为,需要围绕着经营目的,在有限的时间、用有限的资源、在有限的客观条件下,做出相对最好的产品,获得市场的认可,是一个系统型工程。做学术则更加专注于技术创新和技术突破。
做企业很重要的是管理,定战略、搭班子,在最短时间内完成商业化验证。做学术则更重视流程和资源的管理,强调井井有条,循序渐进,厚积薄发。
深聪是一家「从算法起家、又由算法驱动」的芯片团队。团队中有一半的人做软件和算法,目前是 80 人的规模,计划年底突破 100 人——在芯片研发团队中,这样的规模已经不小了,周伟达说。
算法是灵魂,芯片是框架,二者深度融合,打造 「云+芯」整体解决方案。
这是深聪在创立之初就确立的公司战略。深聪的专注方向是端侧芯片,端侧芯片就意味着芯片要实际落地,要能大规模地在客户的产品中使用,深聪对这条 AI 芯片道路坚定不移。
在疫情全球扩张、中美关系紧张、芯片出货量紧张的特殊情形下,无论是传统芯片公司、还是类似深聪这样的新创 AI 芯片公司,在这两年都获得了很好的发展空间。
国家也给了很多政策支持,比如,解决国内芯片卡脖子的供应链问题。再加上资本方的支持,芯片的投资力度加大等等。
这些有利的条件,催生了很多企业加入到国产化替代行列,整个环境无疑是非常乐观、非常有发展空间的。
外部环境利好,内核实力也相当。周伟达认为,目前中国的 AI 能力与国外相比,无论是芯片层面还是算法层面,差距并没有那么远,创新其实是与国外同步进行的。
正所谓,政通人和。深聪的发展赶上了好时候。深聪也将把握住大好时机,走好自己的路。