子弹短信是语音辨认技能的一次很有意义的测验
今日子弹短信的下载量打破四百万,再次掀起热潮。自锤子科技推出以来,短期内现已取得各大组织融资1.5亿,可谓是创投的冬季的一股热流。就技能而言,子弹短信是语音辨认技能的一次很有意义的测验。

经过这款APP,咱们能够明晰看到语音辨认是怎么进步通讯功率的,也能看到语音辨认技能的最新运用。语音辨认是一项技能,意图是将人的语音对话转化为文字。这项技能有许多运用,特别是人机对话领域。实际上,即使在人与人的通讯中,语音辨认也能够扮演重要人物。
咱们知道,语音播放是线性的,必须将它逐字放完,听者才能把握它的完好信息。因而,作为信息摄入方法,收听语音的功率很低,远不及阅览。阅览即使做不到目下十行,也能够一目数行,其速度数倍于收听语音。在即时通讯的场景下,为了功率,人倾向于选择阅览。但是,文字的键入是费时吃力的,其功率又远低于语音输入。有了语音辨认技能,咱们能够将语音输入和文字阅览结合起来,用语音发信息,用阅览阅读信息,让通讯愈加便当。 那么,即时通讯对语音辨认技能有什么要求?最重要的当然是准确率。现代语音辨认技能在规范测验环境下准确率能够到达95%以上,似乎阐明该项技能具有了适当的实用性。
即使过错偶然发作,通话者也能够在文字上做简略修正,并不太影响输入功率。但是,95%的准确率是在规范测验环境下得出的。别忘了,许多人说话有严峻口音,并且中国方言许多。在严峻口音、小众方言、背景噪音的环境下,现在的语音辨认技能还远达不到人的期望,这一点严峻约束了语音辨认在即时通讯中的运用。除准确率之外的另一项目标是速度:通话者期望在话说完之后瞬间完结文字转化。
在现代硬件的支撑下,这一点是比较简单做到的。部分手机上现已布置了最新的人工智能芯片,即使运用杂乱的语音辨认模型,也能够以亚秒速度完结文字转化。因而,速度不再是问题。 其实,大部分即时通讯软件都供给语音辨认功用,并在上面挖空了心思,比方微信。但由于准确度的约束,用户体会难以到达完美,大部分厂商对语音辨认功用的推行还显得比较保存。
总归,即时通讯的语音辨认现已适用于许多场景,但并非一切人和一切场景。要处理口音、方言、噪音等问题,还需持续等候技能的日臻完善。
