必须是自主可控的繁荣生态,才有中国通用人工智能大未来
科大讯飞董事长刘庆峰在发布会上表示,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。
近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年我国人工智能领域的首个国家科学技术进步奖一等奖
基于科大讯飞全球领先的多语种语音技术,星火语音大模型迎来新突破。面向万物互联时代,新增多语种、多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。

其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率提高。
同时发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备,佩戴后即可实时收听多语种AI同声传译。
针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率,远超全球其它竞品。
科大讯表示,未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。
赋能行业的同时,讯飞星火大模型也不忘助力开发者生态蓬勃发展。据公开数据显示,自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。
“今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的,在这个时代,做帝国注定要衰落,只有生态才能生生不息;必须是自主可控的繁荣生态,才有中国通用人工智能大未来。”谈到生态繁荣,刘庆峰表示。
