人工智能首页 > 语音识别 > 正文

必须是自主可控的繁荣生态，才有中国通用人工智能大未来

2024-07-04 阅读3次

　　科大讯飞董事长刘庆峰在发布会上表示，语音将成为万物互联时代人机交互的主要方式，人机交互最重要的场景是远场、噪声、多人说话、多语言，因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。

　　近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来，过去十年我国人工智能领域的首个国家科学技术进步奖一等奖

　　基于科大讯飞全球领先的多语种语音技术，星火语音大模型迎来新突破。面向万物互联时代，新增多语种、多方言免切换语音识别能力，可支持37个语种、37种方言“自由对话”。

　　其中，37个语种识别效果领先OpenAI whisper-V3，37个方言识别效果平均提升30%。现场，科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果，能让输入效率提高。

　　同时发布软硬件一体化讯飞同传系统，可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备，佩戴后即可实时收听多语种AI同声传译。

　　针对强干扰场景下的语音识别难题，科大讯飞突破了多人混叠场景下的极复杂场景语音转写，即使在三人混叠说话场景也能实现86%的语音识别准确率，远超全球其它竞品。

　　科大讯表示，未来基于多模态的声音识别技术，将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。

　　赋能行业的同时，讯飞星火大模型也不忘助力开发者生态蓬勃发展。据公开数据显示，自今年1月30日讯飞星火V3.5发布以来，短短5个月，星火开发者生态加速增长，开发者数从598万增长到702万，新增超104万;海外开发者数超40万;大模型开发者达57万。

　　“今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的，在这个时代，做帝国注定要衰落，只有生态才能生生不息;必须是自主可控的繁荣生态，才有中国通用人工智能大未来。”谈到生态繁荣，刘庆峰表示。

AI教育