科大讯飞离线语音识别_科大讯飞联合生态伙伴推出全新专用语音芯片 CSK400 系列,算力达 128GOPS...

作者 | 伍杏玲 出品 | 程序人生(ID: coder_life) 人工智能经历 60 余年的发展,近年来它的发展方向有所改变:从 2016 年开发者关注 人工智能的算法、算力、大数据等方面,到 2017 年关注 人工智能的场景应用,2018年则是实现人工智能的价值落地。

099748a0affb37e0bc8457f608e0cff4.png

作者 | 伍杏玲

出品 | 程序人生(ID:coder_life)

人工智能经历 60 余年的发展,近年来它的发展方向有所改变:从 2016 年开发者关注人工智能的算法、算力、大数据等方面,到 2017 年关注人工智能的场景应用,2018年则是实现人工智能的价值落地。

那么我们在衡量人工智能价值兑现的标准是什么呢?是比赛第一?是调用次数?是演示效果?还是技术指标?

据科大讯飞董事长刘庆峰表示,我们应从三个方向来衡量人工智能技术的价值:是否真实可见的实际应用案例;是否能规模化推广的对应产品;是否能统计数据证明的应用成效。

那么如今人工智能的发展现状符合以上标准吗?

10 月 24 日,第二届世界声博会暨 2019 科大讯飞全球 1024 开发者节在合肥召开。科大讯飞董事长刘庆峰、科大讯飞轮值总裁胡郁、科大讯飞AI研究院常务副院长刘聪等专家集聚一堂,共同探讨人工智能前沿技术与应用。

a25d80f605444771a6140446e6ddc357.png

全新专用语音芯片 CSK400,算力达 128GOPS

刘庆峰表示,如今的人工智能绝不仅是用来做锦上添花的趣玩应用,而是能解决人类的刚需和应用,例如在教育、医疗、司法、翻译、家政、农业等行业里,帮助听障人士、视障人士、年迈老人等解决其刚需。

他表示,“人工智能将会被更深刻地载入史册。”

对此,针对家电领域,科大讯飞发布与联合生态合作伙伴打造的家电行业专用语音芯片CSK400系列,其集成讯飞语音算法,算力达到128GOPS,通过深度神经网络算法来解决家居的噪音问题,支持本地化远场交互,并支持200个唤醒词作为命令词。

该芯片上植入了全栈语音能力,涵盖降噪、回声消除、语音分离、本地和云端语音识别、本地和云端语音合成,以及在线全双工交互能力。基于CSK400 系列,科大讯飞为家电提供的完整AIoT产品栈,推出“云+端”双麦AIoT模组(XFHEA-C-332)和高性价比离线方案,其中离线方案包括本地化双麦模组(XFHEA-221-LX)和本地化单麦模组(XFHEA-121-LX)。

此外,科大讯飞还希望助力家电厂商构建自有AIoT云,以更好地服务消费者。同时,面对中国家电企业积极进军海外市场,科大讯飞将对家电厂商开放包括粤语、英、日、韩、俄、西等十多种方言和多语种识别和合成能力,希望利用其语音翻译优势助力中国家电厂商“走出去”。

f27897df4074e2840f6d98187ff62d6e.png

物联网平台iFLYOS 2.0升级

科大讯飞不仅在AI技术上推陈出新,随着物联网的蓬勃发展,科大讯飞消费者BG副总裁于继栋表示:“AIoT已成为科大讯飞的核心战略之一”。

由此,科大讯飞于2018年推出基于云端的智能物联网操作系统iFLYOS,在今年的1024开发者节上,iFLYOS 2.0全新升级,上线广东话的交互能力、变声能力、全双工持续交互、离在线融合模式、面向儿童闲聊等,让语音交互越来越流畅、越来越人性化。

iFLYOS的云端大脑快速集成所需AI能力,让开发者专注自身业务的开发,还提供了100多种精品技能。同时提供iFLYOS Studio图形化开发工具,开发者可以方便地通过拖拽来实现相关功能。并适配市面主流的芯片平台,如MT8516、MT8617、R328、RK3306等。

为降低iFLYOS开发成本,科大讯飞推出基于iFLYOS的公版方案,公版方案是把麦克风阵列、芯片、模组等放置在一个基本成型的模组上,开发者只要用这样的模组,使用iFLYOS的账号体系后,便具备iFLYOS的能力。开发者可用公版去定制自己所需要的能力,放置在产品中就可快速地定制生产自己的硬件。通过这样云与端的组合,为AIoT带来新的生命力。

据于继栋介绍,未来在AIoT的建设上,科大讯飞将在语音识别、合成、交互、唤醒、语义理解、翻译等核心技术上继续突破,并基于iFLYOS进行快速地接入和落地。与此同时,科大讯飞提供设备管理、技能管理、内容管理等核心管理组件,助力家电、家居、车载等行业通过AIoT的打通进行产品升级。

98436a04b7c04b5925e1b2b5f0abe825.png

两大全新 AI 开发者平台,助力开发者

但如今人工智能行业的需求越来越复杂,原有的单点技术已经满足不了开发者的开发需求。

刘聪举例道,在翻译机里的语音翻译能力非常好,但是在语音翻译的过程,其实是调用三次能力,包括语音识别+机器人翻译+语音合成,相当于在客户端上是提了三次请求,进行了三次调用,除了开发时间和开发成本的增加,对用户的体验也并不是特别友好。

对此,科大讯飞推出归云平台和飞云平台来助力开发者。归云平台拥有在线快速编排组合能力,具有以下特点:

1、易用:可视化拖拽、界面化调试

2、灵活:组合云端调整,端侧集成不变

3、丰富:提供200+AI能力,自由编排

4、扩展:自由接入自定义模块

归云平台助力开发者完成AI翻译、多模态人机交互、多媒体质检、视频会议上等场景应用。

而对于一些开发者,对某个问题已经有自己的方案,那么这些开发者可以将其相关的技术能力上传到飞云平台上,让讯飞的云计算平台去服务、分布式托管调度这些能力,开发者只用关注自己的核心的业务即可。为开发者提供更多可能,可一天完成AI算法引擎服务化平台。

而归云平台和飞云平台近期上线,开发者可一同加入,共同创建开放新生态。

除了推出新芯片、两大 AI 开发者平台、AIoT 平台升级,科大讯飞还推出“1024计划”3.0,计划和校企合作,共同培养 10 万 AI 产业学员。

未来可期。

318fbf22eb828002078a6fd37c595bdc.png

20533515673acc3edd37a9036c589259.png
知秋君
上一篇 2024-09-10 11:36
下一篇 2024-09-10 11:02

相关推荐