百度继续力推人工智能 对外输出语音技术

admin股市行情2020-04-21 23:02:3445

李彦宏就曾经表示:“语音和图像正在取代文字成为表达需求的主流方式”,百度大脑也成为了大会上的绝对主角。之后,不管是模仿张国荣唱歌,还是高调的公关无人驾驶汽车,都能看出百度将重拾曾经辉煌的赌注,压在了人工智能上,尤其是在乌镇,李彦宏还发出了“移动互联网的时代已经结束了”的言谈。

百度昨日(22日)还举行了语音开放平台三周年活动,并在大会现场开放了四项全新语音技术的接口——情感合成、远场方案、唤醒二期技术和长语音方案,而且这些技术将会免费开放给用户和开发者共享。百度首席科学家吴恩达对此表示,

“这些技术有很大的潜力,去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”

而这次四项全新语音技术的开放,也能看出在使用场景上,百度所作出一些探索,比如在语音技术上的情感和成,既是将机械、古板的生硬转换成具有情感的声音,意在提升用户主管体验;远场方案,使语音距离为3-5米的远场的情况下,识别率能够达到93-94%,意在声控智能设备的使用场景;至于长语音方案,比较明显的则是在速记等文字工作者的领域做试探。

吴恩达接受钛媒体的专访时表示:“人工智能现在的技术,有一些领域还在研究阶段,还需要一两年才能取得进步,而语音技术在很多方面已经很成熟。”

从百度方面公开的资料可知,百度语音识别准确率达到了97%,而在百度语音的开发平台上,现在已经有超过14万的开发者共同。而对于人工智能的未来,吴恩达表示,

“现在人工智能已经为很多公司,包括百度带来了非常大的价值,而且我们已经看到了一条比较清楚的路,使用人工智能改变很多不同的行业。”

仅仅是语音识别技术,便有很多的使用场景,有很多的机会能够看清楚了。这些机会百度没有能力自己全部探索,所以要提供给第三方公司或者开发者使用百度的语音技术。

作为人工智能最为重要的交互技术,我们能看到越来越多的巨头都在语音识别的领域,投入了很多的资源。今年8月初,微软在北京发布的第四代小冰产品,除了在功能上进行了一定的升级,还让小冰有了更多的“社会角色”。

比如升级了情感计算框架,让小冰在与人的对话中更占主动;比如在日本“出道”,发布首支原创单曲;比如开发“卡槽”技能,让小冰在更多垂直领域中,有更专业的表现。

曾经一直克制小冰商业化的微软团队,却在今年将自家的语音技术在各种各样的领域中,进行了尝试。而微软全球执行副总裁陆奇的一番话,也许能够从一方面解释微软在语音交互上的思考,

微软在过去二十多年积累的,在人工智能、搜索引擎和大数据方面的技术储备,也都放在小冰身上。在微软的理念中,对话不仅是一个基础,对话更是一个核心平台,作为一个核心基础可以把人工智能时代引入到现实世界。

而在今年的3月,谷歌在Nest云计算大会上,也宣布开发了其语音识别的API,即谷歌语音搜索和语音输入的技术支持。Google Cloud SPeech API 这一应用包括了80多种语言,适用于各种实时语音识别与翻译应用。

还有依靠苹果手机,拥有了千万级别忠实用户的SIRI;从2011年就开始收购语音公司Yap的亚马逊,在2014年推出的Echo;以及那无数的创业公司,奋力寻找突破点,想要进行行业的颠覆。

也许正如吴恩达所讲,人工智能领域的道路越来越清晰,更使得各方企业愿意在这个领域上进行一搏。而作为技术相对比较成熟的语音识别,又是人工智能天然的入口,自然竞争也就难免这么激烈。

人工智能概念股:埃斯顿、科大智能、汉王科技、江南化工、华东数控、和而泰、中科曙光、永创智能、北京君正、通富微电、永创智能、劲拓股份。

语音识别概念股:拓尔思、科大讯飞、歌尔声学、共达电声、汉王科技。

分享: