老羅大秀語音識別 但它真的重要嗎?
老羅在發布會上現場展示語音識別確實驚艷了一把,但語音識別真的是發展的重點嗎?
如果沒有人工智能,語音識別如同雞肋,食之無味,棄之可惜。
http://www.07881.cn/Uploads/Bingdu/2016-10-19/58072b0c361ea.jpg
1
科客網
http://www.07881.cn/news/14788.html
科客點評:如果沒有人工智能,語音識別如同雞肋,食之無味,棄之可惜。
在10月18日晚上的錘子手機發布會上,老羅現場展示了科大訊飛97%正確率的語音輸入。時間定格于發布會106分40秒,在老羅一陣碎碎念之后的不到一秒之內,文字轉換完成。其轉換速度之快,準確率之高以及現場展示的特殊環境,都讓人驚艷了一把。
語音識別實用嗎?
事實上,語音輸入并不是什么新鮮詞,但這次借助老羅的“單口相聲”,語音輸入又跳到眾人視線中。令人奇怪的是,訊飛的語音輸入在很早以前就有了,這次展示卻令我們有種重新認識語音輸入的感覺。
幾年前,語音輸入的準確率也不低,基本都有90%以上。然而,放到實際生活中,語音輸入的實用性仍然不是很高。在使用語音輸入的時候,其準確率會受到非常多的因素影響,在不同的環境下使用會有差別,在不同使用者的口音下更是差別巨大。
但放到今天,語音識別還是不實用嗎?
應該說,由于準確率的提高,語音識別的實用性對普通用戶來說有所上升。但從科客的實際體驗來說,哪怕是訊飛,其準確率仍然受限于使用者的音量、發音標準程度、環境干擾諸多因素。其中最大的影響因素應該是口音。拿廣東地區來說,光是粵語,不同地區的人發音都有所區別。對于人類來說,我們可以較為輕松的識別不同口音,并較為準確領會他人表達的意思。然而對機器而言,它就需要更大的數據庫。倘若哪一天,語音輸入能夠只能判斷方言口音,并且能在街頭隨機抽取不同口音的人進行語音輸入準確率的測試,那相信其實用性將會非常的大。但就目前而言,語音輸入的進步對不少年紀大的,只會用手寫輸入的用戶來說,其實用性確實不小。
競爭者眾多
需要承認,訊飛的多語言識別率確實是世界頂尖,中文是最好的。但是,其他競爭者要做到90%甚至95%以上也不是難事。另外,這些競爭者中不乏像谷歌、百度這樣擁有大量數據庫的企業,他們在海量用戶數據和人工智能技術上的優勢,能讓他們迅速的發展出優秀的語音智能。除此之外,這類互聯網企業還有足夠的能力發展諸多產品線,形成生態,以提供更優質而全面的服務。從這個角度來說,訊飛的發展道路有些窄。
語音識別的應用
另一方面,必須注意到,語音輸入本身只是一個途徑,它最終仍然要和實際操作相結合。比如在無人汽車領域,發展語音輸入就很有必要。試想一下,當你坐上一輛無人汽車,滿懷新奇和期待,結果屏幕卻彈出一塊鍵盤,那時你對這項高科技是否會感到失望?
而智能家居又是未來一大利用語音識別進行交互的重要領域。語音識別與智能家居的結合在幾年前就有了。微軟在win10發布會上主打的一點就是跨平臺,并利用Cortana這個語音識別進行更便捷的操作。也許這是第一步,在整合數碼設備之后, 微軟甚至能一步步逐漸滲透,從電視到洗衣機,從窗戶到整個房屋,全都用人工智能進行操作。而語音識別自然理所當然會成為更智能家居體驗的主要交互方式。這是能夠改變人們生活的重要領域,以語音識別為基礎建構起來的整個生態,就成了目前各大語音識別廠商追逐和競爭的目標。
重點還是人工智能
從語音識別在未來可能涉及的領域可以看到,雖然語音識別能讓生活工作變得更加的高效便捷,然而,其核心卻是人工智能。雖然微軟CEO薩提亞·納德拉對語音識別不吝贊美,甚至稱語音識別突破的意義不亞于將圖形界面引入電腦,然而,沒有人工智能為核心,語音識別會出現下圖這樣的答非所問,就算再準確又如何?
無論是無人汽車,還是智能家居,或者是其他領域,語音識別只能算是第一步。畢竟如果計算機無法理解我們的指令,那么也不會有后續的操作。要想在這些領域有所發展,給用戶更好的體驗,那就必須著眼于人工智能。如果語音識別沒有依托于人工智能,不能和其他產品相互配合,那語音識別的意義也就沒有那么大了。由此來看,語音識別真的是重點嗎?恐怕不見得。關注科客網官方微信kekebat,獲取更多精彩資訊。
注:科客網原創文章,歡迎轉載與分享,轉載請注明出處。
梅兒莉薇
████████████看 黃 魸 手 機 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無需下載、直接欣賞,妳嬞鍀!████████████綴做