微軟又在開發(fā)新技術(shù):教會(huì)AI看圖講故事
和谷歌一樣,微軟也在開發(fā)一項(xiàng)造福殘疾人士的新技術(shù)。如果這項(xiàng)技術(shù)能順利推出,這無疑將為盲人辨識(shí)視頻和圖片信息的道路上邁出了一大步
1
科客網(wǎng)
http://www.07881.cn/news/11253.html
科客點(diǎn)評(píng):相比國內(nèi)動(dòng)不動(dòng)的“黑科技”,這樣的科技才是改變生活的根本。
微軟的研究人員又有新的腦洞,他們想讓計(jì)算機(jī)以人工智能的方式,把幾張圖片里發(fā)生的事情給講述出來。今天,他們已將發(fā)表了關(guān)于這項(xiàng)技術(shù)的學(xué)術(shù)論文,旨在為了視覺損傷人士提供具體的圖片信息。
這項(xiàng)技術(shù)非常有意義,這不僅僅是遠(yuǎn)超之前的圖片描述(Image Caption)技術(shù)。根據(jù)微軟研究員Margaret Mitchell的說法,這項(xiàng)技術(shù)不僅可以描述出照片的背景,而且還可以告訴你,在照片里,什么樣的人正在做了什么事。這是基于深度學(xué)習(xí)(deep learning)理論而開發(fā)的,之前微軟也把這種理論應(yīng)用到語音識(shí)別和機(jī)器翻譯。目前,谷歌、Facebook和其他公司也在積極參與這項(xiàng)研究。
為了改善這個(gè)領(lǐng)域的現(xiàn)狀,微軟依賴人工把單張圖片的標(biāo)題內(nèi)容和特定的圖片順序?qū)懗鰜怼9こ處熢倮靡延械男畔⒔虝?huì)機(jī)器,把圖片序列發(fā)生的事情復(fù)述出來。如上圖所示,單個(gè)圖片顯示出來的信息是一群年輕人圍著桌子坐一起,而經(jīng)過序列處理后,描述出一群人在享受互相聊天的美好時(shí)光。
如果這項(xiàng)技術(shù)能順利推出,這無疑將為盲人辨識(shí)視頻和圖片信息的道路上邁出了一大步。關(guān)注科客網(wǎng)官方微信kekebat,獲取更多精彩資訊。(文/Poplar)
注:科客網(wǎng)原創(chuàng)文章,歡迎轉(zhuǎn)載與分享,轉(zhuǎn)載請(qǐng)注明出處。
如月千早
████████████看 黃 魸 手 機(jī) 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無需下載、直接欣賞,妳嬞鍀!████████████追滋