Seeing AI怎么使用?Seeing AI有哪些功能?微軟新推出的Seeing AI是什么?Seeing AI是專為有視覺障礙的伙伴而研發(fā)的,那么Seeing AI怎么使用呢?Seeing AI有哪些功能?想知道的伙伴跟著小編一起來看看吧!
Seeing AI怎么使用 Seeing AI有哪些功能
Seeing AI 支持人物、短文、文本、條形碼以及場景的識別,用戶只需要拿住 iPhone 設(shè)備在四周移動,應(yīng)用會通過神經(jīng)網(wǎng)絡(luò)技術(shù),將這些信息轉(zhuǎn)化為語音,讓用戶可以「聽到」周圍的環(huán)境情況,從而為視力缺陷者進(jìn)行服務(wù),Seeing AI 大大方便了視力障礙者的日常生活。
人物及周圍環(huán)境的掃描
對人物的識別是微軟利用圖像識別工具提供更深入的圖片解釋。識別人物之后,Seeing AI 不僅可以判斷此人的性別以及大概的年齡,甚至可以對此人的外貌以及面部表情進(jìn)行表述。看看下圖 Seeing AI 對小哥的描述:一位滿頭黑發(fā)表情自然的男士,識別結(jié)果還是很準(zhǔn)確的。
此外,使用 Seeing AI 對周圍環(huán)境進(jìn)行掃描,還能了解到周圍有多少人,這些人所在的位置以及與你的距離,當(dāng)然還可知道這些人的面部表情。Seeing AI 還有一個(gè)新奇之處,你可以教 Seeing AI 去識別某個(gè)特定的人物。進(jìn)入「臉部識別」功能,對某個(gè)人物的臉部進(jìn)行三次拍攝,并做相應(yīng)的姓名標(biāo)注即可完成該人物信息的錄入,當(dāng)你再次識別此人時(shí),Seeing AI 就會說出他的名字。
短文內(nèi)容的自動識別
短文識別功能簡單來講就是哪里看不清拍哪里,這個(gè)功能結(jié)合了圖像識別技術(shù)與自然語言處理技術(shù),將文本信息轉(zhuǎn)化為語音信息。這一功能可以幫助視障人士獲得對圖像的準(zhǔn)確描述,還可能幫助那些需要圖像信息卻無法直接看到圖像的人——比如正在開車的司機(jī)。
在測試的過程中小編發(fā)現(xiàn),在 Seeing AI 在「朗讀」文本的過程中,如果攝像頭捕捉到了更加清晰的文本圖像,那么 Seeing AI 會從頭開始「翻譯」這段文本。經(jīng)過測試會發(fā)現(xiàn) Seeing AI 識別效果很好,在識別讀出內(nèi)容的過程中幾乎沒有錯(cuò)誤。但在語言系統(tǒng)方面有些遺憾,應(yīng)用目前只可以識別英文和阿拉伯?dāng)?shù)字,并不支持中文及其他語言的識別。
文件和條形碼的探測
文件識別的操作相對復(fù)雜一些,將攝像頭對準(zhǔn)文本,Seeing AI 會引導(dǎo)你的手機(jī)放置,直到所選取的文本周圍出現(xiàn)邊緣,聽到「Hold steady」的聲音,然后拍攝進(jìn)行文本識別。在文本識別之后,還可以使用 VoiceOver 功能對文本進(jìn)行操作。
將手機(jī)攝像頭對準(zhǔn)條形碼則可以對其進(jìn)行識別,在掃碼的一瞬間會聽到嗶嗶的聲音,條形碼檢測成功后,Seeing AI 會說出產(chǎn)品的名稱。如果你想了解更多有關(guān)產(chǎn)品的信息,則可選擇點(diǎn)擊右下角的按鈕進(jìn)行詳細(xì)的了解。
復(fù)雜場景的描述
場景的識別是讓計(jì)算機(jī)用更加人性化的方式去描述圖像,Seeing AI 會對識別的場景進(jìn)行詳細(xì)的描述。比如下圖,Seeing AI 不僅會告訴你這是一臺筆記本電腦,它還會告訴你這臺電腦是以打開的狀態(tài)放置在桌上這樣詳細(xì)的描述。不過場景識別的功能目前還處于測試階段,所以場景識別的結(jié)果并不總是正確的,相信微軟之后會完善這個(gè)功能。
小結(jié)
Seeing AI 實(shí)現(xiàn)了「語音世界的魔法」,利用手機(jī)攝像頭將文字、人物、商品、場景等信息轉(zhuǎn)化為語音,讓更多的弱視群體盡可能的「獨(dú)立」,有助于為視障人士營造更公平的環(huán)境,與正常生活縮小差距。Seeing AI 的出現(xiàn)會在一定程度上讓更多的人利用人工智能技術(shù)來造福人類。
Seeing AI 的部分應(yīng)用可在離線狀態(tài)下使用,但是在語音方面暫時(shí)只支持英文系統(tǒng),對該應(yīng)用感興趣的小伙伴可以前去美區(qū) App Store 下載體驗(yàn)。