百度大腦是什么?人工智能百度大腦能做什么。2016第十一屆百度世界大會(huì)于今日在北京中國大飯店盛大開幕,本次大會(huì)的主題是人工智能-百度大腦。百度大腦極化是百度最頂層的設(shè)計(jì),那么百度大腦是什么?人工智能百度大腦能做什么?下面給大家詳細(xì)介紹。
百度大腦是什么?
第一層:開放云
作為一個(gè)人類嬰兒,其第一件最重中之重的事情就是記憶,而記憶也是一切的發(fā)展前提。同樣,我們將百度人腦看成人腦的話,那么第一件事情,必然是存儲(chǔ)。人類沒有記憶就沒有關(guān)聯(lián),也更不用提決策與創(chuàng)造,而人類之所以能夠在靈長類動(dòng)物中立足,正是有著極大的可以存儲(chǔ)記憶的腦容量,那么機(jī)器要模仿人腦也必然要建立在擁有龐大的存儲(chǔ)能力之上才有可能,而百度也是在真正積累數(shù)據(jù)到一定程度后才開始該項(xiàng)目。
我們來看下百度存儲(chǔ)能力的發(fā)展過程:
四年前也就是2010年,百度的機(jī)器學(xué)習(xí)能力并不是很高,只擁有幾百臺(tái)的服務(wù)器,特征向量只有十萬。
兩年后也就是2012年,百度的單集群規(guī)模達(dá)到了幾十萬,已經(jīng)完全能夠做到讓這些機(jī)器在同一時(shí)間做同一件事情,特征向量從十萬上升到兩百億!
而當(dāng)在百度達(dá)到兩百億后機(jī)器學(xué)習(xí)就到達(dá)了一定瓶頸,就算特征向量增加到三百億,四百億,對機(jī)器學(xué)習(xí)的幫助并不是很大,而此時(shí)擁極強(qiáng)存儲(chǔ)能力的百度開始了在機(jī)器學(xué)習(xí)上的“深度學(xué)習(xí)”的分支發(fā)展,進(jìn)而升級已有的人工智能大腦。
備注:看機(jī)器處理能力有兩個(gè),第一個(gè)是看服務(wù)器規(guī)模,第二個(gè)是看特征向量大小。所謂特征向量簡單理解的話就是指將文本語音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,用戶的搜索結(jié)果就會(huì)越精確,對用戶的搜索體驗(yàn)效果也會(huì)隨之上升,但對服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從10萬直接飆升到200億,足以見得百度服務(wù)器技術(shù)實(shí)力的雄厚。
此外這一段并非只講存儲(chǔ),同時(shí)也是在講百度大腦的發(fā)展,因?yàn)橛辛擞洃浘蜁?huì)發(fā)生關(guān)聯(lián),進(jìn)而產(chǎn)生決策,這是一個(gè)整體前進(jìn)的過程。
第二層:數(shù)據(jù)工廠
作為一個(gè)人,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫面,某個(gè)音樂等等就能記起很多事情,比如當(dāng)你聽老歌時(shí),看到童年的玩具時(shí),洶涌的記憶總會(huì)被調(diào)出來。
當(dāng)然這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問過去,機(jī)器沒有分類的概念,就像在圖書館中,機(jī)器是一個(gè)不會(huì)看分類的管理員,他要找某一本書時(shí)只能一本一本的找過去,十分笨拙。
也就是說,機(jī)器要想搜索什么內(nèi)容時(shí),必須有人來幫助它建立起分類,但最矛盾的就是,在錯(cuò)綜復(fù)雜的語言結(jié)構(gòu)中,我們很難為一個(gè)詞去下定義,比如當(dāng)你在說“蘋果”這個(gè)詞的時(shí)候,你如何告訴機(jī)器他的分類?"蘋果"究竟是一個(gè)名詞,還是一個(gè)公司?而決定一個(gè)詞的意義的則是語境,也就是機(jī)器要依靠其他詞語的出現(xiàn)來為這個(gè)詞做模糊的定義,不能完全給它下死定義而是要根據(jù)環(huán)境來下,并且它還應(yīng)當(dāng)是動(dòng)態(tài)的,不斷變化的。
也就是說這種搜索技術(shù)也依然要百度的大腦配合才能達(dá)到,對每一個(gè)詞的定義應(yīng)該是一個(gè)庫,而這個(gè)庫中的每一個(gè)詞又都各自構(gòu)成庫,百度的數(shù)據(jù)工廠所創(chuàng)造的算法,就是在這么一個(gè)數(shù)據(jù)之海中去為他們建立管理,然后去索引。
數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過程。
第三層:百度大腦
人腦有了記憶,有了關(guān)聯(lián)之后就會(huì)進(jìn)行決策,比如小孩子碰到開水,燙到了手下次就不會(huì)碰,就是因?yàn)橛洃浟碎_水和燙手的痛苦,并將這兩個(gè)記憶關(guān)聯(lián)在了一起,才有了下次不去碰開水的決策。而百度大腦就是在模仿這些行為,做記憶關(guān)聯(lián)之后的決策、行動(dòng)、創(chuàng)造。
我之前關(guān)于開放云和數(shù)據(jù)工廠的分析完全是建立在搜索引擎之上,只是站在了百度對漢語能力的理解而已,而那時(shí)百度的人工智能也確實(shí)只是剛出生的嬰兒而已,只能在PC端爬行,但是當(dāng)智能手機(jī)誕生,可穿戴智能設(shè)備的出現(xiàn)后,百度開始成為可以走路的嬰兒,此時(shí)百度大腦的智力已是高達(dá)兩歲的嬰兒水平。
從搜索引擎智能到硬件智能,這是一個(gè)平面到立體,二維到三維的過程。原因是以前百度搜集到的數(shù)據(jù)只能夠是PC端用戶的搜索行為,這之中充其量只有文字內(nèi)容罷了,百度所能夠建立的僅僅只是語言理解,對用戶的輸入文字?jǐn)?shù)據(jù)做不斷的處理與反饋,但是到了手機(jī)端,智能硬件端則完全變天,百度可以收集到的不僅僅只會(huì)是語言數(shù)據(jù),更會(huì)收集到一整套的使用場景數(shù)據(jù)!
此時(shí),百度從為用戶提供搜索結(jié)果的搜索引擎開始轉(zhuǎn)變?yōu)橄蛴脩籼峁┤轿唤鉀Q方案的人工智能,想象力無窮。
那么,百度大腦將會(huì)如何模仿人類的感知,再到思考,以至于最后產(chǎn)生決策、生產(chǎn)、創(chuàng)造呢?
人工智能百度大腦能做什么?
最近一段時(shí)間,百度在人工智能方面下了很大的工夫,不但要建超級計(jì)算機(jī),要建中國大腦。而且在硅谷建立了實(shí)驗(yàn)室,在全世界廣泛招募人才。今天,百度創(chuàng)始人、董事局主席兼CEO 李彥宏來到聯(lián)想科技創(chuàng)新大會(huì),闡述了百度在人工智能方面的新動(dòng)向。
李彥宏:人工智能對于百度來說是特別重要的,因?yàn)槲覀兠刻於加玫阶匀徽Z音識(shí)別、圖像識(shí)別等基礎(chǔ)技術(shù)。這些技術(shù)最根本的就是機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)。最近幾年我們在人工智能方面確實(shí)投入非常大,也是由于像聯(lián)想、英特爾、微軟的創(chuàng)新,使得計(jì)算的成本越來越低,就是計(jì)算能力越來越強(qiáng)。我們原來人工智能想做而不敢做的事情,現(xiàn)在可以做了。
今天我們可以一起看一些Demo,就是人工智能技術(shù)能夠做一些過去不能做的事情。
假如說咱們倆到了一個(gè)陌生的國度,這個(gè)國家說得語言是我們不懂的語言。但是我們又想去吃一吃地道的當(dāng)?shù)夭。比如說到了韓國,我們都不會(huì)韓語。拍一下菜單,就知道是什么菜了。我們的技術(shù)已經(jīng)把菜單翻成了中文。所以說是可以把我們不懂的語言翻譯成我們懂的語言,看明白菜單了得點(diǎn)菜啊。但是還不會(huì)說中文,就可以用語音的翻譯來試一試了。
不光是韓語,百度翻譯APP是大家可以隨便下載、隨便用,大家在下面可以自己去嘗試,不僅支持韓語,可以支持大約18種語言,包括希臘語、葡萄牙語等等。其實(shí)我們的工程師并不懂得各種各樣的語言,之所以能夠做不同語種之間的自動(dòng)翻譯,是因?yàn)槲覀冇么髷?shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)的技術(shù)在學(xué)習(xí)。因?yàn)榫W(wǎng)上有各種各樣的語言,比如說同一家餐館網(wǎng)站既有英文介紹,也有中文介紹,或者也有韓文的介紹。
我們根據(jù)這些內(nèi)容來進(jìn)行學(xué)習(xí),又可以逐步領(lǐng)會(huì)到不同語種之間的每一句話都是什么意思,所以這是語言的翻譯。
計(jì)算機(jī)的人工智能不僅可以讓你聽得懂,也可以讓你看得明白。用相機(jī)、全息攝像拍下來的信息怎么讓機(jī)器能夠看得懂,這也是人工智能需要解決的重要問題。
下面就給大家看一下演示一下看圖說話,我們看一個(gè)圖。
問:它在做什么?
答:打網(wǎng)球。
問:它穿的衣服是什么顏色的?
答:藍(lán)色。
問:他手里拿著什么?
答:網(wǎng)球拍照
問:這是哪里
答:這是在路邊的街道。
問:這是什么?
答:這是禁止停車標(biāo)志。
問:標(biāo)志是什么顏色的?
答:紅色。
大家可以看到我們的計(jì)算技術(shù)已經(jīng)在模仿人的一些智能,就是能夠真正看得明白我們的場景、圖片是什么樣子。剛才元慶提到中國大腦,中國大腦是我提議的集國家之力想做的項(xiàng)目。事實(shí)上百度在過去幾年想做一個(gè)項(xiàng)目是百度大腦,這相當(dāng)于中國大腦的迷你版本。迷你版的智能水平達(dá)到了三四歲孩子的智力,剛才給大家演示的看圖說話,就是通過百度大腦來智能地讀取信息的內(nèi)容,同時(shí)也能夠理解你在問它什么樣的問題。
未來隨著我們創(chuàng)新的繼續(xù),隨著大數(shù)據(jù)積累越來越多,隨著人工智能技術(shù)不斷推進(jìn),百度大腦會(huì)越來越接近一個(gè)普通人或成年人的智力水平。
當(dāng)然我們一開始第一個(gè)Demo有點(diǎn)語音和翻譯的作用,第二個(gè)Demo是給大家看圖片。這個(gè)圖片實(shí)際上是2D的東西,剛才在前面幾位嘉賓做演示的時(shí)候,其實(shí)都演示了一些3D的東西。比如繞著元慶拍一圈,就可以知道這個(gè)人立體是什么樣子。另外也演示了全息的不同位置和相應(yīng)的尺寸都可以弄出來。這些技術(shù)在未來會(huì)越來越普及,但是在過去這些技術(shù)是沒有的。
比如說一個(gè)多月之前在尼泊爾發(fā)生了非常強(qiáng)烈的地震,加德滿都很多人類文化遺產(chǎn)都在地震當(dāng)中毀掉了。我們也很希望能夠像全息一樣,像3D一樣恢復(fù)原來加德滿都很多的古跡到底是什么樣子。可是很多人到那里旅游過拍了很多照片,這些照片是2D的。怎么樣通過2D照片還原出3D的圖像,或者是還原出3D場景?這也是我們?nèi)斯ぶ悄芎痛髷?shù)據(jù)試圖解決的問題。大致給大家解釋一下工作的原理,因?yàn)楹芏嗳伺牧撕芏嗥矫娴恼掌撬麄兣臄z的角度都是不一樣的。這就好像是有無數(shù)的人繞著古建筑拍了無數(shù)的照片。百度要做的事情,根據(jù)一張照片來判斷這個(gè)人拍攝的角度是什么角度,是站在地上的什么位置去拍了古建筑。單單靠一個(gè)照片我們判斷不出來角度,判斷不出來時(shí)間。但是當(dāng)無數(shù)個(gè)照片都串在一起的時(shí)候,我們用人工智能的技術(shù)就可以搞清楚在哪個(gè)角度是哪個(gè)時(shí)間拍的,合成起來就成為了還原的古建筑的形象。
其實(shí)人工智能還可以做很多的東西,現(xiàn)在只是剛剛開始。人工智能有五六十年的歷史,應(yīng)該說頭五十年基本上都是不實(shí)用的,是一個(gè)學(xué)術(shù)性的探討。最近幾年隨著計(jì)算能力的增加,隨著計(jì)算成本的降低,原來我們不敢想、不能做的事情現(xiàn)在能想了、能做了。而且我也非常有深刻地體會(huì),創(chuàng)新不是某一家公司的事情,是很多公司、很多優(yōu)秀的人才相互激發(fā),以及相互鼓勵(lì)、相互促進(jìn),甚至相互競爭,導(dǎo)致了創(chuàng)新不斷的發(fā)生。聯(lián)想也好,英特爾也好,微軟也好,都有很多的創(chuàng)新。
百度的這些創(chuàng)新,應(yīng)該說就是站在這些人肩膀上我們又往前邁了一步。我也很希望,未來聯(lián)想、微軟、英特爾以及很多其他的公司跟百度一起,我們相互激發(fā),我們相互競爭,我們相互鼓勵(lì),我們相互把技術(shù)往前不斷地推進(jìn),讓技術(shù)真正改變世界,改變我們每一個(gè)人普通的生活。
以上就是百度大腦是什么?人工智能百度大腦能做什么。希望對大家有所幫助。