
吳恩達(dá)說人工智能永恒的春天已經(jīng)到來,你準(zhǔn)備好了嗎?
時(shí)間:2017-04-01
(轉(zhuǎn)載自36氪,如有侵權(quán)請聯(lián)系刪除)
2017年2月,百度首席科學(xué)家、Coursera的聯(lián)合創(chuàng)始人Andrew Ng在斯坦福MSx未來論壇上的一個(gè)演講,吸引了全球的眼球。 他認(rèn)為,人工智能(AI)對未來許多行業(yè)帶來的變革,如同100多年前,美國“觸電”一樣——電對制造、運(yùn)輸、農(nóng)業(yè)(尤其是冷藏)、醫(yī)療等等帶來了劃時(shí)代的變革。
AI驅(qū)動(dòng)著百度的搜索和廣告,調(diào)度百度外賣的快遞員,選擇路線,和預(yù)估運(yùn)送時(shí)間。AI正在徹底改變金融工程,對物流的轉(zhuǎn)變進(jìn)行了一半,醫(yī)療和自動(dòng)駕駛剛開始,而前景巨大。和“電”帶來的變革一樣,很難想象哪個(gè)行業(yè)不會(huì)被AI改變。
監(jiān)督學(xué)習(xí)
驅(qū)動(dòng)百億的市場容量的,基本上屬于同一種AI: 監(jiān)督學(xué)習(xí)(Supervised learning),即用AI來確定A-->B的映射——輸入A和響應(yīng)B的映射。
用Email作為輸入A,判斷是否是垃圾郵件是響應(yīng)B。
用圖像作為輸入,識別這是一千種物體中的哪種?
從聲音A到文字B,從英文到法文,或從文字到聲音。
軟件可以學(xué)習(xí)這些輸入A到響應(yīng)B的映射——有很多好的工具來讓機(jī)器學(xué)習(xí)。比如50,000小時(shí)的音頻和對應(yīng)的文本,就能讓機(jī)器學(xué)到如何從音頻內(nèi)容轉(zhuǎn)化為文本內(nèi)容。通過大量的電郵數(shù)據(jù)和區(qū)分垃圾的標(biāo)簽,也可以很快地訓(xùn)練出一個(gè)垃圾郵件過濾器。
現(xiàn)在的AI還很初級——A到B的映射而已,不過已經(jīng)推動(dòng)著很大的市場。百度有很好的算法來預(yù)測某用戶是否會(huì)點(diǎn)擊某廣告。向受眾呈現(xiàn)更相關(guān)的廣告,能為互聯(lián)網(wǎng)營銷和廣告公司帶來極大的賺錢機(jī)會(huì)。這可能是AI最賺錢的應(yīng)用。
在哪些產(chǎn)品里能用到AI?
產(chǎn)品經(jīng)理常常希望了解AI能實(shí)現(xiàn)的,和不能實(shí)現(xiàn)的。一個(gè)簡單的思路是:一般人能在一秒內(nèi)想出來的事情,現(xiàn)在或很快就可以用AI自動(dòng)實(shí)現(xiàn)。
AI進(jìn)展最快的領(lǐng)域正是人能做得到的領(lǐng)域。比如自動(dòng)駕駛。人類能駕駛,所以AI也能駕駛。在醫(yī)學(xué)影像閱片和分析上,人類放射科醫(yī)生能夠閱片,所以AI也很可能在未來幾年內(nèi)做到。
而人類難以做到的事情,比如預(yù)測股市變化,AI可能也難。
原因1:人類能做的,至少是可行的;
原因2:可以利用人類的數(shù)據(jù)作為培訓(xùn)樣本,比如前面提到的輸入A和響應(yīng)B;
原因3:人類能提供指導(dǎo)。如果AI對某個(gè)放射影像的結(jié)論有誤,設(shè)計(jì)者可以向醫(yī)生請教,醫(yī)生所做的正確結(jié)論的原因是什么? 進(jìn)而對AI進(jìn)行改善。
在Andrew Ng所接觸到的80-90%的AI項(xiàng)目中,都遵循這一規(guī)律:在人類能做到的領(lǐng)域,AI的進(jìn)展更快。很多項(xiàng)目的發(fā)展一旦超越人類水準(zhǔn),發(fā)展也會(huì)變得緩慢。這也帶來一個(gè)社會(huì)矛盾:如果AI和人的水平類似,實(shí)質(zhì)上是跟人類競爭。
AI的發(fā)展趨勢
AI已經(jīng)出現(xiàn)了幾十年了,而近五年發(fā)展明顯加速,為什么?
當(dāng)以前的機(jī)器學(xué)習(xí)算法性能上升到一定程度,即使再增加數(shù)據(jù)樣本量(前文談到的輸入A、響應(yīng)B的A-B映射),性能改善也很有限。似乎超過一定樣本量之后,再多的數(shù)據(jù)也對算法不起作用。
而過去幾年,主要由于GPU,我們終于實(shí)現(xiàn)了能利用這么巨大的數(shù)據(jù)集的機(jī)器學(xué)習(xí)軟件。將數(shù)據(jù)輸入一個(gè)小的神經(jīng)網(wǎng)絡(luò),當(dāng)超過一定性能后,上升變得平緩。而不斷地把數(shù)據(jù)輸入一個(gè)很大的神經(jīng)網(wǎng)絡(luò)時(shí),即使性能上升沒有那么快,也會(huì)保持上升趨勢,隨著數(shù)據(jù)量的增大,不斷提高。
因此,要想獲得很好的AI性能,需要兩樣?xùn)|西:
很大的A-B映射的數(shù)據(jù)集;
大的神經(jīng)網(wǎng)絡(luò)。現(xiàn)在常用的大型神經(jīng)網(wǎng)絡(luò)建立在HPC高性能計(jì)算集群上。
現(xiàn)在的大型AI團(tuán)隊(duì)包括機(jī)器學(xué)習(xí)和高性能計(jì)算兩組人,才能獲得足夠計(jì)算能力。百度AI團(tuán)隊(duì)里的這兩種人員都專注于各自領(lǐng)域,沒有人能兩者兼?zhèn)洹?br />
什么是神經(jīng)網(wǎng)絡(luò)?有沒可能取代人類大腦?
問題是,我們不清楚人腦如何工作,所以很難造出取代人類大腦的神經(jīng)網(wǎng)絡(luò)。
什么是神經(jīng)網(wǎng)絡(luò)?先看個(gè)最簡單的神經(jīng)網(wǎng)絡(luò):
如果想輸入房屋面積,得到房屋總價(jià),可以用面積-總價(jià)的一階近似的線性模型來描述這個(gè)神經(jīng)網(wǎng)絡(luò)。
或者用更多因素建模,比如通過面積和臥室數(shù),從第一個(gè)神經(jīng)元得到可以支持的家庭人數(shù)。再通過所在地址的郵編和社區(qū)富裕程度,從第二個(gè)神經(jīng)元得到附近學(xué)校的質(zhì)量。
這就成為一個(gè)神經(jīng)網(wǎng)絡(luò)。面積、臥室數(shù)、郵編、社區(qū)富裕程度屬于“輸入”集合A,總價(jià)屬于“響應(yīng)”集合B。
好處在于,當(dāng)訓(xùn)練這樣一個(gè)神經(jīng)網(wǎng)絡(luò)時(shí),用戶無需關(guān)心中間因素,諸如家庭人數(shù)、安全度、學(xué)校質(zhì)量等,也無需關(guān)心每個(gè)神經(jīng)元如何將輸入映射到中間結(jié)果。只需要給出輸入集合A和響應(yīng)集合B,神經(jīng)網(wǎng)絡(luò)將自動(dòng)形成中間的計(jì)算過程和參數(shù)。當(dāng)A和B的集合足夠大,神經(jīng)網(wǎng)絡(luò)可以自動(dòng)算出很多東西。 神經(jīng)網(wǎng)絡(luò)看上去非常簡單,讓很多初學(xué)者覺得有點(diǎn)失望,但它確實(shí)能解決很多問題。關(guān)鍵在于數(shù)據(jù)量要夠大——幾萬或幾十萬個(gè)樣本本身能提供大量的信息,而軟件本身只是一小部分。
如何保護(hù)AI業(yè)務(wù)?
AI研究較前沿的團(tuán)隊(duì)都比較開放,常常發(fā)布研究成果。百度的AI研究論文也沒有隱藏什么成果——在人臉識別等論文里,都分享了所有的細(xì)節(jié)。既然很難把算法本身隱藏起來,如何保護(hù)AI業(yè)務(wù)? 當(dāng)前稀缺資源有兩種,一種是數(shù)據(jù),二是人才。獲取巨量數(shù)據(jù)很難,要包括輸入A+響應(yīng)B。比如語音識別用了5萬小時(shí)的音頻來訓(xùn)練,今年準(zhǔn)備用10萬小時(shí),相當(dāng)于百度10年積累的音頻。
以人臉識別所用的訓(xùn)練圖像數(shù)量為例
學(xué)術(shù)上最常用的基準(zhǔn)測試/比賽:1百萬幅;
所用圖像數(shù)最多的計(jì)算機(jī)視覺對象識別學(xué)術(shù)論文:1500萬幅;
百度用來訓(xùn)練世界上最先進(jìn)的人臉識別系統(tǒng):兩億幅!
如果只是5-10人的研發(fā)團(tuán)隊(duì),很難獲得這樣規(guī)模的數(shù)據(jù)。百度這樣的大企業(yè)的經(jīng)常推出一些新產(chǎn)品不一定是為了營收,而是為了數(shù)據(jù),然后通過后續(xù)的產(chǎn)品來獲得收益。
另一個(gè)稀缺資源是人才。AI的應(yīng)用需要根據(jù)具體業(yè)務(wù)場景來定制。僅僅下載個(gè)開源包,無法解決問題。實(shí)際情況下,是否適合用某種垃圾郵件識別或語音識別技術(shù)?針對某種場景,機(jī)器學(xué)習(xí)怎么用? 所以各個(gè)公司都在為數(shù)據(jù)挖掘爭奪AI人才,來定制AI技術(shù),找到所需要的A和B各自代表什么,怎么找到這些數(shù)據(jù)和如何調(diào)整算法來適應(yīng)業(yè)務(wù)場景。
AI的良性循環(huán)
先做出某種產(chǎn)品。比如通過語音識別,以語音實(shí)現(xiàn)搜索;
然后吸引來很多用戶,用戶產(chǎn)生數(shù)據(jù);
再通過機(jī)器學(xué)習(xí),用數(shù)據(jù)改善產(chǎn)品。
這就形成了AI產(chǎn)品的良性循環(huán)。最好的產(chǎn)品能獲得最多的用戶,帶來最多的數(shù)據(jù),通過現(xiàn)代機(jī)器學(xué)習(xí)體系,能得到最好的AI,最終讓產(chǎn)品變得更好,周而復(fù)始。
百度發(fā)布新的產(chǎn)品,會(huì)特別考慮怎樣推動(dòng)這樣的良性循環(huán),會(huì)包括相當(dāng)先進(jìn)的產(chǎn)品發(fā)布策略,比如按地理區(qū)域、細(xì)分市場等,來更好地推動(dòng)這個(gè)循環(huán)。
這種良性循環(huán)的理念很早就有了,只是最近變得更加明顯。正如前文所述,當(dāng)數(shù)據(jù)超過一定規(guī)模后,傳統(tǒng)AI算法無法明顯改善AI性能,因此數(shù)據(jù)多的優(yōu)勢不明顯,大公司也很難保護(hù)自己的AI業(yè)務(wù)。現(xiàn)在數(shù)據(jù)越多,AI性能越好,大公司也更容易保護(hù)自己的優(yōu)勢。
AI炒作的非良性循環(huán)
許多人擔(dān)心AI會(huì)不會(huì)取代或威脅人類。有一小部分研究AI的人專門從事對“邪惡AI”的炒作,以獲得投資人或政府機(jī)構(gòu)的投資,來研究“反邪惡AI”。道高一尺,魔高一丈,又進(jìn)一步推動(dòng)對“邪惡AI”的炒作,從而形成非良性循環(huán),非常不健康。
擔(dān)心AI變得邪惡,類似于擔(dān)心火星的未來人口過剩。現(xiàn)在看不出AI將會(huì)怎樣走偏,因此也談不上有針對地研究相應(yīng)措施。 研究本身沒有問題,不同的研究是好事,但是對邪惡AI的研究占用不恰當(dāng)?shù)馁Y源,就不應(yīng)該了。兩個(gè)人,或者10個(gè)人來研究邪惡AI也許沒問題,但是現(xiàn)在投資得太多。
AI對就業(yè)的影響
AI對就業(yè)帶來的影響更讓人擔(dān)心。有些AI項(xiàng)目確實(shí)是瞄準(zhǔn)了某些人類崗位,而從事這些工作的人并不清楚嚴(yán)重性。硅谷創(chuàng)造了大量財(cái)富,但也應(yīng)該對其造成的問題承擔(dān)責(zé)任,比如造成的失業(yè)問題。AI取代人類崗位的現(xiàn)實(shí)問題,更應(yīng)該引起重視,而不是被邪惡AI的炒作轉(zhuǎn)移了注意力。
AI產(chǎn)品管理
AI是個(gè)讓人興奮的領(lǐng)域,同時(shí)也存在一些挑戰(zhàn)。 如何將AI融入公司業(yè)務(wù)?
產(chǎn)品經(jīng)理的職責(zé)是找到用戶喜歡的,而工程師的角色是做出可行的產(chǎn)品。兩者共同協(xié)作,才能做出理想的產(chǎn)品。
AI是個(gè)新生事物,所以技術(shù)公司以前的流程和工作方法,不太適用。硅谷的產(chǎn)品經(jīng)理和工程師的合作已有一套標(biāo)準(zhǔn)流程。比如開發(fā)APP時(shí),產(chǎn)品經(jīng)理先畫出線框圖,比如logo,按鈕,各個(gè)板塊等,工程師再寫出代碼來實(shí)現(xiàn)。但是AI的APP無法通過畫線框來描述。通過什么形式,把產(chǎn)品經(jīng)理頭腦里對AI產(chǎn)品的功能要求明白地分享給工程師呢?
比如開發(fā)語音識別系統(tǒng),實(shí)現(xiàn)語音搜索,有很多改善方向。比如:
在嘈雜環(huán)境下如何改善,比如車?yán)锘蚩Х瑞^?
僅改善窄帶語音信號;
對不同口音改善;
百度發(fā)現(xiàn),產(chǎn)品經(jīng)理通過數(shù)據(jù)和工程師溝通,是個(gè)較好的辦法。 產(chǎn)品經(jīng)理負(fù)責(zé)提供測試數(shù)據(jù)集給工程師,比如一萬個(gè)音頻和對應(yīng)的文字,來說明所關(guān)心的問題,工程師也能更明白需要解決的問題。如果這些音頻里有大量車輛噪音,工程師就知道車輛噪音是問題。 如果是混合了幾種不同噪聲,工程師也能想辦法解決。最糟糕的情況是,產(chǎn)品經(jīng)理提供的測試數(shù)據(jù),并不能代表自己想解決的問題,那就出問題了。
同時(shí),新產(chǎn)品設(shè)計(jì)的流程有很多, 比如想設(shè)計(jì)一個(gè)交流型AI機(jī)器人:
- 人:“我想叫個(gè)外賣”;
- AI:“你喜歡哪種類型餐館?”;
- 人:“川菜”;
- AI:“這些可供選擇,xxx,yyy,zzz,...”;
線框圖只能顯示對話過程,無法描述所需AI的復(fù)雜程度等。百度的產(chǎn)品經(jīng)理和工程師會(huì)在一起,寫五十種對話,
- 人:“請幫我定一個(gè)結(jié)婚紀(jì)念日的餐館”;
- AI:“你需要訂花嗎?”;
這時(shí)候,工程師會(huì)問一些更具體的問題,比如每種場景是否都需要繼續(xù)提配套產(chǎn)品的問題,比如談到圣誕節(jié)時(shí),是否要問對方要不要買圣誕裝飾?一起思考,共同討論需求和技術(shù),很有效。
對AI的宣傳里,有很多吸引眼球的技術(shù),不過它們未必最有用。如何將吸引眼球的技術(shù)和產(chǎn)品、業(yè)務(wù)相結(jié)合?軟件產(chǎn)業(yè)已經(jīng)有標(biāo)準(zhǔn)流程,比如代碼審查、敏捷開發(fā)等,如何組織AI的產(chǎn)品工作,有很長的路要走,現(xiàn)在正是考慮這些問題的時(shí)候。
短期內(nèi),AI有哪些機(jī)會(huì)?
語音識別正在起飛
最近準(zhǔn)確率已經(jīng)提高到很有用的程度。4-5個(gè)月之前,斯坦福大學(xué)計(jì)算機(jī)系教授James Landay、百度、華盛頓大學(xué)一起展示了在手機(jī)上輸入英文和普通話,用語音識別的速度比用手機(jī)輸入快3倍。去年百度的所有語音識別產(chǎn)品年度環(huán)比增長大約100%,現(xiàn)在正是語音識別技術(shù)騰飛之時(shí)。美國有幾個(gè)公司做智能語音控制器(Smart Speakers),用語音控制家用設(shè)備也會(huì)很快推廣。相關(guān)的操作系統(tǒng)和硬件都會(huì)很快發(fā)布。
計(jì)算機(jī)視覺也即將到來
中國的人臉識別發(fā)展速度很快。因?yàn)橹袊氖謾C(jī)比筆記本更普及,很多人有手機(jī),而不一定有筆記本。 在中國可以僅僅憑手機(jī)申請助學(xué)貸款。涉及到錢,所以需要先驗(yàn)證身份和很多東西。這加速了人臉識別的發(fā)展。通過手機(jī)進(jìn)行人臉識別,作為 用生物標(biāo)識進(jìn)行身份認(rèn)證的一種方法,在中國發(fā)展很快。
在百度總部,不需要RFID卡進(jìn)行認(rèn)證,而是直接刷臉進(jìn)門,Andrew Ng在YouTube上有一段視頻。現(xiàn)在人們對人臉識別技術(shù)已經(jīng)足夠信任,并在安全要求較高的場景下使用。
百度在語音識別和計(jì)算機(jī)識別上的資金投入和數(shù)據(jù)投入巨大,任何小開發(fā)團(tuán)體遠(yuǎn)遠(yuǎn)無法相提并論,也不太可能有其他出乎意料的技術(shù)突破。
醫(yī)療健康的AI應(yīng)用
Andrew Ng對AI對醫(yī)療健康領(lǐng)域帶來的影響很看好。很多現(xiàn)在的放射科醫(yī)生會(huì)被AI影響到。如果想在放射科一直工作四十年,不是個(gè)好的職業(yè)計(jì)劃。
還有很多垂直領(lǐng)域?qū)⑹艿紸I的影響,比如金融工程和教育。不過短期之內(nèi)還不太會(huì)對教育產(chǎn)生實(shí)質(zhì)性的影響。
永恒的春天
光從監(jiān)督學(xué)習(xí)已經(jīng)看得出AI將如何逐漸改變各個(gè)行業(yè)。其他的AI形式,比如無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等等,都還在研究階段,現(xiàn)在的市場規(guī)模較小。
有很多行業(yè)會(huì)經(jīng)歷幾個(gè)冬天,然后迎來永恒的春天。AI經(jīng)歷過兩個(gè)冬天,現(xiàn)在已經(jīng)進(jìn)入永恒的春天。就像硅的春天一樣,半導(dǎo)體、晶體管、計(jì)算周期這些都將和人類一起發(fā)展很久。神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)會(huì)繁榮很長時(shí)間,一百年或許太遠(yuǎn),但一些重要應(yīng)用改變幾個(gè)大行業(yè)的路線圖已經(jīng)很清晰。
AI確實(shí)正在取代人類的一些崗位。當(dāng)某些崗位被AI取代后,我們需要新的教育系統(tǒng),來幫助失去工作的人獲得新的技能。政府應(yīng)該為這些愿意學(xué)習(xí)新技能的人,提供基本收入保障,重新成為勞動(dòng)者的一員。我們需要新的系統(tǒng)和結(jié)構(gòu),來讓幫助社會(huì)向新世界進(jìn)化。雖然會(huì)有新類型的工作,但工作崗位的消失也比以前更快。
一些問題
大公司在數(shù)據(jù)和人才上有巨大優(yōu)勢,那么創(chuàng)業(yè)公司的機(jī)會(huì)在哪里? 投資者可以關(guān)注哪種規(guī)模的創(chuàng)新?
在語音識別、人臉識別上,小公司非常難與大公司競爭,除非有意料之外的技術(shù)突破。同時(shí),也有很多小垂直領(lǐng)域適合創(chuàng)業(yè)公司,比如醫(yī)療影像。有一些疾病的病例不多,如果有一千張影像,也許就涵蓋了所有所需的數(shù)據(jù)了,一些垂直領(lǐng)域需要的數(shù)據(jù)量也不大。
另外,AI的機(jī)遇非常多,大公司會(huì)放棄很多的小的垂直市場,因?yàn)榫τ邢蓿蟮臋C(jī)會(huì)還研究不過來。
AI在發(fā)明創(chuàng)造上,有哪些進(jìn)展?
還很早期。AI可以作曲,但這很主觀。20年前的技術(shù)做出來的曲子有人喜歡,有人不喜歡。有些項(xiàng)目用AI制作圖片特效,用特效模仿某畫家作品,這些都是小而有趣的領(lǐng)域。 現(xiàn)在還看不到有什么技術(shù)路線能發(fā)明復(fù)雜的系統(tǒng)。
如果摩爾定律不再成立,對AI的擴(kuò)展性有什么影響?
一些高性能計(jì)算公司的硬件路線圖顯示,摩爾定律在單芯片上不再那么有效,但神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)所需的計(jì)算類型在未來幾年仍然能很好地?cái)U(kuò)展。SIMD(單指令多數(shù)據(jù))讓并行化處理負(fù)載非常容易。神經(jīng)網(wǎng)絡(luò)很容易并行化,加速計(jì)算的空間還很大。
AI面對的諸多問題中,許多問題的瓶頸在于數(shù)據(jù),也有很多的瓶頸在于計(jì)算速度——能便宜地處理數(shù)據(jù)的速度趕不上獲得數(shù)據(jù)的速度。所以高性能計(jì)算的路線圖應(yīng)該包括這方面。
算法是AI里的特殊作料。是否應(yīng)通過知識產(chǎn)權(quán)保護(hù),還是繞過這個(gè)問題去設(shè)計(jì)產(chǎn)品? 對機(jī)器學(xué)習(xí)的研究者,是否有和AI產(chǎn)品經(jīng)理-工程師那樣類似的流程或良性循環(huán),來實(shí)現(xiàn)突破或改善研究流程?
知識產(chǎn)權(quán)的問題比較難講。有些公司申請了大量專利,但是是否真能帶來實(shí)質(zhì)性的保護(hù)?所以我們往往從如何從戰(zhàn)略上思考細(xì)節(jié),比如讓數(shù)據(jù)保護(hù)自己。
研究機(jī)構(gòu)更偏好新鮮、搶眼球的東西,來發(fā)表論文。訓(xùn)練新研究者的辦法通常是讀很多論文。而大家常常忽視重復(fù)論文里的試驗(yàn)的重要性。不一定要把精力大量用于發(fā)明新東西,而花時(shí)間重復(fù)別人的發(fā)布結(jié)果也是很好的培訓(xùn)方法。和培訓(xùn)博士生一樣:去學(xué)習(xí)和理解別人的論文,重復(fù)別人的試驗(yàn),爭取獲得類似的結(jié)果,很快你就能產(chǎn)生自己的想法去推動(dòng)最新的科技。
對希望從事機(jī)器人相關(guān)工作的機(jī)械工程學(xué)生,有哪些和AI、機(jī)器人相關(guān)的機(jī)會(huì)比較適合?
很多機(jī)械工程背景的人,在AI領(lǐng)域很成功。可以上一些計(jì)算機(jī)/AI課程,和AI領(lǐng)域的老師聊聊。一些垂直領(lǐng)域存在有趣的AI機(jī)器人的機(jī)會(huì),比如精準(zhǔn)農(nóng)業(yè)。Blue River用計(jì)算機(jī)視覺來區(qū)分不同植物,比如不同品種卷心菜,選擇留下哪些,除掉哪些,來提高產(chǎn)量。
中國也生產(chǎn)和銷售很多社交和伴侶機(jī)器人,美國還沒起怎么起步。
讓AI和人配合起來的前景如何?很多AI應(yīng)用是基于AI自己,如果采用AI+人的混合方案?比如自動(dòng)駕駛等?
沒有統(tǒng)一的規(guī)則,應(yīng)該跟實(shí)際情況有關(guān)。很多語音識別是為了讓人類更高效,比如通過手機(jī)。對自動(dòng)駕駛汽車,可能需要10-15秒來轉(zhuǎn)換控制權(quán),因?yàn)殡y讓容易分神的人快速接手駕駛,很困難。這種情況下,由AI獨(dú)立控制更安全。 所以從使用者角度來講,人類和AI混合的自動(dòng)化比較困難。
對在線教育而言,主要問題是動(dòng)機(jī),人們不愿意花那么多時(shí)間來學(xué)完整個(gè)課程。這是不是最大的挑戰(zhàn)? 其他還有什么挑戰(zhàn)?
AI對在線教育有幫助。個(gè)性化的輔導(dǎo)已經(jīng)談?wù)摿撕荛L時(shí)間,Coursera用AI推薦個(gè)性化的課程,自動(dòng)打分,在細(xì)節(jié)上確實(shí)有幫助。但在利用AI之前,教育的數(shù)字化還有很長的路要走。很多行業(yè)都有個(gè)規(guī)律:先有數(shù)據(jù),再有AI,比如醫(yī)療,美國電子病歷(EHR)的進(jìn)展很大。隨著電子病歷的興起,影像膠片變成數(shù)碼圖片,這些數(shù)字化產(chǎn)生了很多數(shù)據(jù)供AI使用,并產(chǎn)生價(jià)值。教育需要先經(jīng)歷數(shù)字化,這一階段還有很多工作要做。
百度如何用AI來管理自己的云上數(shù)據(jù)中心? 比如IT運(yùn)維管理的例子?
兩年前,百度做了個(gè)項(xiàng)目,可以提前一天自動(dòng)檢測出硬件故障,特別是硬盤故障。這就可以事先拷貝、熱插拔進(jìn)行預(yù)防處理。還可以降低數(shù)據(jù)中心的用電量,負(fù)載均衡等,都是很多小細(xì)節(jié)的改善。
能否舉一些例子說明能通過仔細(xì)地建模和規(guī)劃,用AI解決的復(fù)雜問題?對這些問題,人類可能需要進(jìn)行長時(shí)間的思考。
亞馬遜是個(gè)很好的例子。它知道我瀏覽過什么,讀過什么,比我太太更了解。電腦對人們看過什么,點(diǎn)擊過什么廣告更了解,所以在廣告方面做得非常好。 對于有些任務(wù),計(jì)算機(jī)可以處理的信息量遠(yuǎn)遠(yuǎn)超過人類,并根據(jù)規(guī)律建模,進(jìn)行預(yù)測,這方面AI比人做得更好。
將AI融入人類工作的很大一部分,是將一塊塊的AI部分串成一個(gè)大系統(tǒng)。比如為了造自動(dòng)駕駛汽車,要用相機(jī)拍攝的圖像,雷達(dá)等,組成車前方的一幅圖,再由監(jiān)督學(xué)習(xí)估算和其他車的距離,以及和行人的距離,這只是兩個(gè)重要的AI部件,還需要其他的部件來估計(jì)5秒后車的位置,行人的方向。還有一個(gè)部件來分析,根據(jù)行人車輛等不同對象的運(yùn)動(dòng)情況,我應(yīng)該怎么走? 然后還需要算方向盤的旋轉(zhuǎn)程度,以此類推。
所以復(fù)雜的AI系統(tǒng)有很多小AI部件,工程人員要知道如何將這種超級學(xué)習(xí)能力融合到更大的系統(tǒng)里,來創(chuàng)造價(jià)值。
產(chǎn)品經(jīng)理和社會(huì)學(xué)家、律師等如何協(xié)調(diào)?比如自動(dòng)駕駛汽車在撞人前,開發(fā)者和AI應(yīng)從駕駛者,還是行人的角度考慮問題?這只是個(gè)法律問題,但也有很多類似情況。產(chǎn)品管理者和不同的功能部門的合作時(shí),應(yīng)該扮演什么角色?
這個(gè)問題的一個(gè)相似版本是“有軌電車”問題,會(huì)產(chǎn)生倫理矛盾。一個(gè)電車走到岔道口,繼續(xù)往前會(huì)撞死5個(gè)人,你可以用扳手將電車扳到另一條軌道,撞死該軌道上的一個(gè)人,而你成為兇手,你扳嗎?
除了在哲學(xué)課里,很少有誰在現(xiàn)實(shí)生活里遇到過這個(gè)問題,所以,它并不重要。自動(dòng)駕駛的開發(fā)者沒去討論它。實(shí)際上,如果誰真正遇到了,可能之前已經(jīng)犯了其他錯(cuò)誤了。自動(dòng)駕駛處理的問題更實(shí)際,和你自己開車一樣。比如,對面有個(gè)白色的大車,是否能及時(shí)剎車?

2017年2月,百度首席科學(xué)家、Coursera的聯(lián)合創(chuàng)始人Andrew Ng在斯坦福MSx未來論壇上的一個(gè)演講,吸引了全球的眼球。 他認(rèn)為,人工智能(AI)對未來許多行業(yè)帶來的變革,如同100多年前,美國“觸電”一樣——電對制造、運(yùn)輸、農(nóng)業(yè)(尤其是冷藏)、醫(yī)療等等帶來了劃時(shí)代的變革。
AI驅(qū)動(dòng)著百度的搜索和廣告,調(diào)度百度外賣的快遞員,選擇路線,和預(yù)估運(yùn)送時(shí)間。AI正在徹底改變金融工程,對物流的轉(zhuǎn)變進(jìn)行了一半,醫(yī)療和自動(dòng)駕駛剛開始,而前景巨大。和“電”帶來的變革一樣,很難想象哪個(gè)行業(yè)不會(huì)被AI改變。
監(jiān)督學(xué)習(xí)
驅(qū)動(dòng)百億的市場容量的,基本上屬于同一種AI: 監(jiān)督學(xué)習(xí)(Supervised learning),即用AI來確定A-->B的映射——輸入A和響應(yīng)B的映射。
用Email作為輸入A,判斷是否是垃圾郵件是響應(yīng)B。
用圖像作為輸入,識別這是一千種物體中的哪種?
從聲音A到文字B,從英文到法文,或從文字到聲音。
軟件可以學(xué)習(xí)這些輸入A到響應(yīng)B的映射——有很多好的工具來讓機(jī)器學(xué)習(xí)。比如50,000小時(shí)的音頻和對應(yīng)的文本,就能讓機(jī)器學(xué)到如何從音頻內(nèi)容轉(zhuǎn)化為文本內(nèi)容。通過大量的電郵數(shù)據(jù)和區(qū)分垃圾的標(biāo)簽,也可以很快地訓(xùn)練出一個(gè)垃圾郵件過濾器。
現(xiàn)在的AI還很初級——A到B的映射而已,不過已經(jīng)推動(dòng)著很大的市場。百度有很好的算法來預(yù)測某用戶是否會(huì)點(diǎn)擊某廣告。向受眾呈現(xiàn)更相關(guān)的廣告,能為互聯(lián)網(wǎng)營銷和廣告公司帶來極大的賺錢機(jī)會(huì)。這可能是AI最賺錢的應(yīng)用。
在哪些產(chǎn)品里能用到AI?
產(chǎn)品經(jīng)理常常希望了解AI能實(shí)現(xiàn)的,和不能實(shí)現(xiàn)的。一個(gè)簡單的思路是:一般人能在一秒內(nèi)想出來的事情,現(xiàn)在或很快就可以用AI自動(dòng)實(shí)現(xiàn)。
AI進(jìn)展最快的領(lǐng)域正是人能做得到的領(lǐng)域。比如自動(dòng)駕駛。人類能駕駛,所以AI也能駕駛。在醫(yī)學(xué)影像閱片和分析上,人類放射科醫(yī)生能夠閱片,所以AI也很可能在未來幾年內(nèi)做到。
而人類難以做到的事情,比如預(yù)測股市變化,AI可能也難。
原因1:人類能做的,至少是可行的;
原因2:可以利用人類的數(shù)據(jù)作為培訓(xùn)樣本,比如前面提到的輸入A和響應(yīng)B;
原因3:人類能提供指導(dǎo)。如果AI對某個(gè)放射影像的結(jié)論有誤,設(shè)計(jì)者可以向醫(yī)生請教,醫(yī)生所做的正確結(jié)論的原因是什么? 進(jìn)而對AI進(jìn)行改善。
在Andrew Ng所接觸到的80-90%的AI項(xiàng)目中,都遵循這一規(guī)律:在人類能做到的領(lǐng)域,AI的進(jìn)展更快。很多項(xiàng)目的發(fā)展一旦超越人類水準(zhǔn),發(fā)展也會(huì)變得緩慢。這也帶來一個(gè)社會(huì)矛盾:如果AI和人的水平類似,實(shí)質(zhì)上是跟人類競爭。
AI的發(fā)展趨勢
AI已經(jīng)出現(xiàn)了幾十年了,而近五年發(fā)展明顯加速,為什么?
當(dāng)以前的機(jī)器學(xué)習(xí)算法性能上升到一定程度,即使再增加數(shù)據(jù)樣本量(前文談到的輸入A、響應(yīng)B的A-B映射),性能改善也很有限。似乎超過一定樣本量之后,再多的數(shù)據(jù)也對算法不起作用。
而過去幾年,主要由于GPU,我們終于實(shí)現(xiàn)了能利用這么巨大的數(shù)據(jù)集的機(jī)器學(xué)習(xí)軟件。將數(shù)據(jù)輸入一個(gè)小的神經(jīng)網(wǎng)絡(luò),當(dāng)超過一定性能后,上升變得平緩。而不斷地把數(shù)據(jù)輸入一個(gè)很大的神經(jīng)網(wǎng)絡(luò)時(shí),即使性能上升沒有那么快,也會(huì)保持上升趨勢,隨著數(shù)據(jù)量的增大,不斷提高。
因此,要想獲得很好的AI性能,需要兩樣?xùn)|西:
很大的A-B映射的數(shù)據(jù)集;
大的神經(jīng)網(wǎng)絡(luò)。現(xiàn)在常用的大型神經(jīng)網(wǎng)絡(luò)建立在HPC高性能計(jì)算集群上。
現(xiàn)在的大型AI團(tuán)隊(duì)包括機(jī)器學(xué)習(xí)和高性能計(jì)算兩組人,才能獲得足夠計(jì)算能力。百度AI團(tuán)隊(duì)里的這兩種人員都專注于各自領(lǐng)域,沒有人能兩者兼?zhèn)洹?br />
什么是神經(jīng)網(wǎng)絡(luò)?有沒可能取代人類大腦?
問題是,我們不清楚人腦如何工作,所以很難造出取代人類大腦的神經(jīng)網(wǎng)絡(luò)。
什么是神經(jīng)網(wǎng)絡(luò)?先看個(gè)最簡單的神經(jīng)網(wǎng)絡(luò):
如果想輸入房屋面積,得到房屋總價(jià),可以用面積-總價(jià)的一階近似的線性模型來描述這個(gè)神經(jīng)網(wǎng)絡(luò)。
或者用更多因素建模,比如通過面積和臥室數(shù),從第一個(gè)神經(jīng)元得到可以支持的家庭人數(shù)。再通過所在地址的郵編和社區(qū)富裕程度,從第二個(gè)神經(jīng)元得到附近學(xué)校的質(zhì)量。

這就成為一個(gè)神經(jīng)網(wǎng)絡(luò)。面積、臥室數(shù)、郵編、社區(qū)富裕程度屬于“輸入”集合A,總價(jià)屬于“響應(yīng)”集合B。
好處在于,當(dāng)訓(xùn)練這樣一個(gè)神經(jīng)網(wǎng)絡(luò)時(shí),用戶無需關(guān)心中間因素,諸如家庭人數(shù)、安全度、學(xué)校質(zhì)量等,也無需關(guān)心每個(gè)神經(jīng)元如何將輸入映射到中間結(jié)果。只需要給出輸入集合A和響應(yīng)集合B,神經(jīng)網(wǎng)絡(luò)將自動(dòng)形成中間的計(jì)算過程和參數(shù)。當(dāng)A和B的集合足夠大,神經(jīng)網(wǎng)絡(luò)可以自動(dòng)算出很多東西。 神經(jīng)網(wǎng)絡(luò)看上去非常簡單,讓很多初學(xué)者覺得有點(diǎn)失望,但它確實(shí)能解決很多問題。關(guān)鍵在于數(shù)據(jù)量要夠大——幾萬或幾十萬個(gè)樣本本身能提供大量的信息,而軟件本身只是一小部分。
如何保護(hù)AI業(yè)務(wù)?
AI研究較前沿的團(tuán)隊(duì)都比較開放,常常發(fā)布研究成果。百度的AI研究論文也沒有隱藏什么成果——在人臉識別等論文里,都分享了所有的細(xì)節(jié)。既然很難把算法本身隱藏起來,如何保護(hù)AI業(yè)務(wù)? 當(dāng)前稀缺資源有兩種,一種是數(shù)據(jù),二是人才。獲取巨量數(shù)據(jù)很難,要包括輸入A+響應(yīng)B。比如語音識別用了5萬小時(shí)的音頻來訓(xùn)練,今年準(zhǔn)備用10萬小時(shí),相當(dāng)于百度10年積累的音頻。
以人臉識別所用的訓(xùn)練圖像數(shù)量為例
學(xué)術(shù)上最常用的基準(zhǔn)測試/比賽:1百萬幅;
所用圖像數(shù)最多的計(jì)算機(jī)視覺對象識別學(xué)術(shù)論文:1500萬幅;
百度用來訓(xùn)練世界上最先進(jìn)的人臉識別系統(tǒng):兩億幅!
如果只是5-10人的研發(fā)團(tuán)隊(duì),很難獲得這樣規(guī)模的數(shù)據(jù)。百度這樣的大企業(yè)的經(jīng)常推出一些新產(chǎn)品不一定是為了營收,而是為了數(shù)據(jù),然后通過后續(xù)的產(chǎn)品來獲得收益。
另一個(gè)稀缺資源是人才。AI的應(yīng)用需要根據(jù)具體業(yè)務(wù)場景來定制。僅僅下載個(gè)開源包,無法解決問題。實(shí)際情況下,是否適合用某種垃圾郵件識別或語音識別技術(shù)?針對某種場景,機(jī)器學(xué)習(xí)怎么用? 所以各個(gè)公司都在為數(shù)據(jù)挖掘爭奪AI人才,來定制AI技術(shù),找到所需要的A和B各自代表什么,怎么找到這些數(shù)據(jù)和如何調(diào)整算法來適應(yīng)業(yè)務(wù)場景。
AI的良性循環(huán)
先做出某種產(chǎn)品。比如通過語音識別,以語音實(shí)現(xiàn)搜索;
然后吸引來很多用戶,用戶產(chǎn)生數(shù)據(jù);
再通過機(jī)器學(xué)習(xí),用數(shù)據(jù)改善產(chǎn)品。
這就形成了AI產(chǎn)品的良性循環(huán)。最好的產(chǎn)品能獲得最多的用戶,帶來最多的數(shù)據(jù),通過現(xiàn)代機(jī)器學(xué)習(xí)體系,能得到最好的AI,最終讓產(chǎn)品變得更好,周而復(fù)始。
百度發(fā)布新的產(chǎn)品,會(huì)特別考慮怎樣推動(dòng)這樣的良性循環(huán),會(huì)包括相當(dāng)先進(jìn)的產(chǎn)品發(fā)布策略,比如按地理區(qū)域、細(xì)分市場等,來更好地推動(dòng)這個(gè)循環(huán)。
這種良性循環(huán)的理念很早就有了,只是最近變得更加明顯。正如前文所述,當(dāng)數(shù)據(jù)超過一定規(guī)模后,傳統(tǒng)AI算法無法明顯改善AI性能,因此數(shù)據(jù)多的優(yōu)勢不明顯,大公司也很難保護(hù)自己的AI業(yè)務(wù)。現(xiàn)在數(shù)據(jù)越多,AI性能越好,大公司也更容易保護(hù)自己的優(yōu)勢。
AI炒作的非良性循環(huán)
許多人擔(dān)心AI會(huì)不會(huì)取代或威脅人類。有一小部分研究AI的人專門從事對“邪惡AI”的炒作,以獲得投資人或政府機(jī)構(gòu)的投資,來研究“反邪惡AI”。道高一尺,魔高一丈,又進(jìn)一步推動(dòng)對“邪惡AI”的炒作,從而形成非良性循環(huán),非常不健康。
擔(dān)心AI變得邪惡,類似于擔(dān)心火星的未來人口過剩。現(xiàn)在看不出AI將會(huì)怎樣走偏,因此也談不上有針對地研究相應(yīng)措施。 研究本身沒有問題,不同的研究是好事,但是對邪惡AI的研究占用不恰當(dāng)?shù)馁Y源,就不應(yīng)該了。兩個(gè)人,或者10個(gè)人來研究邪惡AI也許沒問題,但是現(xiàn)在投資得太多。
AI對就業(yè)的影響
AI對就業(yè)帶來的影響更讓人擔(dān)心。有些AI項(xiàng)目確實(shí)是瞄準(zhǔn)了某些人類崗位,而從事這些工作的人并不清楚嚴(yán)重性。硅谷創(chuàng)造了大量財(cái)富,但也應(yīng)該對其造成的問題承擔(dān)責(zé)任,比如造成的失業(yè)問題。AI取代人類崗位的現(xiàn)實(shí)問題,更應(yīng)該引起重視,而不是被邪惡AI的炒作轉(zhuǎn)移了注意力。
AI產(chǎn)品管理
AI是個(gè)讓人興奮的領(lǐng)域,同時(shí)也存在一些挑戰(zhàn)。 如何將AI融入公司業(yè)務(wù)?
產(chǎn)品經(jīng)理的職責(zé)是找到用戶喜歡的,而工程師的角色是做出可行的產(chǎn)品。兩者共同協(xié)作,才能做出理想的產(chǎn)品。
AI是個(gè)新生事物,所以技術(shù)公司以前的流程和工作方法,不太適用。硅谷的產(chǎn)品經(jīng)理和工程師的合作已有一套標(biāo)準(zhǔn)流程。比如開發(fā)APP時(shí),產(chǎn)品經(jīng)理先畫出線框圖,比如logo,按鈕,各個(gè)板塊等,工程師再寫出代碼來實(shí)現(xiàn)。但是AI的APP無法通過畫線框來描述。通過什么形式,把產(chǎn)品經(jīng)理頭腦里對AI產(chǎn)品的功能要求明白地分享給工程師呢?
比如開發(fā)語音識別系統(tǒng),實(shí)現(xiàn)語音搜索,有很多改善方向。比如:
在嘈雜環(huán)境下如何改善,比如車?yán)锘蚩Х瑞^?
僅改善窄帶語音信號;
對不同口音改善;
百度發(fā)現(xiàn),產(chǎn)品經(jīng)理通過數(shù)據(jù)和工程師溝通,是個(gè)較好的辦法。 產(chǎn)品經(jīng)理負(fù)責(zé)提供測試數(shù)據(jù)集給工程師,比如一萬個(gè)音頻和對應(yīng)的文字,來說明所關(guān)心的問題,工程師也能更明白需要解決的問題。如果這些音頻里有大量車輛噪音,工程師就知道車輛噪音是問題。 如果是混合了幾種不同噪聲,工程師也能想辦法解決。最糟糕的情況是,產(chǎn)品經(jīng)理提供的測試數(shù)據(jù),并不能代表自己想解決的問題,那就出問題了。
同時(shí),新產(chǎn)品設(shè)計(jì)的流程有很多, 比如想設(shè)計(jì)一個(gè)交流型AI機(jī)器人:
- 人:“我想叫個(gè)外賣”;
- AI:“你喜歡哪種類型餐館?”;
- 人:“川菜”;
- AI:“這些可供選擇,xxx,yyy,zzz,...”;
線框圖只能顯示對話過程,無法描述所需AI的復(fù)雜程度等。百度的產(chǎn)品經(jīng)理和工程師會(huì)在一起,寫五十種對話,
- 人:“請幫我定一個(gè)結(jié)婚紀(jì)念日的餐館”;
- AI:“你需要訂花嗎?”;
這時(shí)候,工程師會(huì)問一些更具體的問題,比如每種場景是否都需要繼續(xù)提配套產(chǎn)品的問題,比如談到圣誕節(jié)時(shí),是否要問對方要不要買圣誕裝飾?一起思考,共同討論需求和技術(shù),很有效。
對AI的宣傳里,有很多吸引眼球的技術(shù),不過它們未必最有用。如何將吸引眼球的技術(shù)和產(chǎn)品、業(yè)務(wù)相結(jié)合?軟件產(chǎn)業(yè)已經(jīng)有標(biāo)準(zhǔn)流程,比如代碼審查、敏捷開發(fā)等,如何組織AI的產(chǎn)品工作,有很長的路要走,現(xiàn)在正是考慮這些問題的時(shí)候。
短期內(nèi),AI有哪些機(jī)會(huì)?
語音識別正在起飛
最近準(zhǔn)確率已經(jīng)提高到很有用的程度。4-5個(gè)月之前,斯坦福大學(xué)計(jì)算機(jī)系教授James Landay、百度、華盛頓大學(xué)一起展示了在手機(jī)上輸入英文和普通話,用語音識別的速度比用手機(jī)輸入快3倍。去年百度的所有語音識別產(chǎn)品年度環(huán)比增長大約100%,現(xiàn)在正是語音識別技術(shù)騰飛之時(shí)。美國有幾個(gè)公司做智能語音控制器(Smart Speakers),用語音控制家用設(shè)備也會(huì)很快推廣。相關(guān)的操作系統(tǒng)和硬件都會(huì)很快發(fā)布。
計(jì)算機(jī)視覺也即將到來
中國的人臉識別發(fā)展速度很快。因?yàn)橹袊氖謾C(jī)比筆記本更普及,很多人有手機(jī),而不一定有筆記本。 在中國可以僅僅憑手機(jī)申請助學(xué)貸款。涉及到錢,所以需要先驗(yàn)證身份和很多東西。這加速了人臉識別的發(fā)展。通過手機(jī)進(jìn)行人臉識別,作為 用生物標(biāo)識進(jìn)行身份認(rèn)證的一種方法,在中國發(fā)展很快。
在百度總部,不需要RFID卡進(jìn)行認(rèn)證,而是直接刷臉進(jìn)門,Andrew Ng在YouTube上有一段視頻。現(xiàn)在人們對人臉識別技術(shù)已經(jīng)足夠信任,并在安全要求較高的場景下使用。
百度在語音識別和計(jì)算機(jī)識別上的資金投入和數(shù)據(jù)投入巨大,任何小開發(fā)團(tuán)體遠(yuǎn)遠(yuǎn)無法相提并論,也不太可能有其他出乎意料的技術(shù)突破。
醫(yī)療健康的AI應(yīng)用
Andrew Ng對AI對醫(yī)療健康領(lǐng)域帶來的影響很看好。很多現(xiàn)在的放射科醫(yī)生會(huì)被AI影響到。如果想在放射科一直工作四十年,不是個(gè)好的職業(yè)計(jì)劃。
還有很多垂直領(lǐng)域?qū)⑹艿紸I的影響,比如金融工程和教育。不過短期之內(nèi)還不太會(huì)對教育產(chǎn)生實(shí)質(zhì)性的影響。
永恒的春天
光從監(jiān)督學(xué)習(xí)已經(jīng)看得出AI將如何逐漸改變各個(gè)行業(yè)。其他的AI形式,比如無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等等,都還在研究階段,現(xiàn)在的市場規(guī)模較小。
有很多行業(yè)會(huì)經(jīng)歷幾個(gè)冬天,然后迎來永恒的春天。AI經(jīng)歷過兩個(gè)冬天,現(xiàn)在已經(jīng)進(jìn)入永恒的春天。就像硅的春天一樣,半導(dǎo)體、晶體管、計(jì)算周期這些都將和人類一起發(fā)展很久。神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)會(huì)繁榮很長時(shí)間,一百年或許太遠(yuǎn),但一些重要應(yīng)用改變幾個(gè)大行業(yè)的路線圖已經(jīng)很清晰。
AI確實(shí)正在取代人類的一些崗位。當(dāng)某些崗位被AI取代后,我們需要新的教育系統(tǒng),來幫助失去工作的人獲得新的技能。政府應(yīng)該為這些愿意學(xué)習(xí)新技能的人,提供基本收入保障,重新成為勞動(dòng)者的一員。我們需要新的系統(tǒng)和結(jié)構(gòu),來讓幫助社會(huì)向新世界進(jìn)化。雖然會(huì)有新類型的工作,但工作崗位的消失也比以前更快。
一些問題
大公司在數(shù)據(jù)和人才上有巨大優(yōu)勢,那么創(chuàng)業(yè)公司的機(jī)會(huì)在哪里? 投資者可以關(guān)注哪種規(guī)模的創(chuàng)新?
在語音識別、人臉識別上,小公司非常難與大公司競爭,除非有意料之外的技術(shù)突破。同時(shí),也有很多小垂直領(lǐng)域適合創(chuàng)業(yè)公司,比如醫(yī)療影像。有一些疾病的病例不多,如果有一千張影像,也許就涵蓋了所有所需的數(shù)據(jù)了,一些垂直領(lǐng)域需要的數(shù)據(jù)量也不大。
另外,AI的機(jī)遇非常多,大公司會(huì)放棄很多的小的垂直市場,因?yàn)榫τ邢蓿蟮臋C(jī)會(huì)還研究不過來。
AI在發(fā)明創(chuàng)造上,有哪些進(jìn)展?
還很早期。AI可以作曲,但這很主觀。20年前的技術(shù)做出來的曲子有人喜歡,有人不喜歡。有些項(xiàng)目用AI制作圖片特效,用特效模仿某畫家作品,這些都是小而有趣的領(lǐng)域。 現(xiàn)在還看不到有什么技術(shù)路線能發(fā)明復(fù)雜的系統(tǒng)。
如果摩爾定律不再成立,對AI的擴(kuò)展性有什么影響?
一些高性能計(jì)算公司的硬件路線圖顯示,摩爾定律在單芯片上不再那么有效,但神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)所需的計(jì)算類型在未來幾年仍然能很好地?cái)U(kuò)展。SIMD(單指令多數(shù)據(jù))讓并行化處理負(fù)載非常容易。神經(jīng)網(wǎng)絡(luò)很容易并行化,加速計(jì)算的空間還很大。
AI面對的諸多問題中,許多問題的瓶頸在于數(shù)據(jù),也有很多的瓶頸在于計(jì)算速度——能便宜地處理數(shù)據(jù)的速度趕不上獲得數(shù)據(jù)的速度。所以高性能計(jì)算的路線圖應(yīng)該包括這方面。
算法是AI里的特殊作料。是否應(yīng)通過知識產(chǎn)權(quán)保護(hù),還是繞過這個(gè)問題去設(shè)計(jì)產(chǎn)品? 對機(jī)器學(xué)習(xí)的研究者,是否有和AI產(chǎn)品經(jīng)理-工程師那樣類似的流程或良性循環(huán),來實(shí)現(xiàn)突破或改善研究流程?
知識產(chǎn)權(quán)的問題比較難講。有些公司申請了大量專利,但是是否真能帶來實(shí)質(zhì)性的保護(hù)?所以我們往往從如何從戰(zhàn)略上思考細(xì)節(jié),比如讓數(shù)據(jù)保護(hù)自己。
研究機(jī)構(gòu)更偏好新鮮、搶眼球的東西,來發(fā)表論文。訓(xùn)練新研究者的辦法通常是讀很多論文。而大家常常忽視重復(fù)論文里的試驗(yàn)的重要性。不一定要把精力大量用于發(fā)明新東西,而花時(shí)間重復(fù)別人的發(fā)布結(jié)果也是很好的培訓(xùn)方法。和培訓(xùn)博士生一樣:去學(xué)習(xí)和理解別人的論文,重復(fù)別人的試驗(yàn),爭取獲得類似的結(jié)果,很快你就能產(chǎn)生自己的想法去推動(dòng)最新的科技。
對希望從事機(jī)器人相關(guān)工作的機(jī)械工程學(xué)生,有哪些和AI、機(jī)器人相關(guān)的機(jī)會(huì)比較適合?
很多機(jī)械工程背景的人,在AI領(lǐng)域很成功。可以上一些計(jì)算機(jī)/AI課程,和AI領(lǐng)域的老師聊聊。一些垂直領(lǐng)域存在有趣的AI機(jī)器人的機(jī)會(huì),比如精準(zhǔn)農(nóng)業(yè)。Blue River用計(jì)算機(jī)視覺來區(qū)分不同植物,比如不同品種卷心菜,選擇留下哪些,除掉哪些,來提高產(chǎn)量。
中國也生產(chǎn)和銷售很多社交和伴侶機(jī)器人,美國還沒起怎么起步。
讓AI和人配合起來的前景如何?很多AI應(yīng)用是基于AI自己,如果采用AI+人的混合方案?比如自動(dòng)駕駛等?
沒有統(tǒng)一的規(guī)則,應(yīng)該跟實(shí)際情況有關(guān)。很多語音識別是為了讓人類更高效,比如通過手機(jī)。對自動(dòng)駕駛汽車,可能需要10-15秒來轉(zhuǎn)換控制權(quán),因?yàn)殡y讓容易分神的人快速接手駕駛,很困難。這種情況下,由AI獨(dú)立控制更安全。 所以從使用者角度來講,人類和AI混合的自動(dòng)化比較困難。
對在線教育而言,主要問題是動(dòng)機(jī),人們不愿意花那么多時(shí)間來學(xué)完整個(gè)課程。這是不是最大的挑戰(zhàn)? 其他還有什么挑戰(zhàn)?
AI對在線教育有幫助。個(gè)性化的輔導(dǎo)已經(jīng)談?wù)摿撕荛L時(shí)間,Coursera用AI推薦個(gè)性化的課程,自動(dòng)打分,在細(xì)節(jié)上確實(shí)有幫助。但在利用AI之前,教育的數(shù)字化還有很長的路要走。很多行業(yè)都有個(gè)規(guī)律:先有數(shù)據(jù),再有AI,比如醫(yī)療,美國電子病歷(EHR)的進(jìn)展很大。隨著電子病歷的興起,影像膠片變成數(shù)碼圖片,這些數(shù)字化產(chǎn)生了很多數(shù)據(jù)供AI使用,并產(chǎn)生價(jià)值。教育需要先經(jīng)歷數(shù)字化,這一階段還有很多工作要做。
百度如何用AI來管理自己的云上數(shù)據(jù)中心? 比如IT運(yùn)維管理的例子?
兩年前,百度做了個(gè)項(xiàng)目,可以提前一天自動(dòng)檢測出硬件故障,特別是硬盤故障。這就可以事先拷貝、熱插拔進(jìn)行預(yù)防處理。還可以降低數(shù)據(jù)中心的用電量,負(fù)載均衡等,都是很多小細(xì)節(jié)的改善。
能否舉一些例子說明能通過仔細(xì)地建模和規(guī)劃,用AI解決的復(fù)雜問題?對這些問題,人類可能需要進(jìn)行長時(shí)間的思考。
亞馬遜是個(gè)很好的例子。它知道我瀏覽過什么,讀過什么,比我太太更了解。電腦對人們看過什么,點(diǎn)擊過什么廣告更了解,所以在廣告方面做得非常好。 對于有些任務(wù),計(jì)算機(jī)可以處理的信息量遠(yuǎn)遠(yuǎn)超過人類,并根據(jù)規(guī)律建模,進(jìn)行預(yù)測,這方面AI比人做得更好。
將AI融入人類工作的很大一部分,是將一塊塊的AI部分串成一個(gè)大系統(tǒng)。比如為了造自動(dòng)駕駛汽車,要用相機(jī)拍攝的圖像,雷達(dá)等,組成車前方的一幅圖,再由監(jiān)督學(xué)習(xí)估算和其他車的距離,以及和行人的距離,這只是兩個(gè)重要的AI部件,還需要其他的部件來估計(jì)5秒后車的位置,行人的方向。還有一個(gè)部件來分析,根據(jù)行人車輛等不同對象的運(yùn)動(dòng)情況,我應(yīng)該怎么走? 然后還需要算方向盤的旋轉(zhuǎn)程度,以此類推。
所以復(fù)雜的AI系統(tǒng)有很多小AI部件,工程人員要知道如何將這種超級學(xué)習(xí)能力融合到更大的系統(tǒng)里,來創(chuàng)造價(jià)值。
產(chǎn)品經(jīng)理和社會(huì)學(xué)家、律師等如何協(xié)調(diào)?比如自動(dòng)駕駛汽車在撞人前,開發(fā)者和AI應(yīng)從駕駛者,還是行人的角度考慮問題?這只是個(gè)法律問題,但也有很多類似情況。產(chǎn)品管理者和不同的功能部門的合作時(shí),應(yīng)該扮演什么角色?
這個(gè)問題的一個(gè)相似版本是“有軌電車”問題,會(huì)產(chǎn)生倫理矛盾。一個(gè)電車走到岔道口,繼續(xù)往前會(huì)撞死5個(gè)人,你可以用扳手將電車扳到另一條軌道,撞死該軌道上的一個(gè)人,而你成為兇手,你扳嗎?
除了在哲學(xué)課里,很少有誰在現(xiàn)實(shí)生活里遇到過這個(gè)問題,所以,它并不重要。自動(dòng)駕駛的開發(fā)者沒去討論它。實(shí)際上,如果誰真正遇到了,可能之前已經(jīng)犯了其他錯(cuò)誤了。自動(dòng)駕駛處理的問題更實(shí)際,和你自己開車一樣。比如,對面有個(gè)白色的大車,是否能及時(shí)剎車?
相關(guān)閱讀:
-
分享本文到:
-
關(guān)注隨銳:
微信掃描,獲取最新資訊 -
聯(lián)系我們:
如果您有任何問題或建議,
請與我們聯(lián)系:
suiruikeji@suirui.com