CNET科技行者 11月13日 北京消息(文/周雅): 機(jī)器學(xué)習(xí)作為一種實(shí)現(xiàn)人工智能的方法,近年來(lái)成功案例數(shù)日益攀升,已經(jīng)從一個(gè)相對(duì)模糊的計(jì)算機(jī)科學(xué)概念,迅速發(fā)展成為企業(yè)經(jīng)濟(jì)的影響因素,因此,機(jī)器學(xué)習(xí)領(lǐng)域存在大量的資金投入也就一點(diǎn)兒也不讓人感到奇怪了。
麥肯錫公司的一項(xiàng)調(diào)查顯示,在2013年至2016年期間,人工智能開(kāi)發(fā)投資總額增加了兩倍,其中大部分投資——200億至300億美元——都來(lái)自一些科技巨頭,這些公司希望能夠產(chǎn)生機(jī)器學(xué)習(xí)以及其他人工智能模型,而這些技術(shù)在未來(lái)對(duì)于他們的客戶(hù)來(lái)說(shuō),會(huì)變成像今天的移動(dòng)和網(wǎng)絡(luò)一樣至關(guān)緊要的東西。
人工智能技術(shù)之所以能夠如此吸引人,是因?yàn)榇嬖诰薮蟮纳虡I(yè)價(jià)值。Gartner預(yù)測(cè)到2020年,人工智能技術(shù)在新的商業(yè)軟件中會(huì)變得無(wú)處不在,而且將成為30%的首席信息官投資優(yōu)先級(jí)中排名前五的技術(shù)之一。
事實(shí)就目前看來(lái),人工智能市場(chǎng)中大部分的推動(dòng)力都來(lái)自于那些樹(shù)大根深的公司:
英偉達(dá)已經(jīng)成為GPU中的主導(dǎo)者,成為機(jī)器學(xué)習(xí)培訓(xùn)階段的首選平臺(tái)。到目前為止,這是機(jī)器學(xué)習(xí)絕大部分的焦點(diǎn)所在。
英特爾推出了Nervana神經(jīng)處理器(Nervana Neural Processor),這是一款低延遲、高內(nèi)存帶寬芯片,據(jù)說(shuō)這款處理器是專(zhuān)門(mén)為了深度學(xué)習(xí)設(shè)計(jì)的。(英特爾于2016年收購(gòu)了Nervana)。
谷歌的張量處理單元(Tensor Processing Unit,TPU)已經(jīng)在機(jī)器學(xué)習(xí)加速器市場(chǎng)上站穩(wěn)了腳跟,現(xiàn)在已經(jīng)發(fā)展到第二版本。第一個(gè)版本是谷歌開(kāi)發(fā)的一款專(zhuān)用集成電路(ASIC),目標(biāo)是為了在其自己的服務(wù)器上加速其語(yǔ)音轉(zhuǎn)換文本應(yīng)用程序的推理;和第一個(gè)版本相比,第二個(gè)版本——云TPU(Cloud TPU)——更像是一個(gè)高性能的TPU集群,旨在作為訓(xùn)練模塊與英偉達(dá)(Nvidia)競(jìng)爭(zhēng)。
簡(jiǎn)單而言,機(jī)器學(xué)習(xí)直接來(lái)源于早期的人工智能領(lǐng)域,傳統(tǒng)算法包括決策樹(shù)學(xué)習(xí)、推導(dǎo)邏輯規(guī)劃、聚類(lèi)、強(qiáng)化學(xué)習(xí)和貝葉斯網(wǎng)絡(luò)等等。
機(jī)器學(xué)習(xí)最基本的做法,是使用算法來(lái)解析數(shù)據(jù)、從中學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)基于大量的數(shù)據(jù)來(lái)“訓(xùn)練”,通過(guò)各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。
本文主要針對(duì)數(shù)據(jù)中心和云計(jì)算,而這本身就是一個(gè)巨大的市場(chǎng),也是機(jī)器學(xué)習(xí)的根基。Linley集團(tuán)的首席分析師Linley Gwennap預(yù)測(cè),以數(shù)據(jù)中心為導(dǎo)向的人工智能加速器市場(chǎng)到2022年將達(dá)到120億美元的規(guī)模:“在接下來(lái)的一到兩年里,我們將開(kāi)始看到更多數(shù)據(jù)中心和其他設(shè)備的選擇?!彼J(rèn)為,“目前,類(lèi)似谷歌和Facebook這樣的科技巨頭面臨的問(wèn)題是,‘我該堅(jiān)持設(shè)計(jì)自己的芯片嗎?或者,如果企業(yè)能夠在開(kāi)放市場(chǎng)得到同樣的經(jīng)濟(jì)效益,我需要嘗試嗎?’”
很多公司會(huì)交替使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能和神經(jīng)網(wǎng)絡(luò)等技術(shù),盡管這些技術(shù)彼此之間存在著微妙的差別,但總的來(lái)說(shuō),都是基于實(shí)時(shí)數(shù)據(jù),計(jì)算機(jī)可以權(quán)衡很多不同的情況,并根據(jù)這些預(yù)設(shè)的權(quán)重做出最好的選擇——也就是數(shù)據(jù)挖掘。加權(quán)的過(guò)程是“訓(xùn)練”階段的一部分,而“推理”階段是機(jī)器學(xué)習(xí)的核心。
數(shù)據(jù)挖掘是個(gè)很寬泛的概念,數(shù)據(jù)挖掘常用方法大多來(lái)自于機(jī)器學(xué)習(xí),深度學(xué)習(xí)是機(jī)器學(xué)習(xí)一類(lèi)比較火的算法——具有更多層次不同類(lèi)型的分析,并最終形成更完善的解決方案,而這樣做的代價(jià)是需要消耗更多的計(jì)算資源才能完成“訓(xùn)練”階段。兩者本質(zhì)還是涉及神經(jīng)網(wǎng)絡(luò),它們圍繞信息節(jié)點(diǎn)創(chuàng)建類(lèi)似網(wǎng)狀的連接,這與人類(lèi)大腦中的神經(jīng)元與周?chē)募?xì)胞進(jìn)行網(wǎng)狀連接的方式非常相似。人工智能是一個(gè)總括性的術(shù)語(yǔ),對(duì)許多不同的人來(lái)說(shuō)意味著許多不同的東西,從IBM的Watson到電影《2001:太空漫游》的HAL。但總來(lái)說(shuō),它指的是設(shè)備可以獨(dú)立于顯式編程學(xué)習(xí)行為。
機(jī)器學(xué)習(xí)的第二階段就是“推理”,這個(gè)階段基本上就是要把學(xué)習(xí)階段的成果應(yīng)用到特定的應(yīng)用程序和細(xì)分市場(chǎng),也就是算法被投入實(shí)際應(yīng)用的地方,機(jī)遇更大。結(jié)果或許是大量獲得風(fēng)投支持的初創(chuàng)公司蜂擁而至。
ARM公司員工Jem Davies表示,“機(jī)器學(xué)習(xí)的推理和訓(xùn)練階段完全是兩碼事?!?/p>
所謂推理,你可以做各種古怪的事情,如分揀黃瓜等。它更接近用戶(hù),這就是為什么你看到各種有趣的案例。但現(xiàn)在的手機(jī)也有預(yù)測(cè)性文本,和推理類(lèi)似——這是25年前開(kāi)始的。”推理是輔助自動(dòng)駕駛的重要組成部分,從傳感器收集上來(lái)的數(shù)據(jù)也需要基于機(jī)器學(xué)習(xí)進(jìn)行預(yù)處理。
Cadence公司Tensilica DSP部門(mén)的產(chǎn)品營(yíng)銷(xiāo)總監(jiān)Pulin Desai表示:“推理需要在邊緣進(jìn)行?!彼e例,“在一輛汽車(chē)?yán)?,你可能?0個(gè)圖像傳感器,加上雷達(dá)和激光雷達(dá),以提供360度的視野。但是如果你把一個(gè)圖像傳感器放在汽車(chē)上,它可能有180度的視野。這需要畸變校正,這是圖像處理?!?/p>
訓(xùn)練和推理階段之間的一個(gè)關(guān)鍵區(qū)別在于,訓(xùn)練是在浮點(diǎn)中完成的,而推理則是使用定點(diǎn)。DSP和FPGA是定點(diǎn)。
這里簡(jiǎn)單說(shuō)一下ARM、DSP和FPGA,市場(chǎng)經(jīng)常拿來(lái)對(duì)比。
在嵌入式開(kāi)發(fā)領(lǐng)域,ARM(Advanced RISC Machines)是一款微處理器,設(shè)計(jì)了大量RISC處理器、相關(guān)技術(shù)及軟件,提供一系列內(nèi)核、體系擴(kuò)展、微處理器和系統(tǒng)芯片方案,目前市場(chǎng)覆蓋率90%以上;DSP(digital singnal processor)是一種獨(dú)特的微處理器,有自己的完整指令系統(tǒng),是以數(shù)字信號(hào)來(lái)處理大量信息的器件:一個(gè)數(shù)字信號(hào)處理器在一塊不大的芯片內(nèi)包括有控制單元、運(yùn)算單元、各種寄存器以及一定數(shù)量的存儲(chǔ)單元等等,在其外圍還可以連接若干存儲(chǔ)器,并可以與一定數(shù)量的外部設(shè)備互相通信,有軟、硬件的全面功能,本身就是一個(gè)微型計(jì)算機(jī);FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)是在PAL、GAL、PLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物,是專(zhuān)用集成電路(ASIC)中集成度最高的一種。
三者區(qū)別在于,ARM具有比較強(qiáng)的事務(wù)管理功能,可以用來(lái)跑界面以及應(yīng)用程序等,其優(yōu)勢(shì)主要體現(xiàn)在控制方面;而DSP主要是用來(lái)計(jì)算的,比如進(jìn)行加密解密、調(diào)制解調(diào)等,優(yōu)勢(shì)是強(qiáng)大的數(shù)據(jù)處理能力和較高的運(yùn)行速度;FPGA可以用VHDL或verilogHDL來(lái)編程,靈活性強(qiáng),由于能夠進(jìn)行編程、除錯(cuò)、再編程和重復(fù)操作,因此可以充分地進(jìn)行設(shè)計(jì)開(kāi)發(fā)和驗(yàn)證。當(dāng)電路有少量改動(dòng)時(shí),更能顯示出FPGA的優(yōu)勢(shì),其現(xiàn)場(chǎng)編程能力可以延長(zhǎng)產(chǎn)品在市場(chǎng)上的壽命,而這種能力可以用來(lái)進(jìn)行系統(tǒng)升級(jí)或除錯(cuò)。
Flex Logix公司首席執(zhí)行官Geoffrey Tate表示:“我們正在擺脫使用x86處理器解決所有問(wèn)題或者人們需要為特定工作負(fù)載優(yōu)化硬件的局面。大多數(shù)計(jì)算將在數(shù)據(jù)中心之外完成,因此FPGA和其他一些東西的角色將不得不發(fā)生改變——由于支持音視頻的需求的擴(kuò)展,你可能仍然會(huì)看到傳統(tǒng)架構(gòu)和新架構(gòu)混合。我認(rèn)為我們都是加速器?!?/p>
機(jī)器學(xué)習(xí)領(lǐng)域,F(xiàn)PGA和eFPGA玩家正在爭(zhēng)先恐后地進(jìn)入推理市場(chǎng)。預(yù)計(jì)2022年將有17億個(gè)機(jī)器學(xué)習(xí)客戶(hù)端設(shè)備。
Achronix公司總裁及首席執(zhí)行官Robert Blake表示:“在機(jī)器學(xué)習(xí)的學(xué)習(xí)階段,GPU已經(jīng)贏得了很多關(guān)注?!?他表示,“但是更大的市場(chǎng)將會(huì)在推理方面,這些產(chǎn)品的成本和功耗將是至關(guān)重要的。這就是為什么在這些領(lǐng)域內(nèi)嵌入式解決方案將具有極大吸引力的原因。”
ARM公司員工Davies也同意這種看法。他說(shuō),功率預(yù)算保持在2-3瓦的范圍內(nèi),而電池技術(shù)的改進(jìn)則相對(duì)“不給力”。鋰電池的改進(jìn)一般在每年4%-6%的范圍內(nèi)。相比而言,為了完成所有這些工作所需的計(jì)算性能的提升則是數(shù)量級(jí)的提升。
這將需要一個(gè)完全不同的架構(gòu),包括對(duì)于在哪里完成哪種處理的理解。
Rambus公司一位發(fā)明家Steven Woo表示:“我們看到了人工智能、神經(jīng)網(wǎng)絡(luò)芯片和內(nèi)核的市場(chǎng)需求,更高級(jí)別的需求是它們把信息融合在一起,而現(xiàn)在市場(chǎng)正在摸索人工智能、神經(jīng)網(wǎng)絡(luò)芯片和內(nèi)核‘融合’的可能。你現(xiàn)在看到的是,很多公司在尋找主要的市場(chǎng),并圍繞這些市場(chǎng)建設(shè)基礎(chǔ)設(shè)施。譬如汽車(chē)市場(chǎng);還有手機(jī)市場(chǎng),那里有幾十億設(shè)備的規(guī)模,它們正在推動(dòng)新的打包基礎(chǔ)設(shè)施;而且物聯(lián)網(wǎng)也有潛力,但挑戰(zhàn)在于找到共性。而神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí),似乎每周都有新的算法,這就很難開(kāi)發(fā)一個(gè)單一的架構(gòu)。這就是為什么你看到人們對(duì)FPGA和DSP的興趣之深的原因?!?/p>
機(jī)器學(xué)習(xí)在以客戶(hù)為中心的應(yīng)用程序中已經(jīng)變得相當(dāng)常見(jiàn),它可以被用來(lái)預(yù)測(cè)銷(xiāo)售情況,尋找客戶(hù)流失的跡象,通過(guò)交互式語(yǔ)音響應(yīng)或者通過(guò)在線聊天機(jī)器人,以及谷歌翻譯之類(lèi)的消費(fèi)者應(yīng)用程序提供客戶(hù)服務(wù)。
Facebook使用三個(gè)深度學(xué)習(xí)應(yīng)用程序來(lái)過(guò)濾上傳內(nèi)容,例如,一個(gè)在上傳圖片中進(jìn)行面部識(shí)別并對(duì)人進(jìn)行標(biāo)記,一個(gè)檢查仇恨言論或者其他目標(biāo)內(nèi)容,而另一個(gè)用于定位廣告。
西門(mén)子旗下Mentor公司傳感器融合首席工程師Nizar Sallem表示,深度學(xué)習(xí)在客戶(hù)服務(wù)和分析方面可能很適合,但它也是提供自動(dòng)駕駛車(chē)輛所需的即時(shí)感知、決策和控制系統(tǒng)的首選對(duì)象。機(jī)器學(xué)習(xí)了解車(chē)輛周?chē)沫h(huán)境,道路上的不同行為者,交通規(guī)則以及當(dāng)時(shí)期望車(chē)輛所處的位置,它必須確定你的行為應(yīng)該是什么樣子的,還要確定什么時(shí)候你可以為了逃避危險(xiǎn)或者保護(hù)車(chē)內(nèi)的人而違反交通規(guī)則。
英偉達(dá)首席科學(xué)家兼研究高級(jí)副總裁Bill Dally表示, “讓我吃驚的是深度學(xué)習(xí)革命來(lái)的如此之快。在過(guò)去的三年中,各種各樣的應(yīng)用程序似乎一夜之間就放棄了原來(lái)的傳統(tǒng)方法,搖身一變轉(zhuǎn)向了深度學(xué)習(xí)?!彼a(bǔ)充說(shuō),“這不需要在軟件上投入巨大的資金;你拿一個(gè)應(yīng)用程序,訓(xùn)練網(wǎng)絡(luò),然后就完成了。它在某些領(lǐng)域已經(jīng)變得無(wú)處不在,但是對(duì)于每個(gè)搖身一變擁抱了神經(jīng)網(wǎng)絡(luò)的應(yīng)用程序來(lái)說(shuō),都還有另外十次‘搖身一變’的機(jī)會(huì)?!?/p>
麥肯錫認(rèn)為,在科技行業(yè)以外人工智能大部分的應(yīng)用都是試驗(yàn)性的,而在科技行業(yè)中,大部分人工智能的應(yīng)用要么是為了支持或改善其他服務(wù),要么就是為消費(fèi)者增加新的服務(wù)。在接受麥肯錫調(diào)查的3000多家公司中,只有20%的企業(yè)表示他們?cè)谥匾臉I(yè)務(wù)部分使用了與人工智能相關(guān)的技術(shù)。調(diào)查發(fā)現(xiàn)了160個(gè)人工智能的使用案例,麥肯錫發(fā)現(xiàn)只有12%的商業(yè)應(yīng)用。
或者換個(gè)角度看,88%的公司還沒(méi)有在商業(yè)上部署人工智能,這是一個(gè)巨大的機(jī)會(huì)。相比之下,包括谷歌和百度在內(nèi)的高科技公司在2016年花費(fèi)了200億至300億美元,其中90%用于研發(fā),10%用于收購(gòu)。
盡管人工智能技術(shù)處于爆發(fā)期,但發(fā)展仍處于起步階段。主流提供商仍然是現(xiàn)有的高科技公司,而最能賺錢(qián)的仍然是消費(fèi)者服務(wù)。Tractica報(bào)告稱(chēng),這包括谷歌的語(yǔ)音到文本轉(zhuǎn)換和翻譯服務(wù)以及來(lái)自亞馬遜、Facebook、百度等公司的消費(fèi)者互動(dòng)/客戶(hù)服務(wù)應(yīng)用程序。該報(bào)告估計(jì),2016年人工智能驅(qū)動(dòng)的消費(fèi)服務(wù)價(jià)值為19億美元,到2017年底將增至27億美元。
圖:按技術(shù)劃分的人工智能收入。資料來(lái)源:Tractica
Tractica估計(jì)到2025年,包括硬件、軟件和服務(wù)在內(nèi)的整個(gè)人工智能市場(chǎng)將上升到421億美元。
圖:人工智能各部分的收入。資料來(lái)源:Tractica
機(jī)器學(xué)習(xí)即服務(wù)(MLaaS)是另一個(gè)類(lèi)別,其中73%由亞馬遜、IBM和微軟占據(jù)。Transparency Market Research(TMR)4月份的一份報(bào)告表示,預(yù)計(jì)這一數(shù)字將從2016年的約10.7億美元增長(zhǎng)到2025年的199億美元。
Tractica表示,大部分機(jī)器學(xué)習(xí)功能服務(wù)目前針對(duì)的都是消費(fèi)者——這個(gè)類(lèi)別中包含了谷歌翻譯和語(yǔ)音轉(zhuǎn)換文本應(yīng)用程序,作為其客戶(hù)TPU的概念驗(yàn)證。
深度學(xué)習(xí)的出現(xiàn)也凸顯了半導(dǎo)體行業(yè)與其最大客戶(hù)之間的一些日益復(fù)雜的關(guān)系,特別是同谷歌和其他超大規(guī)模數(shù)據(jù)中心所有者之間的關(guān)系,他們的規(guī)模大到足以配置并建設(shè)自己的服務(wù)器和芯片。
芯片公司多年來(lái)一直在針對(duì)特定云客戶(hù)的需求構(gòu)建或定制芯片。例如,英特爾就為微軟打造了FPGA DL加速器,為阿里巴巴云客戶(hù)打造了基于FPGA的應(yīng)用加速器。英特爾還邀請(qǐng)F(tuán)acebook幫助設(shè)計(jì)英特爾Nervana神經(jīng)處理器(Nervana Neural Processor)的包裝以及該公司即將推出的、針對(duì)深度學(xué)習(xí)的“Lake Crest”專(zhuān)用集成電路(ASIC)。
谷歌已經(jīng)發(fā)布了其他芯片,包括它已經(jīng)開(kāi)發(fā)了Pixel2手機(jī)的機(jī)器學(xué)習(xí)協(xié)處理器的消息,這是它的首款移動(dòng)芯片。谷歌還開(kāi)發(fā)了Titan,這是一種微控制器,連接到服務(wù)器上,以確保它們不會(huì)錯(cuò)誤啟動(dòng)、損壞或被惡意軟件感染。
谷歌稱(chēng)TPU可以實(shí)現(xiàn)“機(jī)器學(xué)習(xí)每瓦性能優(yōu)化,優(yōu)化的幅度是數(shù)量級(jí)的”并將谷歌的機(jī)器學(xué)習(xí)應(yīng)用程序向前推進(jìn)了七年,以此證明它對(duì)TPU的投資是合理的。首款TPU只針對(duì)加速運(yùn)行機(jī)器學(xué)習(xí)模型推理的普通服務(wù)器設(shè)計(jì),而不是首先瞄準(zhǔn)了培訓(xùn)模型。因此,它們并沒(méi)有直接同英偉達(dá)或者英特爾的機(jī)器學(xué)習(xí)培訓(xùn)產(chǎn)品競(jìng)爭(zhēng)。
當(dāng)谷歌在5月份發(fā)布其云TPU(Cloud TPUs)時(shí),該公司的聲明聽(tīng)起來(lái)像是要與英特爾和英偉達(dá)進(jìn)行更為直接的競(jìng)爭(zhēng)。
谷歌宣稱(chēng)Cloud TPU每個(gè)浮點(diǎn)性能為180 teraflops,但將這些單元打包成4-TPU Pod,總共包含11.5 petaflops。這種配置似乎是為了與英偉達(dá)備受好評(píng)的DGX-1“超級(jí)計(jì)算機(jī)”競(jìng)爭(zhēng),該超級(jí)計(jì)算機(jī)配備了八個(gè)頂級(jí)的Tesla V100芯片,并聲稱(chēng)總計(jì)最高吞吐量為1petaFLOP。
Dally 表示,“谷歌和其他一些公司已經(jīng)在沒(méi)有加速——或者只有TPU——的情況下獲得了早期的成功,但是有一些網(wǎng)絡(luò)很容易培訓(xùn);標(biāo)準(zhǔn)圖像搜索很簡(jiǎn)單?!彼硎?,“但是如果要進(jìn)行更多信號(hào)處理的培訓(xùn)——處理圖像和視頻流,以及對(duì)于那些每周都要重新培訓(xùn)他們的網(wǎng)絡(luò)的人來(lái)說(shuō),或者對(duì)于那些更加重視培訓(xùn)的人來(lái)說(shuō),GPU的效率要高得多?!?/p>
Chris Rowen是Cadence 的IP集團(tuán)的前首席技術(shù)官,他創(chuàng)辦了Cognite Ventures,為神經(jīng)網(wǎng)絡(luò)、物聯(lián)網(wǎng)和自動(dòng)駕駛嵌入式系統(tǒng)的創(chuàng)業(yè)企業(yè)提供資金和建議。他表示,問(wèn)題是谷歌的新處理器是否足以將客戶(hù)從其他業(yè)務(wù)中剝離出來(lái),答案可能會(huì)是“不能”。任何一家云提供商都必須支持多種架構(gòu),所以支持深度學(xué)習(xí)的數(shù)據(jù)中心將會(huì)成為CPU、GPU、ASIC、FPGA以及來(lái)自各種技術(shù)的IP的盛宴。
Rowen表示,一些培訓(xùn)負(fù)載也有可能更多地轉(zhuǎn)移到內(nèi)置在客戶(hù)端設(shè)備中的推理引擎上。在這個(gè)領(lǐng)域的很多公司肯定會(huì)有機(jī)會(huì)。不過(guò),對(duì)于限制在數(shù)據(jù)中心服務(wù)器上的機(jī)器學(xué)習(xí)培訓(xùn),就很難取代現(xiàn)有的玩家了。
圖:認(rèn)知計(jì)算的演變。資料來(lái)源:Cognite Ventures
上一篇:貴州省37家企業(yè)試點(diǎn)示范“大數(shù)據(jù)+工業(yè)”深度融合
下一篇:國(guó)內(nèi)城市唯一!青島兩摘中國(guó)大數(shù)據(jù)發(fā)展"五星"