編者按:今年年初出于個人興趣,我開始了對人工智能的研究。為了更好理解人工智能和設計的關系,我開始學習機器學習、深度學習、Alexa開發(fā)等知識,從當初覺得人工智能只會讓大部分設計師失業(yè),到現(xiàn)在覺得人工智能只是一個設計的輔助工具,也算是成長了不少。這次希望能將積累的知識寫成一本電子書,沒別的,因為字太多,更重要的是這樣很酷。由于寫作時間可能太長,互聯(lián)網(wǎng)每天都在變化,一些比較前沿的思考可能轉眼成為現(xiàn)實,所以先把前四章陸續(xù)發(fā)出來。前四章主要講了現(xiàn)在人工智能的基礎知識、底層設計、互聯(lián)網(wǎng)產品設計以及人工智能與設計的關系,后面會通過3~4章詳細分析人工智能對不同行業(yè)設計的影響。
目前考慮的領域是室內設計、公共設計和服務設計。后續(xù)會在Github上對現(xiàn)有內容進行更新迭代(Github鏈接以后再公布),等全部內容寫完會把這些內容制作成完整的電子書,敬請期待。
這部分是1-2章。
人工智能的發(fā)展歷史
說起人工智能這詞,不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出:機器會思考嗎?如果一臺機器能夠與人類對話而不被辨別出其機器的身份,那么這臺機器具有智能的特征。同年,Alan Turing還預言了存有一定的可能性可以創(chuàng)造出具有真正智能的機器。
說明:Alan Turing(1912.6.23-1954.6.7)曾協(xié)助英國軍隊破解了德國的著名密碼系統(tǒng)Enigma,幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機器是否具有智能的試驗方法,即圖靈試驗,被后人稱為計算機之父和人工智能之父。
AI誕生
1956年,在達特茅斯學院舉行的一次會議上,不同領域「數(shù)學、心理學、工程學、經(jīng)濟學和政治學」的科學家正式確立了人工智能為研究學科。
△ 2006年達特茅斯會議當事人重聚,左起:Trenchard More、John McCarthy、Marvin Minsky、Oliver Selfridge、Ray Solomonoff
第一次發(fā)展高潮(1955年—1974年)
達特茅斯會議之后是大發(fā)現(xiàn)的時代。對很多人來講,這一階段開發(fā)出來的程序堪稱神奇:計算機可以解決代數(shù)應用題、證明幾何定理、學習和使用英語。在眾多研究當中,搜索式推理、自然語言、微世界在當時最具影響力。
- 大量成功的AI程序和新的研究方向不斷涌現(xiàn),研究學者認為具有完全智能的機器將在二十年內出現(xiàn)并給出了如下預言:
- 1958年,H. A. Simon,Allen Newell:十年之內,數(shù)字計算機將成為國際象棋世界冠軍。十年之內,數(shù)字計算機將發(fā)現(xiàn)并證明一個重要的數(shù)學定理。
- 1965年,H. A. Simon:二十年內,機器將能完成人能做到的一切工作。
- 1967年,Marvin Minsky:一代之內……創(chuàng)造「人工智能」的問題將獲得實質上的解決。
- 1970年,Marvin Minsky:在三到八年的時間里我們將得到一臺具有人類平均智能的機器。
美國政府向這一新興領域投入了大筆資金,每年將數(shù)百萬美元投入到麻省理工學院、卡耐基梅隆大學、愛丁堡大學和斯坦福大學四個研究機構,并允許研究學者去做任何感興趣的方向。
當時主要成就:
- 人工神經(jīng)網(wǎng)絡在30-50年代被提出,1951年Marvin Minsky制造出第一臺神經(jīng)網(wǎng)絡機。
- 貝爾曼公式(增強學習雛形)被提出。
- 感知器(深度學習雛形)被提出。
- 搜索式推理被提出。
- 自然語言被提出。
- 首次提出人工智能擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念并解決人類現(xiàn)存問。
- Arthur Samuel在五十年代中期和六十年代初開發(fā)的國際象棋程序,棋力已經(jīng)可以挑戰(zhàn)具有相當水平的業(yè)余愛好者。
- 機器人SHAKEY項目受到了大力宣傳,它能夠對自己的行為進行「推理」;人們將其視作世界上第一臺通用機器人。
- 微世界的提出。
第一次寒冬(1974年—1980年)
70年代初,AI遭遇到瓶頸。研究學者逐漸發(fā)現(xiàn),雖然機器擁有了簡單的邏輯推理能力,但遭遇到當時無法克服的基礎性障礙,AI停留在「玩具」階段止步不前,遠遠達不到曾經(jīng)預言的完全智能。由于此前的過于樂觀使人們期待過高,當AI研究人員的承諾無法兌現(xiàn)時,公眾開始激烈批評AI研究人員,許多機構不斷減少對人工智能研究的資助,直至停止撥款。
當時主要問題:
- 計算機運算能力遭遇瓶頸,無法解決指數(shù)型爆炸的復雜計算問題。
- 和推理需要大量對世界的認識信息,計算機達不到「看懂和聽懂」的地步。
- 無法解決莫拉維克悖論。
- 無法解決部分涉及自動規(guī)劃的邏輯問題。
- 神經(jīng)網(wǎng)絡研究學者遭遇冷落。
莫拉維克悖論——如果機器像數(shù)學天才一樣下象棋,那么它能模仿嬰兒學習又有多難呢?然而,事實證明這是相當難的。
第二次發(fā)展高潮(1980年—1987年)
80年代初,一類名為「專家系統(tǒng)」的AI程序開始為全世界的公司所采納,人工智能研究迎來了新一輪高潮。在這期間,卡耐基梅隆大學為DEC公司設計的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟產業(yè)省撥款八億五千萬美元支持第五代計算機項目。其目標是造出能夠與人對話、翻譯語言、解釋圖像、能夠像人一樣推理的機器。其他國家也紛紛作出了響應,并對AI和信息技術的大規(guī)模項目提供了巨額資助。
專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領域回答或解決問題。由于專家系統(tǒng)僅限于一個很小的領域,從而避免了常識問題。「知識處理」隨之也成為了主流 AI 研究的焦點。
當時主要成就:
- 專家系統(tǒng)的誕生。
- AI研究人員發(fā)現(xiàn)智能可能需要建立在對分門別類的大量知識的多種處理方法之上。
- BP算法實現(xiàn)了神經(jīng)網(wǎng)絡訓練的突破,神經(jīng)網(wǎng)絡研究學者重新受到關注。
- AI研究人員首次提出:機器為了獲得真正的智能,機器必須具有軀體,它需要有感知、移動、生存,與這個世界交互的能力。感知運動技能對于常識推理等高層次技能是至關重要的,基于對事物的推理能力比抽象能力更為重要,這也促進了未來自然語言、機器視覺的發(fā)展。
第二次寒冬(1987年—1993年)
1987年,AI硬件的市場需求突然下跌??茖W家發(fā)現(xiàn),專家系統(tǒng)雖然很有用,但它的應用領域過于狹窄,而且更新迭代和維護成本非常高。同期美國Apple和IBM生產的臺式機性能不斷提升,個人電腦的理念不斷蔓延;日本人設定的「第五代工程」最終也沒能實現(xiàn)。人工智能研究再次遭遇了財政困難,一夜之間這個價值五億美元的產業(yè)土崩瓦解。
當時主要問題:
- 受到臺式機和「個人電腦」理念的沖擊影響。
- 商業(yè)機構對AI的追捧和冷落,使AI化為泡沫并破裂。
- 計算機性能瓶頸仍無法突破。
- 仍然缺乏海量數(shù)據(jù)訓練機器。
第三次發(fā)展高潮(1993年至今)
在摩爾定律下,計算機性能不斷突破。云計算、大數(shù)據(jù)、機器學習、自然語言和機器視覺等領域發(fā)展迅速,人工智能迎來第三次高潮。
摩爾定律起始于Gordon Moore在1965年的一個預言,當時他看到因特爾公司做的幾款芯片,覺得18到24個月可以把晶體管體積縮小一半,個數(shù)可以翻一番,運算處理能力能翻一倍。沒想到這么一個簡單的預言成真了,下面幾十年一直按這個節(jié)奏往前走,成為了摩爾定律。
主要事件
1997年:IBM的國際象棋機器人深藍戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫。
2005年:Stanford開發(fā)的一臺機器人在一條沙漠小徑上成功地自動行駛了131英里,贏得了DARPA挑戰(zhàn)大賽頭獎。
2006年:
- Geoffrey Hinton提出多層神經(jīng)網(wǎng)絡的深度學習算法。
- Eric Schmidt在搜索引擎大會提出「云計算」概念。
2010年:Sebastian Thrun領導的谷歌無人駕駛汽車曝光,創(chuàng)下了超過16萬千米無事故的紀錄。
2011年:
- IBM Waston參加智力游戲《危險邊緣》,擊敗最高獎金得主Brad Rutter和連勝紀錄保持者Ken Jennings。
- 蘋果發(fā)布語音個人助手Siri,3.Nest Lab發(fā)布第一代智能恒溫器Nest。它可以了解用戶的習慣,并相應自動地調節(jié)溫度。
2012年:Google發(fā)布個人助理Google Now。
2013年:深度學習算法在語音和視覺識別率獲得突破性進展。
2014年:
- 微軟亞洲研究院發(fā)布人工智能小冰聊天機器人和語音助手Cortana。
- 百度發(fā)布Deep Speech語音識別系統(tǒng)。
2015年:Facebook發(fā)布了一款基于文本的人工智能助理「M」。
2016年:
- Google AlphaGo以比分4:1戰(zhàn)勝圍棋九段棋手李世石。
- Chatbots這個概念開始流行。
- Google發(fā)布為機器學習定制的第一代專用芯片TPU。
- Google發(fā)布語音助手Assistant。
2017年:
- AlphaGO在圍棋網(wǎng)絡對戰(zhàn)平臺以60連勝擊敗世界各地高手。
- Google 開源深度學習系統(tǒng)Tensorflow 1.0正式發(fā)布。
- Google AlphaGo以比分3:0完勝世界第一圍棋九段棋手柯潔。
- 默默深耕機器學習和機器視覺的蘋果在WWDC上發(fā)布Core ML,ARKit等組件。
- Google發(fā)布了ARCore SDK。
- 百度AI開發(fā)者大會正式發(fā)布Dueros語音系統(tǒng),無人駕駛平臺Apollo1.0自動駕駛平臺。
- 華為發(fā)布全球第一款AI移動芯片麒麟970。
- iPhone X配備前置 3D 感應攝像頭(TrueDepth),臉部識別點達到3W個,具備人臉識別、解鎖和支付等功能;配備的A11 Bionic神經(jīng)引擎使用雙核設計,每秒可達到運算6000億次。
- AlphaGo Zero完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,僅需要4個TPU,并花三天時間自己左右互搏490萬棋局,最終無師自通完爆阿法狗100-0。
很多專家學者對此次人工智能浪潮給予了肯定,認為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險、金融等領域開始滲透;在未來健康醫(yī)療、交通出行、銷售消費、金融服務、媒介娛樂、生產制造;到能源、石油、農業(yè)、政府……所有垂直產業(yè)都將因人工智能技術的發(fā)展而受益,那么我們現(xiàn)在講的人工智能究竟是什么?
人工智能是什么?
在60年代,AI研究人員認為人工智能是一臺通用機器人。它擁有模仿智能的特征,懂得使用語言、懂得形成抽象概念、能夠對自己的行為進行推理,它可以解決人類現(xiàn)存問題。由于理念、技術和數(shù)據(jù)的限制,人工智能在模式識別、信息表示、問題解決和自然語言處理等不同領域發(fā)展緩慢。
80年代,AI研究人員轉移方向,認為人工智能對事物的推理能力比抽象能力更重要。機器為了獲得真正的智能,機器必須具有軀體,它需要感知、移動、生存,與這個世界交互。為了積累更多推理能力,AI研究人員開發(fā)出專家系統(tǒng),它能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領域回答或解決問題。
1997年,IBM的超級計算機深藍在國際象棋領域完勝整個人類代表卡斯帕羅夫;相隔20年,Google的AlphaGo在圍棋領域完勝整個人類代表柯潔。劃時代的事件使大部分AI研究人員確信人工智能的時代已經(jīng)降臨。
可能大家覺得國際象棋和圍棋好像沒什么區(qū)別,其實兩者的難度不在同一個級別。國際象棋走法的可能性雖多,但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍可以通過蠻力看到所有的可能性,而且只需要一臺計算機基本上就可以搞定。相比國際象棋,圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多,幾十臺計算機的計算能力都搞不定,所以機器下圍棋想贏非常困難,包括圍棋專家和人工智能領域的專家們也紛紛斷言:計算機要在圍棋領域戰(zhàn)勝人類棋手,還要再等100年。結果機器真的做到了,并據(jù)說AlphaGo擁有圍棋十幾段的實力(目前圍棋棋手最高是9段)。
那么深藍和AlphaGo在本質上有什么區(qū)別?簡單點說,深藍的代碼是研究人員編程的,知識和經(jīng)驗也是研究人員傳授的,所以可以認為與卡斯帕羅夫對戰(zhàn)的深藍的背后還是人類,只不過它的運算能力比人類更強,更少失誤。而AlphaGo的代碼是自我更新的,知識和經(jīng)驗是自我訓練出來的。與深藍不一樣的是,AlphaGo擁有兩顆大腦,一顆負責預測落子的最佳概率,一顆做整體的局面判斷,通過兩顆大腦的協(xié)同工作,它能夠判斷出未來幾十步的勝率大小。所以與柯潔對戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓練后,擁有自主學習能力的人工智能系統(tǒng)。
這時候社會上出現(xiàn)了不同的聲音:人工智能會思考并解決所有問題、人工智能會搶走人類的大部分工作!人工智能會取代人類嗎?那么已來臨的人工智能究竟是什么?
人工智能目前有兩個定義:分別為強人工智能和弱人工智能。
普通群眾所遐想的人工智能屬于強人工智能,它屬于通用型機器人,也就是60年代AI研究人員提出的理念。它能夠和人類一樣對世界進行感知和交互,通過自我學習的方式對所有領域進行記憶、推理和解決問題。
這樣的強人工智能需要具備以下能力:
- 存在不確定因素時進行推理、使用策略、解決問題、制定決策的能力。
- 知識表示的能力,包括常識性知識的表示能力。
- 規(guī)劃能力。
- 學習能力。
- 使用自然語言進行交流溝通的能力。
- 將上述能力整合起來實現(xiàn)既定目標的能力。
以上結論借鑒李開復所著的《人工智能》一書。
這些能力在常人看來都很簡單,因為自己都具備著。但由于技術的限制,計算機很難具備以上能力,這也是為什么現(xiàn)階段人工智能很難達到常人思考的水平。
由于技術未成熟,現(xiàn)階段的人工智能屬于弱人工智能,還達不到大眾所遐想的強人工智能。弱人工智能也稱限制領域人工智能或應用型人工智能,指的是專注于且只能解決特定領域問題的人工智能,例如AlphaGo,它自身的數(shù)學模型只能解決圍棋領域的問題,可以說它是一個非常狹小領域問題的專家系統(tǒng),以及它很難擴展到稍微寬廣一些的知識領域,例如如何通過一盤棋表達出自己的性格和靈魂。
弱人工智能和強人工智能在能力上存在著巨大鴻溝,弱人工智能想要進一步發(fā)展,必須具備以下能力:
- 跨領域推理。
- 擁有抽象能力。
- 知其然,也知其所以然。
- 擁有常識。
- 擁有審美能力。
- 擁有自我意識和情感。
以上結論借鑒李開復所著的《人工智能》一書。
在計算機理念來說,人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進行一些具有不確定性的決策。從目前的技術實現(xiàn)來說,人工智能就是深度學習,它是06年由Geoffrey Hinton所提出的機器學習算法,該算法可以使程序擁有自我學習和演變的能力。
機器學習和深度學習是什么?
機器學習簡單點說就是通過一個數(shù)學模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關系挖掘出來。機器學習建模采用了以下四種方法:
- 監(jiān)督學習與數(shù)學中的函數(shù)有關。它需要研究學者不斷地標注數(shù)據(jù)從而提高模型的準確性,挖掘出數(shù)據(jù)間的關系并給出結果。
- 非監(jiān)督學習與現(xiàn)實中的描述(例如哪些動物有四條腿)有關。它可以在沒有額外信息的情況下,從原始數(shù)據(jù)中提取模式和結構的任務,它與需要標簽的監(jiān)督學習相互對立。
- 半監(jiān)督學習,它可以理解為監(jiān)督學習和半監(jiān)督學習的結合。
- 增強學習,它的大概意思是通過聯(lián)想并對比未來幾步所帶來的好處而決定下一步是什么。
目前機器學習以監(jiān)督學習為主。深度學習屬于機器學習下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡以及使用以上四種方法,不斷對自身模型進行自我優(yōu)化,從而發(fā)現(xiàn)出更多優(yōu)質的數(shù)據(jù)以及聯(lián)系。
目前的AlphaGo正是采用了深度學習算法擊敗了人類世界冠軍,更重要的是,深度學習促進了人工智能其他領域如自然語言和機器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學習,這句話沒有任何問題。
人工智能基礎能力
在了解人工智能基礎能力前,我們先聊聊更底層的東西——數(shù)據(jù)。計算機數(shù)據(jù)分為兩種,結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)是指具有預定義的數(shù)據(jù)模型的數(shù)據(jù),它的本質是將所有數(shù)據(jù)標簽化、結構化,后續(xù)只要確定標簽,數(shù)據(jù)就能讀取出來,這種方式容易被計算機理解。非結構化數(shù)據(jù)是指數(shù)據(jù)結構不規(guī)則或者不完整,沒有預定義的數(shù)據(jù)模型的數(shù)據(jù)。非結構化數(shù)據(jù)格式多樣化,包括了圖片、音頻、視頻、文本、網(wǎng)頁等等,它比結構化信息更難標準化和理解。
音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息,人類在理解這些內容時毫不費勁;對于只懂結構化數(shù)據(jù)的計算機來說,理解這些非結構化內容比登天還難,這也就是為什么人與計算機交流時非常費勁。
全世界有80%的數(shù)據(jù)都是非結構化數(shù)據(jù),人工智能想要達到看懂、聽懂的狀態(tài),必須要把非結構化數(shù)據(jù)這塊硬骨頭啃下來。學者在深度學習的幫助下在這領域取得了突破性成就,這成就為人工智能其他各種能力奠定了基礎。
如果將人工智能比作一個人,那么人工智能應該具有記憶思考能力,輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺,以及輸出能力如語言交流、軀體活動。以上能力對相應的術語為:深度學習、知識圖譜、遷移學習、自然語言處理、機器視覺、語音識別、語音合成(觸覺、嗅覺、味覺在技術研究上暫無商業(yè)成果,軀體活動更多屬于機器人領域,不在文章中過多介紹)
簡單點說,知識圖譜就是一張地圖。它從不同來源收集信息并加以整理,每個信息都是一個節(jié)點,當信息之間有關系時,相關節(jié)點會建立起聯(lián)系,眾多信息節(jié)點逐漸形成了圖。知識圖譜有助于信息存儲,更重要的是提高了搜索信息的速度和質量。
遷移學習把已學訓練好的模型參數(shù)遷移到新的模型來幫助新模型訓練數(shù)據(jù)集。由于大部分領域都沒有足夠的數(shù)據(jù)量進行模型訓練,遷移學習可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實現(xiàn)個性化遷移,如同人類思考時使用的類比推理。遷移學習有助于人工智能掌握更多知識。
自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的學科,它是人工智能的耳朵-語音識別和嘴巴-語音合成的基礎。計算機能否理解人類的思想,首先要理解自然語言,其次擁有廣泛的知識,以及運用這些知識的能力。自然語言處理的主要范疇非常廣,包括了語音合成、語音識別、語句分詞、詞性標注、語法分析、語句分析、機器翻譯、自動摘要等等、問答系統(tǒng)等等。
機器視覺通過攝影機和計算機代替人的眼睛對目標進行識別、跟蹤和測量,并進一步對圖像進行處理。這是一門研究如何使機器「看懂」的技術,是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實時、準確識別外界狀況,這是人工智能的瓶頸之一,深度學習在這方面幫了大忙?,F(xiàn)在熱門的人臉識別、無人駕駛等技術都依賴于機器視覺技術。
語音識別的目的是將人類的語音內容轉換為相應的文字。機器能否與人類自然交流的前提是機器能聽懂人類講什么,語音識別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音,這對于語音識別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識別技術在普通話上的準確率已達到97%,但方言準確率還有待提高。
目前大部分的語音合成技術是利用在數(shù)據(jù)庫內的許多已錄好的語音連接起來,但由于缺乏對上下文的理解以及情感的表達,朗讀效果很差?,F(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果:16年3月百度語音合成了張國榮聲音與粉絲互動;17年3月本邦科技利用科大訊飛的語音合成技術,成功幫助小米手機實現(xiàn)了一款內含「黑科技」的營銷活動H5。它們的主要技術是通過對張國榮、馬東的語音資料進行語音識別,提取該人的聲紋和說話特征,再通過自然語言處理對講述的內容進行情緒識別,合成出來的語音就像本人在和你對話。新的語音合成技術不再被數(shù)據(jù)庫內的錄音所限制語言和情感的表達。
經(jīng)過多年的人工智能研究,人工智能的主要發(fā)展方向分為:計算智能、感知智能、認知智能,這一觀點也得到業(yè)界的廣泛認可。
計算智能是以生物進化的觀點認識和模擬智能。有學者認為,智能是在生物的遺傳、變異、生長以及外部環(huán)境的自然選擇中產生的。在用進廢退、優(yōu)勝劣汰的過程中,適應度高的頭腦結構被保存下來,智能水平也隨之提高。機器借助大自然規(guī)律的啟示設計出具有結構演化能力和自適應學習能力的智能。
計算智能算法主要包括神經(jīng)計算、模糊計算和進化計算三大部分。神經(jīng)網(wǎng)絡和遺傳算法的出現(xiàn),使得機器的運算能力大幅度提升,能夠更高效、快速處理海量的數(shù)據(jù)。計算智能是人工智能的基礎,AlphaGo是計算智能的代表。 感知智能是以視覺、聽覺、觸覺等感知能力輔助機器,讓機器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力,機器可以通過傳感器獲取更多信息,例如溫度傳感器、濕度傳感器、紅外雷達、激光雷達等等。感知智能也是人工智能的基礎,機器人、自動駕駛汽車是感知智能的代表。
認知智能是指機器具有主動思考和理解的能力,不用人類事先編程就可以實現(xiàn)自我學習,有目的推理并與人類自然交互。人類有語言,才有概念、推理,所以概念、意識、觀念等都是人類認知智能的表現(xiàn),機器實現(xiàn)以上能力還有漫長的路需要探索。
在認知智能的幫助下,人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息,并洞察信息間的關系,不斷優(yōu)化自己的決策能力,從而擁有專家級別的實力,輔助人類做出決策。認知智能將加強人和人工智能之間的互動,這種互動是以每個人的偏好為基礎的。認知智能通過搜集到的數(shù)據(jù),例如地理位置、瀏覽歷史、可穿戴設備數(shù)據(jù)和醫(yī)療記錄等等,為不同個體創(chuàng)造不同的場景。認知系統(tǒng)也會根據(jù)當前場景以及人和機器的關系,采取不同的語氣和情感進行交流。
假如能像設想的一樣實現(xiàn)認知智能,那么底層平臺必須足夠寬廣和靈活,以便在各領域甚至跨領域得到應用。因此研發(fā)人員需要從全局性出發(fā),打造這個健壯的底層平臺,它應該包括機器學習、自然語言處理、語音和圖像識別、人機交互等技術,便于上層應用開發(fā)者的開發(fā)和使用。
前面介紹了人工智能的歷史和基礎,身為設計師最關心的是人工智能如何落地以及如何與用戶打交道。由于網(wǎng)上相關資料較少,我嘗試帶著探索的心態(tài)去挖掘兩者的聯(lián)系。人工智能能怎么服務人類,關鍵還是要看它的底層設計和能力。所以在思考過程中,我首先考慮到了人工智能的底層問題-人工智能如何收集用戶數(shù)據(jù)?用戶數(shù)據(jù)如何才是完整的?以下內容是對這兩個問題的分析與理解。
“去中心化”的互聯(lián)網(wǎng)
互聯(lián)網(wǎng)的前身叫做阿帕網(wǎng),屬于美國國防部60年代部署的一個中央控制型網(wǎng)絡。阿帕網(wǎng)有一個明顯的弱點:如果中央控制系統(tǒng)受到攻擊,整個阿帕網(wǎng)就會癱瘓。為了解決這個問題,美國的Paul Baran開發(fā)了一套新型通信系統(tǒng)。該系統(tǒng)的主要特色是:如果部分系統(tǒng)被摧毀,整個通信系統(tǒng)仍能夠保持運行。它的工作原理是這樣的:中央控制系統(tǒng)不再簡單地把數(shù)據(jù)直接傳送到目的地,而是在網(wǎng)絡的不同節(jié)點之間傳送;如果其中某個節(jié)點損壞,則別的節(jié)點能夠馬上代替進來。阿帕網(wǎng)的相關實踐和研究,催生出現(xiàn)代意義上的互聯(lián)網(wǎng)。
互聯(lián)網(wǎng)的起源就是為了去中心化,可以使信息更安全、更高效地傳播??上г诘谝淮位ヂ?lián)網(wǎng)泡沫之后,人們開始意識到在互聯(lián)網(wǎng)上創(chuàng)造價值的捷徑是搭建中心化服務,收集信息并將之貨幣化?;ヂ?lián)網(wǎng)上逐漸出現(xiàn)了不同領域的巨頭,它們以中心化的形式影響著億萬用戶,例如社交網(wǎng)絡Facebook,搜索引擎Google等等。用戶使用他們的產品進行社交或者搜索,而作為服務提供商的巨頭們通過掌握和分析用戶數(shù)據(jù)進而優(yōu)化自己的產品并獲得利益。為了給用戶提供更好的服務,存儲和分析用戶數(shù)據(jù)本來無可厚非,但這也引起了一部分對自己的隱私安全敏感的用戶的不滿。但更重要的一點是,如果某個巨頭突然垮了停止了相關服務,會給人類的生活帶來極大的困擾。
貌似互聯(lián)網(wǎng)又回到了60年代。很多老一輩互聯(lián)網(wǎng)參與者重新開始討論去中心化的互聯(lián)網(wǎng),他們認為互聯(lián)網(wǎng)去中心化的核心概念是:服務的運行不再盲目依賴于單一的壟斷企業(yè),而是將服務運營的責任分散承擔。
Tim Berners-Lee(萬維網(wǎng)的發(fā)明者)提出了自己的見解:將網(wǎng)絡設計成去中心化的,每個人都可以參與進來,擁有自己的域名和網(wǎng)絡服務器,只是目前還沒有實現(xiàn)。目前的個人數(shù)據(jù)被壟斷了。我們的想法是恢復去中心化網(wǎng)絡的創(chuàng)意。
我們再看看去中心化網(wǎng)絡的三個核心優(yōu)勢:隱私性、數(shù)據(jù)可遷移性和安全性。
隱私性:去中心化對數(shù)據(jù)隱私性要求很高。數(shù)據(jù)分布在網(wǎng)絡中,端到端加密技術可以保證授權用戶的讀寫權限。數(shù)據(jù)獲取權限用算法控制,而中心化網(wǎng)絡則一般由網(wǎng)絡所有者控制,包括消費者描述和廣告定位。
數(shù)據(jù)可遷移性:在去中心化環(huán)境下,用戶擁有個人數(shù)據(jù),可以選擇共享對象。而且不受服務供應商的限制(如果還存在服務供應商的概念)。這點很重要。如果你想換車,為什么不可以遷移自己的個人駕駛記錄呢?聊天平臺記錄和醫(yī)療記錄同此理。
安全性:最后我們的世界面臨著越來越大的安全威脅。在中心化環(huán)境下,越孤立的優(yōu)良環(huán)境越是吸引破壞者。去中心化環(huán)境的本質決定了其安全性,可以抵御黑客攻擊、滲透、信息盜竊、系統(tǒng)奔潰等漏洞,因為從一開始它的設計就保證了公眾的監(jiān)督。
近幾年很火的HBO《硅谷》以「互聯(lián)網(wǎng)去中心化」這個理念開始了最新一季。怪人風投家 Russ Hanneman 詢問陷入困境的 Pied Piper 創(chuàng)始人 Richard Hendricks,如果給予他無限的時間和資源,他想要構建什么? Hendricks 回答「一個全新的互聯(lián)網(wǎng)」,他隨后解釋說,現(xiàn)在每臺手機的運算能力都比人類登月時的手機要強大得多,如果你能用所有的幾十億臺手機構建一個巨大的網(wǎng)絡,使用壓縮算法將一切變得更小更高效, 更方便的轉移數(shù)據(jù),那么我們將能構建一個完全去中心化的互聯(lián)網(wǎng),沒有防火墻,沒有過路費,沒有政府監(jiān)管,沒有監(jiān)視,信息將會完全的自由。
詳細可以看以下視頻:
△?video
在后面劇情中,Pied Piper在Hooli大會上將Dan Melcher的幾千TB數(shù)據(jù)轉移到25萬手機上。雖然期間發(fā)生了一系列問題,但最后Dan Melcher的數(shù)據(jù)「神奇」地備份到3萬臺智能冰箱的巨型網(wǎng)絡上。
互聯(lián)網(wǎng)檔案館的創(chuàng)始人Brewster Kahle曾表示,互聯(lián)網(wǎng)去中心化在實際中很難被執(zhí)行,仍有很漫長的路要走。雖然《硅谷》只是一部電視劇,里面有部分技術純屬虛構,但是它也側面證實了一個事實,每一臺手機的運算能力和性能除了打打電話,聊聊天,玩玩游戲外,還能做到很多事情,例如成為新一代微型服務器和計算中心。
最合適的私人服務器
手機成為新一代微型服務器,這也符合Tim Berners-Lee「每個人都擁有自己的網(wǎng)絡服務器」的觀點。目前手機的性能和容量已經(jīng)可以媲美一臺臺式計算機,更重要的是,為了減少對CPU的壓力,手機擁有不同的協(xié)處理器。各協(xié)處理器各司其職,專門為手機提供不同的特色功能,例如iPhone從5s開始集成了運動協(xié)處理器,它能低功耗監(jiān)測并記錄用戶的運動數(shù)據(jù);MotoX搭載的協(xié)處理器可以識別你的語音/處理運動信息,從而在未喚醒狀態(tài)下使用Google now功能。
手機上各種傳感器可以從不同維度監(jiān)測用戶數(shù)據(jù),如果手機成為下一代微型服務器,那么它需要承擔著存儲用戶數(shù)據(jù)的責任。同時人工智能助手需要每個用戶海量的數(shù)據(jù)作為基礎才能更好地理解用戶并實時提供幫助,成為「千人千面」的個人助理,所以手機存儲和分析用戶數(shù)據(jù)是人工智能助手的基礎。
分析用戶的非結構化數(shù)據(jù)需要大量的計算,為了降低對CPU和電池的壓力,手機需要一塊低功耗專門分析用戶數(shù)據(jù)的協(xié)處理器。它能夠低功耗地進行深度學習、遷移學習等機器學習方法,對用戶的海量非結構化數(shù)據(jù)進行分析、建模和處理。
家庭也需要一個更大容量的服務器來減少手機容量的壓力,例如24小時長期工作的冰箱、路由器或者智能音箱是一個很好地承載數(shù)據(jù)的容器。用戶手機可以定期將時間較長遠的數(shù)據(jù)備份到家里服務器,這樣的方式有以下好處:
- 降低了手機里用戶數(shù)據(jù)的使用空間。
- 家庭服務器可以24小時穩(wěn)定工作,可以承擔更多更復雜的計算,并將結果反饋給移動端。
- 用戶手機等設備更換時,可以無縫使用現(xiàn)有功能。
Google在2015年已經(jīng)開始使用自家研發(fā)的TPU,它在深度學習的運算速度上比當前的CPU和GPU快15~30倍,性能功耗比高出約30~80倍。當手機、智能音箱等設備擁有與TPU類似的協(xié)處理器時,個人人工智能助理會到達新的頂峰。在17年9月份,華為發(fā)布了全球第一款AI移動芯片麒麟970,其AI性能密度大幅優(yōu)于CPU和GPU。在處理同樣的AI應用任務時,相較于四個Cortex-A73核心,麒麟970的新異構計算架構擁有大約50倍能效和25倍性能優(yōu)勢,這意味未來在手機上處理AI任務不再是難事。更厲害的是,iPhone X的A11仿生芯片擁有神經(jīng)引擎,每秒運算次數(shù)最高可達 6000 億次。它是專為機器學習而開發(fā)的硬件,它不僅能執(zhí)行神經(jīng)網(wǎng)絡所需的高速運算,而且具有杰出的能效。
數(shù)據(jù)的進一步利用
人工智能的發(fā)展依賴于大數(shù)據(jù)、高性能的運算能力和實現(xiàn)框架,數(shù)據(jù)是人工智能的基礎。在過去30年里,人類數(shù)據(jù)經(jīng)歷了兩個階段,孤島階段和集體階段。
孤島階段
在沒有互聯(lián)網(wǎng)以及互聯(lián)網(wǎng)前期,人類使用計算機基本處于單機狀態(tài),數(shù)據(jù)也只能存儲在計算機本地。由于計算機性能較差,產品較為簡單以及技術的不成熟,人類在計算機上產生的數(shù)據(jù)價值不大。
集體階段
在互聯(lián)網(wǎng)中后期和移動互聯(lián)網(wǎng)時代,計算機行業(yè)開始往互聯(lián)網(wǎng)發(fā)展并衍生出更多領域,例如網(wǎng)上社交、搜索等等,視頻音樂等娛樂行業(yè)也開始互聯(lián)網(wǎng)化;到了移動互聯(lián)網(wǎng)時代,巨頭們結合傳統(tǒng)行業(yè)產生出更多的玩法。人類每天的活動逐漸創(chuàng)造出龐大的數(shù)據(jù)。
由于數(shù)據(jù)的龐大以及技術有限,個人沒有能力對自己的數(shù)據(jù)進行存儲和分析,個人數(shù)據(jù)對個人來講仍然價值不大,但對于巨頭來說就不一樣了。巨頭們有的是資金和技術,即使個人數(shù)據(jù)擁有太多特征,但放在一起成為群體數(shù)據(jù)時,巨頭們可以通過數(shù)據(jù)清洗,建模等方法分析出相關群體的普遍特征,得出相關的用戶畫像,更了解自己的用戶是誰,從而設計出更有針對性的功能和服務,探索出新的用戶需求和衍生出新的產品。
隨著近幾年技術的成熟,巨頭們可以做到一些相對簡單的個人推薦。如亞馬遜,它可以根據(jù)你的購買記錄推薦相關商品給你,其背后的原理是通過分析大量的用戶購買數(shù)據(jù)后得到的商品推薦。
由于服務器的普遍昂貴以及普通用戶缺乏對數(shù)據(jù)處理的能力,而巨頭們有能力使用戶數(shù)據(jù)發(fā)揮更大價值,所以用戶數(shù)據(jù)一直「默許」被Google、Facebook、蘋果、騰訊、阿里、百度等巨頭收集著,這是可以理解的。每個用戶一天產生的數(shù)據(jù)涵括了社交、健康、購物、地理信息等等,但是巨頭們的壟斷和相互競爭,導致用戶數(shù)據(jù)被各巨頭分割和收集使用,再加上巨頭們寧愿生產更多的產品進行競爭也不愿意使用戶數(shù)據(jù)互通,導致用戶數(shù)據(jù)發(fā)揮不出更大的價值。這也是人工智能發(fā)展道路上的一道很現(xiàn)實赤裸裸的門檻。
互通階段
若要使人工智能得到更快發(fā)展,需要分析和了解更多完整數(shù)據(jù);加上互聯(lián)網(wǎng)去中心化的理念,應用廠商把數(shù)據(jù)「還給」用戶將會是下一個趨勢。把數(shù)據(jù)「還給」用戶的意思不是指應用廠商不應該擁有該數(shù)據(jù),而是指將數(shù)據(jù)共享出去,從而獲得更多有用的數(shù)據(jù)。
為了人工智能的發(fā)展讓各個應用廠商之間共享數(shù)據(jù)是不符合競爭和現(xiàn)實的,但用戶有權把自己的數(shù)據(jù)給「拿」回來,因為這些本來就是用戶自己的。這時候用戶需要一個數(shù)據(jù)倉庫,它能存儲和整理不同應用廠商的數(shù)據(jù),而人工智能可以利用數(shù)據(jù)進行自我優(yōu)化和分析出該名用戶的特征。
例如我們手機里的淘寶和京東,用戶使用它們時的動機和場景不一樣,所以它們所得的用戶畫像僅是該名用戶的一部分,不能完全代表該名用戶。如果淘寶和京東將各自的數(shù)據(jù)保存到個人數(shù)據(jù)倉庫,人工智能將數(shù)據(jù)整理完后為淘寶和京東輸出已授權的完整用戶畫像,那么淘寶和京東可以為該名用戶提供更多的個性化服務,創(chuàng)造更多收益。這就是應用廠商為人工智能提供數(shù)據(jù),人工智能反哺各應用廠商。
下一代人工智能助理
為了更了解你,人工智能需要了解更多數(shù)據(jù)。在日常生活中,一名用戶的主要信息歸納為:身份信息、健康數(shù)據(jù)、興趣愛好、工作信息、財產數(shù)據(jù)、信用度、消費信息、社交圈子、活動范圍9個大類。
- 身份信息:名字、性別、年齡、家鄉(xiāng)、身份證(身份證包含前4項)、賬號、現(xiàn)居住地址和家庭信息。
- 健康數(shù)據(jù):基礎身體情況、醫(yī)療記錄和運動數(shù)據(jù)。
- 興趣愛好:飲食、娛樂、運動等方面。
- 工作信息:公司、職位、薪酬和同事通訊錄。
- 財產數(shù)據(jù):薪酬、存款、股票、汽車、不動產和貴重物品。
- 信用度:由信用機構提供的征信記錄。
- 消費信息:消費記錄(含商品類型、購買時間、購買價格和收貨地址)、消費水平和瀏覽記錄。
- 社交圈子:通訊錄(含好友、同事、同學和親戚)和社交動態(tài)(含線下和線上)。
- 活動范圍:出行記錄、主要活動范圍和旅游。
以上方面都有相關產品提供服務和數(shù)據(jù)記錄,例如社交應用微信和陌陌、購物應用京東和淘寶、運動健康Keep等等。如果各方面數(shù)據(jù)打通并提供給人工智能,人工智能擁有用戶更多的數(shù)據(jù)和特征,更多應用和智能硬件可以通過連接人工智能了解用戶信息,從而進行自我學習和優(yōu)化??傮w來說,人工智能能代表你,它也是最懂你的個人助理。
人工智能數(shù)據(jù)倉庫設計
2015年堪稱智能家居元年,但最后大眾還是被忽悠了。通俗理解的話,智能家居的重點是智能,而人工智能沒有發(fā)展起來,智能家居如何智能?
現(xiàn)在大部分智能電器就像一個孤島,只能通過手機里的不同App操控,相互之間沒有任何聯(lián)動,根本體現(xiàn)不出智能家居的概念,直至小米打破了現(xiàn)有狀況。
小米通過MIUI、路由器和小米生態(tài)鏈布局智能家居生態(tài),前期通過路由器掌控聯(lián)網(wǎng)大權,小米電視占據(jù)家庭娛樂中心、Wifi插座使基礎家電智能化、各種傳感器使建筑智能化;中期通過與科技企業(yè)如美的的合作,以及小米生態(tài)鏈的各種產品如掃地機器人、空氣凈化器、電飯煲等,由小米控制的智能家居不斷滲透到用戶家里;近期推出299元的小米AI音箱使小米智能家居達到一個新的高潮,控制智能家居變得更為簡單,用戶可以通過AI音箱對各產品下達指令和操控。至今為止,在國內智能家居布局最出色的是小米。
目前小米的智能家居布局仍處于初期階段,只是把不同電器互聯(lián)化并連接一個終端。家居的智能不只是簡簡單單地通過命令操作就行,更多在于智能家居之間的聯(lián)動以及更懂主人,這靠的是對用戶數(shù)據(jù)的積累、理解和分享;但也帶來隱私問題,用戶會擔心更多產品和人工智能接觸到更多數(shù)據(jù)時,自己的生活被24小時監(jiān)控著。人工智能將會是科學與倫理博弈中最激烈的一環(huán),所以如何實現(xiàn)底層的數(shù)據(jù)倉庫是關鍵。
未來的人工智能和數(shù)據(jù)倉庫應該是一個平臺,就像現(xiàn)在的操作系統(tǒng)Windows,iOS和Android,但數(shù)據(jù)倉庫不應該被巨頭們和政府掌控,因為它比現(xiàn)在的操作系統(tǒng)存儲更多用戶的隱私數(shù)據(jù),所以數(shù)據(jù)倉庫需要定制更多的隱私規(guī)則防止用戶數(shù)據(jù)泄露,以及定制開放協(xié)議實現(xiàn)多元創(chuàng)新,避免被巨頭壟斷。
該倉庫具有以下特性和功能:
- 數(shù)據(jù)倉庫擁有該名用戶的完整特征和數(shù)據(jù),它可以代表該用戶。
- 數(shù)據(jù)倉庫最少包含身份信息、健康數(shù)據(jù)、興趣愛好、工作信息、財產數(shù)據(jù)、信用度、消費信息、社交圈子、活動范圍9個模塊。每個模塊相互獨立,不耦合。
- 數(shù)據(jù)倉庫包括用戶特征、產品私有數(shù)據(jù)和共享數(shù)據(jù)。用戶特征只有輸出行為;私有數(shù)據(jù)只有輸入行為;共享數(shù)據(jù)具有輸入和輸出行為。
- 模塊間可以交換數(shù)據(jù),模塊具有規(guī)定的輸入和輸出接口格式。
- 每個模塊內的機器學習算法可自行升級或替換成其他廠商提供的算法。
- 每個模塊具有封閉性,算法不能向外發(fā)送用戶數(shù)據(jù)。
- 每個模塊擁有必選和非必須的固定數(shù)據(jù)字段。
- 產品可以向不同模塊輸入私有和共享數(shù)據(jù)。
- 產品提供的數(shù)據(jù)必須符合該模塊的必選數(shù)據(jù)字段,可以額外提供非必選數(shù)據(jù)字段。
- 由模塊內部的算法對該模塊的共享、私有數(shù)據(jù)進行標注和建模,產出相關用戶特征。
- 算法可以申請授權獲取其他模塊共享數(shù)據(jù)和用戶特征。
- 在授權范圍內,產品可以獲取相關模塊的用戶特征和共享數(shù)據(jù)部分,無法訪問私有數(shù)據(jù)。
- 數(shù)據(jù)倉庫定期將數(shù)據(jù)加密備份至個人服務器。
- 數(shù)據(jù)倉庫定期清理過期數(shù)據(jù)。
- 數(shù)據(jù)倉庫容量不足時自動提醒用戶備份數(shù)據(jù)并清理空間。
- 數(shù)據(jù)倉庫自動加密用戶數(shù)據(jù),防止泄露。
不同廠商的數(shù)據(jù)倉庫產品應該遵循以下協(xié)議:
- 不同數(shù)據(jù)倉庫相同模塊的必選數(shù)據(jù)字段需要一致。
- 數(shù)據(jù)倉庫內部算法和數(shù)據(jù)倉應相互獨立。
- 數(shù)據(jù)倉庫可以沿用以往數(shù)據(jù)和用戶特征。
- 數(shù)據(jù)倉庫之間傳輸數(shù)據(jù)需要加密。
- 不允許設置后門。
數(shù)據(jù)倉庫制定協(xié)議的好處:
- 企業(yè)可以根據(jù)規(guī)范制定數(shù)據(jù)倉庫,降低被巨頭控制的風險。
- 數(shù)據(jù)倉庫內不同模塊的機器學習算法可以由不同企業(yè)制定和替換。
- 有利于進行不同企業(yè)數(shù)據(jù)倉庫之間的數(shù)據(jù)遷移和升級。
- 該用戶名下的數(shù)據(jù)倉庫進行數(shù)據(jù)同步時是加密的,降低隱私的曝光和風險。
人工智能需要考慮運算性能、電量、發(fā)熱量、數(shù)據(jù)采集和人機交互等問題。在移動端,手機依然是人工智能助理的最好載體,可穿戴式設備更多成為輔助;在家或辦公室里,最好的人工智能助手載體應該一分為二:
- 一是可與用戶對話交互的電器,例如現(xiàn)在流行的智能音箱,還有具有大屏展示的電視,甚至是24小時供電的路由器。
- 二是具有天生優(yōu)勢的冰箱:它也是24小時供電,它的自動降溫能力能更好地解決復雜運算時所產生的熱量問題,它的龐大體積可以容納更多存儲數(shù)據(jù)的硬盤和計算機部件。
可推測,冰箱將成為個人人工智能的運算中心,就像一臺服務器,手機和智能音箱等將成為與用戶打交道的人工智能助理。當運算中心處理完數(shù)據(jù)后,將結果同步至相關人工智能助理,數(shù)據(jù)倉庫將成為連接它們的橋梁。只有完善底層的數(shù)據(jù)共享,人工智能才能發(fā)揮出最大價值。
其他資料閱讀
- 人工智能史
- 科普AI之60年前的達特茅斯會議與AI緣起
- 《人工智能》-李開復、王詠剛著
- 知識圖譜
- 小米《奇葩說》花式廣告大賽
歡迎關注作者的個人公眾號:薛志榮
「人工智能大趨勢!你準備好了嗎」
- 《人工智能時代來臨,設計師會被淘汰嗎?》
- 《人工智能時代,不想失業(yè)的設計師應該提前做哪些準備?》
- 《UCAN2017回顧!為什么39%的設計工作可能被人工智能取代?》
- 《雙11期間有1.7 億個banner,都來自阿里的“魯班”AI設計系統(tǒng)》
- 《未來的趨勢!好的 AI 對話體驗應該是怎樣的?》
================明星欄目推薦================
優(yōu)優(yōu)教程網(wǎng): UiiiUiii.com?是優(yōu)設旗下優(yōu)質中文教程網(wǎng)站,分享了大量PS、AE、AI、C4D等中文教程,為零基礎設計愛好者也準備了貼心的知識樹專欄。開啟免費自學新篇章,按照我們的專欄一步步學習,一定可以迅速上手并制作出酷炫的視覺效果。
設計導航:國內人氣最高的設計網(wǎng)址導航,設計師必備:http://hao.uisdc.com
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
標志設計標準教程
已累計誕生 729 位幸運星
發(fā)表評論 為下方 1 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓