2017年7月25日 星期二

AI 的發展歷史與深度學習的崛起

AI 的發展歷史與深度學習的崛起 AI 並不是一個新概念,早在上世紀 50 年代就已經被提出。只是期間經歷了幾次起落,直到最近深度學習的興起才又回到了大眾的視野。 類似的,深度學習也不是一個「新技術」,它底層的技術從人工智慧被提出之初就已經有了,只不過不是叫「深度學習」,而是叫「神經網路」。可以說人工智慧的興衰和神經網路的興衰是直接相關的。 在上世紀 50 年代人工智慧的概念被提出,神經網路的雛形感知機被提出。早在 1966 年,就有人提出了在 3~8 年內人工智慧將達到和人類智慧相似的程度。然而,早期的人工智慧系統具有很大的局限性,比如線性不可分的異或問題就無法通過單個神經元來解決。盲目樂觀也給人工智慧的發展帶來了反作用。政府發現雖然人工智慧說得那麼厲害,但是在十幾年內並沒有帶來翻天覆地的變化,所以大幅削減了研究經費。 在 1980 年左右,多層神經網路和反向傳播演算法的提出讓神經網路和人工智慧的研究又火了一段,然而因為當時計算能力和數據量的限制,也沒能使得人工智慧得到廣泛的應用。 直到最近因為計算能力的提升,GPU 以及大規模分散式集群的出現,深層神經網路,也就是深度學習,突破了很多學術研究的瓶頸,在計算機視覺、語音、自然語言處理等眾多領域都取得了突破性的進展。像無人車、翻譯軟體、智能機器人等各種人工智慧應用逐漸進入成熟階段,再加上 AlphaGo 圍棋機器人的推波助瀾,使得人工智慧又掀起了一個高潮。 哪些職業會被 AI 淘汰?又有哪些新崗位會出現? 人工智慧的興起也帶來了一些擔心,有人覺得自己的工作將會被人工智慧所取代,甚至有人擔心人類將會被機器人滅亡。在芒果台一個非常火的節目明星大偵探中就有一期以人類和機器人之間的矛盾為主題,表達了技術的發展對人類帶來的潛在威脅。 人工智慧技術雖然得到了突破性的進展,但是要達到完全取代人類的地步還為時過早。不過在某些領域,人工智慧的應用已經可以部分取代人類。 最早收到波及的行業就是那些存在大量重複勞動的製造業。目前已經有很多生產流水線已經被機器人取代了,在未來的幾年內,我相信會有更多的簡單重複勞動將被機器取代。 與簡單重複勞動相反,目前人工智慧已經進軍一些度專業知識要求非常高的領域。其中基於醫學圖像的診斷、大型設備、廠房的智能調優、金融領域的職能風控、投顧等問題都能夠通過人工智慧的演算法得到較為滿意的結果。不過在這些問題上,機器在短期內要取代人類還是非常有難度的,需要有新的突破。比如深度學習被詬病得比較多的一個問題就是黑箱問題。深度學習的模型很難被直觀的理解,有研究指出稍微修改一些圖片的像素,儘管修改後的圖片和原圖對人來說幾乎一模一樣,但是可以使得機器得到不一樣的分析結果。不過我相信這些問題隨著人工智慧技術的進一步成熟,很有可能在 10-15 年之後開始慢慢取代人類。 普通程序員如何從零入手系統學習 AI 提到入門人工智慧,特別是深度學習,很多人最大的擔心就是我是不是需要先學好數學然後才能掌握人工智慧,特別是深度學習演算法」。在網上有人說數學是基礎,不學好數學無法掌握深度學習的精髓。這是對的,但是也不是所有人都需要掌握精髓才能將人工智慧運用到具體的問題中。 對於僅僅是想把深度學慣用於具體問題的人,我比較推薦在實戰中學習。這些人可以不用對模型背後的數學原理有太深的了解,只要大概知道是怎樣做的,如何將自己遇到的問題轉化為一些經典問題就可以。我的書《TensorFLow:實戰 google 深度學習框架》就是在實戰中介紹深度學習的原理和使用方法,可以幫助大家在實戰中了解基本原理和使用方法。學習的過程中大概有三個階段,第一個階段需要大概了解人工智慧是什麼,能夠解決什麼類型的問題,在哪些領域中可以帶來幫助;第二個階段是自我發現的階段,找到自己想要應用人工智慧的領域,並且運用學到的知識來解決具體的問題;第三個階段帶著經驗來學習更加系統化的知識。同時我將於 9 月與 InfoQ 合作一個帶 CapStone 項目的在線課程,在介紹基本原理的同時,我們將給出 3 個具體的項目,參與項目的同學將得到來自才雲科技的資深大數據科學家的輔導。 當然,如果我們要更加深入的了解深度學習,並能夠在技術上有突破,那麼深入數學公式就是在所難免的了。對於這一類的同學,我推薦大家從 GoodFellow 的《Deep Learning》這本書開始,扎穩數學根基。同時關注機器學習領域一些比較重要的會議,比如 ICML、NIPS、AAAI、CVPR、ACL、EMNLP、WWW 等國際頂級會議。鄭老師在 StuQ 有一門《TensorFlow 實戰》,現在報名還有大力優惠,感興趣可以點:http://new.stuq.org/course/74 AI 在落地過程中會遇到的挑戰及解決方案 雖然人工智慧這個概念已經非常火了,而且也有了類似 AlphaGo、無人車等最新的人工智慧研究成果,然而,要將人工智慧應用於實際的生產生活中仍然面臨很大的挑戰。 人才方面的挑戰。每個公司都有很多場景需要使用到人工智慧,然而人工智慧方面的人才有限,而且目前都集中於 BAT 等少數大公司,所以對於很多企業來說,招人成為了一個非常大的挑戰。 數據方面的挑戰。深度學習需要海量數據,要收集海量有用的數據不容易,也需要時間。比如在做自動診斷時,很多時候一個醫院一年也就只有幾百個甚至只有幾十個病人,那麼這樣樣本數太少導致很難使用深度學習。 平台方面的挑戰。海量的數據與超大的運算量往往會帶來平台層的壓力。比如從頭開始在 ImageNet 數據上訓練 Inception-v3 模型,即使在有 GPU 的情況下也需要將近半年的時間才能達到和傳統機器學習方法類似的效果。那麼并行化加速成為了必然的需求。雖然目前開源的深度學習工具不甚枚舉,而且支持分散式的也不在少數,但是能支持企業級用戶的系統還是空缺。Caicloud 提供的 TensorFlow as a Service 平台就提供了國內首個商用深度學習平台,幫助企業更快的掌握 AI 能力。 近日,由 InfoQ 參與承辦的以「在一起,夢飛揚」為主題的 2017 華為開發者大賽正式開賽,大賽設置百萬現金獎勵,面向參賽者徵集採用華為 11 個領域開放能力的優秀作品,包括:雲計算、大數據、物聯網、企業雲通信、eLTE、視頻、CloudCaaS 、移動、開放工場、運營商運營管理、IES SmallCell。如果你是華為的合作夥伴,或者對華為合作夥伴生態感興趣,趕緊註冊參賽,凡提交作品均有開發者禮包相贈。

沒有留言:

方便性、能量密度、安全性、應用場景等各方面表現都更優異的奈米液流電池最終能打敗鋰電池嗎?

  當莫妮卡開著她的電動車前往母親家時,車上的電池指示器顯示需要重新充電。她在一個充電站停下來,在加油站刷了信用卡,把噴嘴插入車內,並在5分鐘內將400升用過的奈米液體換成新的。在她等待的過程中,一輛油罐車開過來為充電站補充燃料,交換數萬升充滿電的燃料。莫妮卡關上她的電動車的加油...