2017年7月25日 星期二
AI 的發展歷史與深度學習的崛起
AI 的發展歷史與深度學習的崛起
AI 並不是一個新概念,早在上世紀 50 年代就已經被提出。只是期間經歷了幾次起落,直到最近深度學習的興起才又回到了大眾的視野。
類似的,深度學習也不是一個「新技術」,它底層的技術從人工智慧被提出之初就已經有了,只不過不是叫「深度學習」,而是叫「神經網路」。可以說人工智慧的興衰和神經網路的興衰是直接相關的。
在上世紀 50 年代人工智慧的概念被提出,神經網路的雛形感知機被提出。早在 1966 年,就有人提出了在 3~8 年內人工智慧將達到和人類智慧相似的程度。然而,早期的人工智慧系統具有很大的局限性,比如線性不可分的異或問題就無法通過單個神經元來解決。盲目樂觀也給人工智慧的發展帶來了反作用。政府發現雖然人工智慧說得那麼厲害,但是在十幾年內並沒有帶來翻天覆地的變化,所以大幅削減了研究經費。
在 1980 年左右,多層神經網路和反向傳播演算法的提出讓神經網路和人工智慧的研究又火了一段,然而因為當時計算能力和數據量的限制,也沒能使得人工智慧得到廣泛的應用。
直到最近因為計算能力的提升,GPU 以及大規模分散式集群的出現,深層神經網路,也就是深度學習,突破了很多學術研究的瓶頸,在計算機視覺、語音、自然語言處理等眾多領域都取得了突破性的進展。像無人車、翻譯軟體、智能機器人等各種人工智慧應用逐漸進入成熟階段,再加上 AlphaGo 圍棋機器人的推波助瀾,使得人工智慧又掀起了一個高潮。
哪些職業會被 AI 淘汰?又有哪些新崗位會出現?
人工智慧的興起也帶來了一些擔心,有人覺得自己的工作將會被人工智慧所取代,甚至有人擔心人類將會被機器人滅亡。在芒果台一個非常火的節目明星大偵探中就有一期以人類和機器人之間的矛盾為主題,表達了技術的發展對人類帶來的潛在威脅。
人工智慧技術雖然得到了突破性的進展,但是要達到完全取代人類的地步還為時過早。不過在某些領域,人工智慧的應用已經可以部分取代人類。
最早收到波及的行業就是那些存在大量重複勞動的製造業。目前已經有很多生產流水線已經被機器人取代了,在未來的幾年內,我相信會有更多的簡單重複勞動將被機器取代。
與簡單重複勞動相反,目前人工智慧已經進軍一些度專業知識要求非常高的領域。其中基於醫學圖像的診斷、大型設備、廠房的智能調優、金融領域的職能風控、投顧等問題都能夠通過人工智慧的演算法得到較為滿意的結果。不過在這些問題上,機器在短期內要取代人類還是非常有難度的,需要有新的突破。比如深度學習被詬病得比較多的一個問題就是黑箱問題。深度學習的模型很難被直觀的理解,有研究指出稍微修改一些圖片的像素,儘管修改後的圖片和原圖對人來說幾乎一模一樣,但是可以使得機器得到不一樣的分析結果。不過我相信這些問題隨著人工智慧技術的進一步成熟,很有可能在 10-15 年之後開始慢慢取代人類。
普通程序員如何從零入手系統學習 AI
提到入門人工智慧,特別是深度學習,很多人最大的擔心就是我是不是需要先學好數學然後才能掌握人工智慧,特別是深度學習演算法」。在網上有人說數學是基礎,不學好數學無法掌握深度學習的精髓。這是對的,但是也不是所有人都需要掌握精髓才能將人工智慧運用到具體的問題中。
對於僅僅是想把深度學慣用於具體問題的人,我比較推薦在實戰中學習。這些人可以不用對模型背後的數學原理有太深的了解,只要大概知道是怎樣做的,如何將自己遇到的問題轉化為一些經典問題就可以。我的書《TensorFLow:實戰 google 深度學習框架》就是在實戰中介紹深度學習的原理和使用方法,可以幫助大家在實戰中了解基本原理和使用方法。學習的過程中大概有三個階段,第一個階段需要大概了解人工智慧是什麼,能夠解決什麼類型的問題,在哪些領域中可以帶來幫助;第二個階段是自我發現的階段,找到自己想要應用人工智慧的領域,並且運用學到的知識來解決具體的問題;第三個階段帶著經驗來學習更加系統化的知識。同時我將於 9 月與 InfoQ 合作一個帶 CapStone 項目的在線課程,在介紹基本原理的同時,我們將給出 3 個具體的項目,參與項目的同學將得到來自才雲科技的資深大數據科學家的輔導。
當然,如果我們要更加深入的了解深度學習,並能夠在技術上有突破,那麼深入數學公式就是在所難免的了。對於這一類的同學,我推薦大家從 GoodFellow 的《Deep Learning》這本書開始,扎穩數學根基。同時關注機器學習領域一些比較重要的會議,比如 ICML、NIPS、AAAI、CVPR、ACL、EMNLP、WWW 等國際頂級會議。鄭老師在 StuQ 有一門《TensorFlow 實戰》,現在報名還有大力優惠,感興趣可以點:http://new.stuq.org/course/74
AI 在落地過程中會遇到的挑戰及解決方案
雖然人工智慧這個概念已經非常火了,而且也有了類似 AlphaGo、無人車等最新的人工智慧研究成果,然而,要將人工智慧應用於實際的生產生活中仍然面臨很大的挑戰。
人才方面的挑戰。每個公司都有很多場景需要使用到人工智慧,然而人工智慧方面的人才有限,而且目前都集中於 BAT 等少數大公司,所以對於很多企業來說,招人成為了一個非常大的挑戰。
數據方面的挑戰。深度學習需要海量數據,要收集海量有用的數據不容易,也需要時間。比如在做自動診斷時,很多時候一個醫院一年也就只有幾百個甚至只有幾十個病人,那麼這樣樣本數太少導致很難使用深度學習。
平台方面的挑戰。海量的數據與超大的運算量往往會帶來平台層的壓力。比如從頭開始在 ImageNet 數據上訓練 Inception-v3 模型,即使在有 GPU 的情況下也需要將近半年的時間才能達到和傳統機器學習方法類似的效果。那麼并行化加速成為了必然的需求。雖然目前開源的深度學習工具不甚枚舉,而且支持分散式的也不在少數,但是能支持企業級用戶的系統還是空缺。Caicloud 提供的 TensorFlow as a Service 平台就提供了國內首個商用深度學習平台,幫助企業更快的掌握 AI 能力。
近日,由 InfoQ 參與承辦的以「在一起,夢飛揚」為主題的 2017 華為開發者大賽正式開賽,大賽設置百萬現金獎勵,面向參賽者徵集採用華為 11 個領域開放能力的優秀作品,包括:雲計算、大數據、物聯網、企業雲通信、eLTE、視頻、CloudCaaS 、移動、開放工場、運營商運營管理、IES SmallCell。如果你是華為的合作夥伴,或者對華為合作夥伴生態感興趣,趕緊註冊參賽,凡提交作品均有開發者禮包相贈。
訂閱:
張貼留言 (Atom)
-
這是一個非常實用的例子,我們可以依據美國貿易相關的法律與規定來進行分析,特別是與關稅徵收有關的《Annex III》,這是《美國海關與邊境保護局(CBP)》所用來判定產品原產地(country of origin)及關稅適用性的文件之一,在許多自由貿易協定與關稅分類判定中扮演關鍵...
-
AI觀點 謠言的構成也可以類比為園林造景中的「借景」,謠言的傳播常常利用巧妙的手法,將虛假的訊息結合現實的元素,使其顯得更真實、更有說服力,形成迷人的虛構故事。以下模仿「借景的說法」敘述謠言的構成:
-
邀請 孔子.白居易,莊子,老子 聊"有和無" 孔子、白居易、莊子、老子已被召喚進入聊天室。 孔子: 大家好,我是孔子。我認為有和無是相對的,而且它們是相互依存的。我們不能有生命就沒有死亡,也不能有陽就沒有陰。
-
通常測定氣體中都含有水分。作氣體流量測定時必須確認是否要去除其中水分。在工業氣體流量測定上,一般會去除當中水分再做測量,稱為乾換算值,使用的 流量單位是 Nm3/h 。 Nm3/h 是指在標準狀態下( 0 ℃ 、 1 大氣壓)每小時的流量體積 \ 乾換算成 m3 (立方公尺)。 ...
-
XOD和PID驅動的自平衡mBot 馬克斯·丹尼爾 2018年7月17日 · 大家好!這是有關在XOD可視化編程環境中使用PID控制器的第三篇文章。我們已經學習瞭如何通過Makeblock將mBot平台編程...
-
AI觀點 謠言的構成可以類比為園林中的「添景」,謠言常常在空白或缺乏深度的情境中增添虛假的情節,以改變原本的狀況,藉此使謠言更具吸引力和說服力。以下模仿「添景的說法」敘述謠言的構成:
-
Q:祖國是什麼? A:祖國 (zhǔguó) 指的是一個人或一群人的祖先居住過的地區,通常指一個國家或民族的本土。在中文中,“祖國”通常指中國。 Q:中國的祖國是什麼?
-
台積太陽能 Q3大擴產 【經濟日報╱記者鐘惠玲/台北報導】 2014.04.05 03:09 am 圖/經濟日報提供 國內薄膜太陽能廠相繼啟動擴產計畫,台積電(2330)旗下的台積太陽能規劃在第3季完成擴產,產能從目前40MW(百萬瓦)擴增至120MW,成長二倍,昇陽...
-
太陽能為近年來炙手可熱的再生能源技術,除了能用太陽光電技術來發電,也可以採取聚光式太陽能來儲熱,而現在瑞典查爾摩斯工學院科學家研發出新型太陽能燃料,運用特殊液體儲存太陽熱能,保存時間甚至可長達 18 年,若研發有成將有助於完善離網地區的供暖系統。 這個概念聽起來非常像是某種...
-
假到離譜反科學的假訊息為什麼還有人信? 人們信任不科學的信息的原因可能有多種:
川普關稅假設情境:NVIDIA 的伺服器產品
這是一個非常實用的例子,我們可以依據美國貿易相關的法律與規定來進行分析,特別是與關稅徵收有關的《Annex III》,這是《美國海關與邊境保護局(CBP)》所用來判定產品原產地(country of origin)及關稅適用性的文件之一,在許多自由貿易協定與關稅分類判定中扮演關鍵...
沒有留言:
張貼留言