2017vs2019,AI三年浮沉記
【CPS中安網(wǎng) cps.com.cn】據(jù)Gartner發(fā)布的2017年《技術成熟度報告》顯示,其中出現(xiàn)了8項新增技術成果,其中包括5G、人工通用智能、深度學習、深度強化學習、數(shù)字孿生、邊緣計算、無服務器PaaS以及認知計算。
時移世易,2019年技術的創(chuàng)新和發(fā)展已經(jīng)超出了我們的想象,據(jù)人工智能行業(yè)分析機構CBInsights發(fā)布的 《2019年AI趨勢報告》 來看,人工智能正在以可見的速度滲透到各行各業(yè)中。
深度學習熱度過后的“冷思考”
2017年,人們對深度學習的發(fā)展寄予了厚望,認為它將會產生最多的利潤,眾多資本涌入人工智能的各個領域,最好的例子就是AlphaGo的勝利。2017年5月,在中國烏鎮(zhèn)圍棋峰會上,AlphaGo與排名世界第一的世界圍棋冠軍柯潔對戰(zhàn),以3比0的總比分獲勝。
到2017年底,超強版AlphaGo Zero完全不依賴于人類數(shù)據(jù),在只知道比賽規(guī)則的情況下自我對弈,3天訓練后就以100比0戰(zhàn)勝了AlphaGo。
在棋類游戲中,圍棋所包含的巨大的搜索空間(其狀態(tài)數(shù)遠遠超過整個宇宙中的原子數(shù))一直是機器學習未能攻克的難題,甚至一度被認為在近期內是不可能被AI解決的。AlphaGo的成功不僅讓人們看到了強化學習和隨機模擬技術(也稱“蒙特卡羅”技術)的魅力,也讓深度學習變得更加炙手可熱。
冷靜之余,人們認識到AlphaGo的算法更適用于大規(guī)模概率空間的智能搜索,其環(huán)境和狀態(tài)都是可模擬的。DeepMind的創(chuàng)始人德米斯·哈薩比斯表示,對于那些環(huán)境難以模擬的決策問題(如自動駕駛),這些算法也無能為力。
NLP完成從量到質的躍遷
2017年是自然語言處理領域的重要一年,這一年的種種實踐(Word2vec和 GloVe)證明:預訓練詞嵌入模型已經(jīng)成為解決NLP問題的一類關鍵性工具。
舉例來說,來自Facebook AI Research(簡稱 FAIR)實驗室的fastText即提供包含294種語言的預訓練向量,這無疑給整個技術社區(qū)帶來了巨大的貢獻與推動作用。盡管已經(jīng)實現(xiàn)了一定進展,但這方面仍有大量工作需要完成,這個領域需要更好的預訓練模型的出現(xiàn)。
2018年,谷歌發(fā)布了BERT,因其在問題答復到語言推理等不同任務上的卓越表現(xiàn)而引發(fā)關注。BERT是近期NLP(GPT、GPT2、ULMFiT 和 roBERTa)等模型中的一部分,這些模型的系統(tǒng)性能較之前有了很大改進,因此一些研究人員會稱NLP正處于它的“高光時刻”。
谷歌充分利用了BERT的優(yōu)越性并且將其加入到了 搜索引擎 中,這也從側面說明了這些技術兼具了研究和商業(yè)價值。2018年11月24日,谷歌正式放出BERT官方代碼和預訓練模型,包括模型的TensorFlow實現(xiàn)、BERT-Base和BERT-Large預訓練模型和TensorFlow代碼。
同樣,2018年6月,OpenAI發(fā)表論文首次介紹了自己的語言模型GPT。2019年年初,OpenAI宣布開發(fā)出了一個大型語言模型,可以生成合成文本,名為GPT-2。出于謹慎考慮,公司并沒有公開GPT-2的所有代碼,同時也是擔心它可能被誤用。
5月,OpenAI發(fā)布了一個3.5億參數(shù)的版本,并宣布將與有限的合作伙伴共享7.62億參數(shù)和15億參數(shù),同時他們也在研究針對惡意使用GPT-2的對策。這款被業(yè)內傳為“最強假新聞生成器”的GPT-2 AI模型,從誕生開始就引起大量關注。
時隔半年,GPT-2的階段性開放終于進入尾聲。11月6日,OpenAI正式放出 GPT-2最后一個部分的完整代碼——包含15億參數(shù)的最大版本。
這兩個預訓練模型的開放解決了標注數(shù)據(jù)缺乏的問題,幫助NLP完成了從量的積累到質的飛躍的轉變。
聯(lián)邦學習的征途是星辰大海
2016年,谷歌提出了聯(lián)邦學習,原本是用來解決安卓手機終端用戶在本地更新模型的問題,其可使用的機器學習算法不局限于神經(jīng)網(wǎng)絡,還包括隨機森林等重要算法。聯(lián)邦學習本質上是一種分布式機器學習技術,或機器學習框架,目標是在保證數(shù)據(jù)隱私安全及合法合規(guī)的基礎上,實現(xiàn)共同建模,提升AI模型的效果。
過去幾年,這一技術的標準在不斷完善。IEEE聯(lián)邦學習國際標準項目應運而生,這一項目由 微眾銀行 發(fā)起,于去年12月獲批,是國際上首個針對人工智能協(xié)同技術框架訂立標準的項目,目前已經(jīng)召開了四次工作組會議。聯(lián)邦學習標準草案預計將于 2020年2月推出,正式標準預計將于2020年上半年出臺。聯(lián)邦學習正在從“點到點的發(fā)展階段”轉向“應用落地、積累案例階段”。
在框架方面,2019年取得了重要進展,誕生了首個工業(yè)級開源框架FATE,這是微眾銀行AI團隊自主研發(fā)的開源框架。
FATE在今年2月份首發(fā)了0.1版本,3月份的時候有了第一位外部Contributor,同時GitHubStar突破100,5月份發(fā)布了0.2版本,支持了聯(lián)邦特征工程和在線推理,6月份發(fā)布了0.3版本,把主要的合作伙伴遷移到了FATE,并把FATE捐獻給了Linux Fundation,8月份發(fā)布了1.0版本,支持FATE-Flow和FATE-Board。
10 月 31 日,F(xiàn)ATE v1.1 版本正式發(fā)布,聯(lián)合VMware中國研發(fā)開放創(chuàng)新中心云原生實驗室團隊發(fā)布了 KubeFATE 項目,通過把 FATE 的所有組件用容器的形式封裝,實現(xiàn)了使用 Docker Compose 或 Kubernetes(Helm Charts)來部署。
不到三年的時間,聯(lián)邦學習已經(jīng)快速地發(fā)展了起來,而且在業(yè)界也得到回應,京東、騰訊云、平安科技 等等企業(yè)也已經(jīng)加入到聯(lián)邦學習的隊伍中來。
在推廣聯(lián)邦學習的過程中,建立一致的標準是目前面臨的一大挑戰(zhàn)。就在近期,IEEE P3652.1(聯(lián)邦學習基礎架構與應用)標準工作組第四次會議于北京成功召開。
北京大學、IEEE、微眾銀行、創(chuàng)新工場、京東、中國電信、騰訊、小米、阿里巴巴、依圖、星云Clustar、第四范式、華為終端、VMWare、LogiOcean、SensesGlobal、Swiss Re、Intel、CETC BigData、螞蟻金服、華夏基金、富數(shù)科技共 22 家頭部企業(yè)與研究機構參與。
會議聚焦于聯(lián)邦學習的場景分類與需求分類,著重對聯(lián)邦學習的安全測評與評級進行規(guī)劃,進一步探討聯(lián)邦學習標準制定,這可謂是聯(lián)邦學習發(fā)展的奠基性的貢獻。雖然目前聯(lián)邦學習還沒有迎來爆發(fā)式發(fā)展階段,但好在,未來可期。
自動駕駛既不是天使,也不是魔鬼
2017年中是自動駕駛新聞瘋狂爆漲的一年,幾乎每隔一個月就會爆出一條自動駕駛領域大事件。6月13日,通用宣布首批130輛搭載公司最新一代自動駕駛技術的測試版雪佛蘭Bolt純電動車在密歇根州的奧萊恩工廠下線。
算上當時由50輛雪佛B(yǎng)olt純電動車組成的測試車隊,通用已經(jīng)擁有了一個由180輛Bolt組成的自動駕駛車隊,在舊金山、亞利桑那州斯科茨代爾以及底特律開展公共道路測試。
7月11日,奧迪新款A8發(fā)布,其號稱是全球首款具備L3級自動駕駛功能的量產車型,可以實現(xiàn)60km/h以下的低速條件下,在擁堵路況中實現(xiàn)自動駕駛。
同年年末,北京頒布《北京市關于加快推進自動駕駛車輛道路測試有關工作的指導意見(試行)》和《北京市自動駕駛車輛道路測試管理實施細則(試行)》這兩份紅頭文件,標志著北京成為了中國首個開放公共道路自動駕駛路測的城市。
彼時,自動駕駛一片利好的大背景下,人們把自動駕駛技術比作解放雙手的“天使"。只是,好景不長。2018 年,Uber 自動駕駛汽車發(fā)生了全球首例致死車禍,一名女子在過馬路的途中被撞身亡。此事隨即引發(fā)了全球對無人車的關注,尤其是安全問題,這起慘烈的事故讓人們意識到了一個最重要的事實——安全性重于一切,只預估科技能避免多少事故是絕對不夠的。
同年 5 月谷歌旗下自動駕駛公司 Waymo 也出了一次車禍,事故導致一名測試人員受傷。后續(xù)的調查顯示,這起車禍仍舊是人為因素導致的,測試員走神打盹,才沒能及時處理突發(fā)情況,進而引發(fā)了這起悲劇。
目前,一些車廠也已經(jīng)實現(xiàn)了 L3 級自動駕駛,最有名的案例莫過于特斯拉一直以來宣傳的自動駕駛功能。有不少用戶已經(jīng)拍攝了相關的自動駕駛視頻上傳到了社交網(wǎng)絡,雖然是對自動駕駛技術的最佳宣傳,但是特斯拉官方仍然表示:并不支持用戶完全放開手腳進行自動駕駛,目前該功能仍然需要駕駛員隨時集中注意力觀察路況。
而 L4 級別的自動駕駛則是目前大部分公司正在攻克的難關。如今,公眾也開始更加客觀地看待自動駕駛這項技術,它既不是無害的“天使”,也不是殘忍的”魔鬼”。
AI芯片從受制于人到“奮發(fā)圖強”
2016年中國芯片領域相關設計公司數(shù)量較2015年增長了600多家;到2017年末,國內共有約1380家芯片設計公司。根據(jù)Soopat數(shù)據(jù),國內芯片相關專利每年公開數(shù)量都在上升,2018年至今已經(jīng)公布了18871件。然而,這些都還遠遠不夠。
2018年美國制裁 中興事件 給我們“狠狠上了一課”,隨后的華為在美受到種種針對進一步讓過渡依賴國外芯片進口的企業(yè)覺醒——落后就要挨打,在哪個領域都是如此。在核心技術上需爭高下,大企業(yè)需要當仁不讓,如果不掌握核心技術就是在別人的基礎上砌房子。種種困境讓中國科學界意識到“芯片當自強”的重要性。
2019 年,意識到這些問題之后,不少中國芯片企業(yè)開始奮起直追,尤其在專用芯片領域取得了較為亮眼的成績。
在 9 月 25 日的杭州云棲大會上,阿里巴巴集團首席技術官、阿里云智能總裁兼達摩院院長張建鋒現(xiàn)場展示了的AI芯片——含光 800。阿里巴巴方面表示:在業(yè)界標準的ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比當時業(yè)界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的3.3倍。
繼雙模5G芯片巴龍 5000 和全球首款5G基站芯片天罡問世后,華為今年推出了首款內置5G基帶的麒麟 990 5G SoC——首顆商用 5G 旗艦芯片。
不久前,芯片大廠聯(lián)發(fā)科也宣布推出 5G 芯片新品牌天璣,名源于北斗七星之一,其意為領先,并推出該品牌首款產品 5G SoC 芯片——天璣 1000。國產芯片在嘗盡了“受制于人”的冷眼后也開始自立自強,可見,核心技術只有掌握在自己手里,才能立于不敗之地。
5G 從技術萌芽走向大爆發(fā)
2017 年 12 月 21 日(北京時間),第五代移動通信結束“5G NR”首發(fā)版在 RAN 第 78 次全會代表的掌聲中正式凍結并發(fā)布,這是 5G 標準化的一個重要里程碑。從年初 3GPP 通過 5G 網(wǎng)絡加速的提案,到年底收官 3GPP 宣布完成了首個可實施的 5G 新空口(5G NR)規(guī)范,這一年 5G 的發(fā)展速度飛快。
2019 年 5G 已經(jīng)從技術名詞真正走向商業(yè)落地。今年 6 月 6 日,我國對三大運營商及中國廣電發(fā)放 5G 牌照,這標志著 5G 正式進入商用階段,基站部署速度大幅加快,這將為 AI 帶來很大的性能提升。
邊緣計算即將掀起波瀾
根據(jù)調研機構 Forrester 公司的調查,目前全球有 32%的電信公司決策者正在部署或擴展 邊緣計算 設施,另外 27%的決策者表示計劃在一年內部署邊緣計算設施。越來越多的企業(yè)開發(fā)和部署邊緣計算的主要動力來自帶寬、成本、網(wǎng)絡延遲的迫切性和敏感性。
邊緣計算是計算系統(tǒng)從扁平到邊緣,以及面向 5G 網(wǎng)絡架構演進的必然技術,同時也提供了一種新的生態(tài)系統(tǒng)和價值鏈。
第三方數(shù)據(jù)分析機構 IDC 預測,到 2020 年,全球將有約 500 億的智能設備接入互聯(lián)網(wǎng),其中主要涉及智能手機、可穿戴設備、個人交通工具等,其中 40% 的數(shù)據(jù)需要邊緣計算服務。邊緣計算有著強大市場潛力,也引起了各研究機構、標準組織、服務提供商和產業(yè)界極大的關注。
對于瞬息萬變的技術領域來講,三年的時間已經(jīng)足夠長。我們已經(jīng)從人工智能即將改變未來的遙遠的夢境中逐漸清醒過來,能夠真正冷靜、客觀地考量技術發(fā)展的中的利與弊。那么,作為一名技術從業(yè)者,你的 2017 到 2019 又發(fā)生了哪些變化?