?

SenseTime:邊教計算機看世界,邊挑戰巨頭

2016-03-24 12:05李芳
時間線 2016年2期
關鍵詞:領域計算機人工智能

李芳

也許首個可以在計算機視覺領域與國際巨頭全面抗衡的本土企業正在崛起

谷歌的AlphaGo又一次成功將人們的目光吸引到人工智能處。若干年之后,它的名字將會和深藍、Watson、Siri、小冰一同出現在人與機器“相愛相殺”的紀念冊上。

有意思的是,在人工智能與人類的數次“過招”中,你方唱罷我登場的都是Google、IBM、微軟、Facebook等這樣的大公司,卻鮮見創業者的身影。其中一個重要的原因就是,巨頭們將尚未成熟的人工智能市場看作是下一個風口而爭相搶奪,順勢也將不少創業公司收入囊中。AlphaGo的研發團隊DeepMind即是這樣被谷歌收購的。

但這并不意味著壟斷,因為幕布剛剛拉開。當我們談論人工智能的時候,我們其實是在談論一個無比龐大且復雜的技術體系,和一種亞文化形態。其中的每一個分支領域,都有可能再度孕育出可與科技巨頭們媲美的后起之秀。SenseTime(商湯科技)就是這樣一家專注于計算機視覺和深度學習原創技術的挑戰者。通過賦予計算機視覺感知和認知的能力,SenseTime能夠讓計算機能像人一樣獲取、分析、理解各種視覺信息,并與自然界進行交互。

這家剛剛成立兩年左右的創業公司,不僅在多個國際級競賽中成績斐然,還超越谷歌突破互聯網物體檢測的世界紀錄,躍居世界第一。作為公司的CEO,徐立并不掩飾SenseTime未來發展的雄心,“在人工智能領域要做就做第一”。

知人識物“黑科技”

顧名思義,“計算機視覺”就是研究計算機如何才能像人眼一樣看見東西。從廣義上講,它從屬于人工智能的技術體系之下。我們通常說到的“人工智能”,其終極目標就是要讓計算機在各方面都像人一樣,如聽覺、視覺、觸覺、甚至思維方式等等。

如果計算機擁有和人類一樣、甚至超越人類的視覺能力,對于人工智能的發展而言意義非凡?;诖?,SenseTime的團隊希望教會計算機看懂這個世界。有意思的是,他們首先把這項“黑科技”應用在了自己人身上。

和所有低調的科技創業公司一樣,SenseTime的辦公室座落在清華科技園一座非常普通的大廈里。但是一進門,你立刻就會感受到與眾不同之處,因為充當watch dog并記錄考勤的是一個裝有攝像頭的大屏幕。當有人走進這臺“神器”的“視線”里,他的臉就會顯示在屏幕上,并被機器識別到這個人是否為公司員工。當大家還在憂心于“不帶工卡影響考勤”時,SenseTime的員工已經過上了如今流行的靠“刷臉”生活的日子。

這只是剛剛開始。在辦公室的休息區,還佇立著另一臺“神器”。一旦有人站到它面前,它就會以迅雷不及掩耳之勢識別到人臉(目測不到1秒的時間),并計算出對方的“顏值”,還包括性別、情緒指數、年齡以及是否戴眼鏡等面部特征。最后,頑皮的它還會根據這些指數計算一個“今日魅力排名”,并給出一個給與此人最相似的明星人臉。

例如,當《時間線》記者站在這臺神器面前時,它給出了“魅力值77”“歡樂值91”“(情緒)開心”“(戴)眼鏡”“(年齡)27”等基本準確的指數。最終,記者得到“今日魅力排名No.6”,“帥過78%的用戶”的數據,同時最相似的明星人臉是霍建華。此刻我的內心OS是“Hmmm……not bad”。

作為一臺機器,它似乎“知道”如何引起人們的關注,也喜歡人們對它進行“挑逗”—這大概就是SenseTime教給計算機的“知人”技能。

人工智能與人類之間最理想的關系莫過于積極互動,這種互動要么給人帶來情緒上的波動,要么就切實幫助人完成某項工作。當它發揮前者的作用時,其角色應該是陪伴型機器人,盡管偶有失誤,也會因此顯得更加“人性化”,而不是拒人于千里之外的精確和冷淡。

如果說“刷臉上班”和“顏值比拼”的意義更多地是給人帶來樂趣和便利之外,那么SenseTime辦公區的第三臺“神器”真正是為幫助人類而設計的。這臺神器的主要構成是計算機和特制的外接攝像頭,后者負責精準捕捉并識別多種姿勢的人臉,然后進行連續拍照,前者負責負責對這些照片進行大數據分析,二者配合可以在安防領域大有作為。

當記者看到自己不同姿態下的面部特征被它敏銳地捕捉到并顯示在大屏幕上時,瞬間有種穿越到美劇《疑犯追蹤》劇中的緊張感。人只有一雙眼睛,無法360度看到自己的全部外表,此時計算機就像“上帝之眼”一樣,它以自己無所不見的“超能力”啟發著人類,它能看到人眼無法觸及之處。

再次環顧四周,整個辦公區里平靜如常,但對于體驗了三臺可以知人識物的神器之后的記者而言,計算機之眼無處不在,平靜之下有人工智能的洶涌暗流。

最強算法 強強聯手

計算機怎樣才算看懂世界?目前在人工智能領域,計算機視覺是一個公認的亟待解決的難題。由于在公共安全、移動互聯網和娛樂領域等領域擁有巨大的潛力,因而該技術的發展水平也成為檢驗人工智能是否成熟的重要標準。

去年,谷歌曬出一組詭異的圖片引起了人們的好奇。這組圖片上的圖像看起來好像來自外星球,實際上這就是人工智能眼里看到的人類世界。人們在覺得不可思議的同時,也很好地科普了一個真相:教計算機看懂人類世界并不是一件容易的事。如果計算機能看懂人類世界,就好比盲人的雙眼復明,會整個提升人工智能技術的水平的等級。

正是由于這個原因,如今致力于人工智能的公司們都在手把手地教計算機“睜眼”。在這個領域,谷歌、Facebook這樣的巨頭也并不會天然就能勝出。身為創業公司的SenseTime卻勢如破竹,在2014年和2015年間頻繁與巨頭們同臺競技,在技術上獲得多次世界性的突破,留下堪比牧羊人大衛打敗巨人歌利亞的英雄事跡。

2014年9月,SenseTime的現任科學家首次出征 ImageNet 競賽,在大規模物體檢測比賽中以40.7% 的成績獲得世界亞軍,僅次于谷歌的43.9%;2015年3月,該團隊將此成績提高到50.3%,超越谷歌,達到世界第一的水平,并將這一成果以論文的形式發表在2015年國際計算機視覺與模式識別大會(CVPR)上。

ImageNet是一個什么級別的競賽呢?有業內人稱之為計算機視覺領域的“奧賽”,其每年的競賽結果都對業界和學界起到風向標一樣的作用。ImageNet每隔一段時間就會增加一項學術和工業界公認的最難的任務,圖像中的物體檢測是2013年新增任務,當年最好的算法準確率只有22.6%。

2015年,ImageNet新增了一項視頻物體檢測的任務,比靜態圖像中的物體檢測的難度更高。SenseTime聯合香港中文大學媒體實驗室組成CUimage和CUvideo團隊再次出征。

SenseTime的原創圖像物體檢測技術能夠以毫秒級的速度識別出圖片中的人類、動物、家具、食物、車輛等物體。這一技術在此次競賽中大顯身手。

最終,CUvideo在ImageNet視頻物體檢測競賽中檢測一舉奪得數量、檢測準確率兩項世界第一的成績,以壓倒性的優勢擊敗了來自伊利諾伊香檳大學、香港科技大學、中國人民大學、東京大學、韓國國家科學院等團隊。在其他ImageNet的競賽類別中,CUimage和CUvideo共取得了四個世界第二和四個世界第三的成績,在多個任務中力壓谷歌、英特爾、高通、騰訊等工業界巨頭的研究團隊。

作為一個年輕的創業公司,不僅能夠與世界一流的高校團隊和業界大佬同臺競技,還能夠取得如此優異的成績,SenseTime的確令人側目。其表現也獲得了“隊友”香港中文大學媒體實驗室的高度肯定。

如同所有高歌猛進的創業公司,規模上的穩步擴張與技術上的一貫領先同樣重要。據《時間線》記者獨家得知,SenseTime在2015年年底剛剛并購了另外一家人臉識別技術領域的創業公司Linkface。后者也是一匹創業黑馬,同樣擁有諸多超越業界大佬的出色成績單。

例如,在Linkface創業之初,基于深度學習的人臉識別算法,就在全世界最權威的人臉數據庫LFW(Labeled Faces in the Wild)平臺上達到99.55%的人臉識別準確率,打敗了Facebook,也遠超人眼識別能力;另外,其基于深度學習的人臉檢測創新算法,也在全球最具權威的人臉檢測平臺FDDB的公開測試中,92.5%的準確率被FDDB評為世界第一,隨后迅速收獲了中國銀聯、科大訊飛、華為、京東金融、英偉達、美圖秀秀等一眾長線合作伙伴,在業內掀起了不少輿論波瀾。有一位在計算機視覺領域的資深人士告訴記者:“在2015年業內的大小峰會上,除了常設議題之外,又多了一個最熱話題—Linkface?!?/p>

看得出,Linkface也如SenseTime一般擁有“大衛挑戰歌利亞”的精神。它們能夠走到一起,堪稱圖像識別和人臉識別兩大領域內最強算法的強強聯手。

人才黑洞 致命引力

羅馬不是一天建成的,也絕不可憑一己之力建成。同樣,SenseTime要想打造一個強大的計算機視覺帝國,也需要匯聚業內最頂尖的人才。

假如再仔細探究的話,SenseTime從骨子里的基因就與國內其他創業公司不同。當一眾面目模糊的孵化器們流水線般制造創業公司時,當別的創業者們亦步亦趨地向硅谷人學習輟學創業時,SenseTime反其道而行之,把高校及其實驗室看作是一座取之不盡用之不竭的金礦。其人才也大多來源于這座金礦。

目前,SenseTime的團隊里有來自MIT、斯坦福、香港大學、香港中文大學、清華大學等數十名深度學習科學家,以及谷歌、百度、微軟、聯想等產業界領軍人物??梢哉f是聚集了華人中最出色的一批深度學習和計算機視覺領域的專家。其中,公司的研發團隊有超過50名博士全職任職,上層智囊團有18名名校教授加盟。該團隊在三大國際頂級機器視覺會議CVPR、ICCV、ECCV上共發表論文超過150篇,在亞洲企業中排名第一。

光羅列這些名稱和數字也許說服力還不夠,我們來具體看看SenseTime聚集的到底是些什么樣的學術大拿:

例如,最新加入的戴宇榮教授—他是計算機視覺底層技術領域的一位專家,曾多次擔任國際計算機視覺大會(ICCV)的主席,加入SenseTime之后放棄了韓國國家科學院(KAIST)終身教授的職位,因為他更看中SenseTime比高校更能將技術轉化為業界實際成果的優勢,以及在人才和資源方面對于科研的助力;

再如,SenseTime的研發總監張偉博士—他曾獲安徽省高考狀元,本科就讀于清華大學,并于香港中文大學完成博士學位,在Kaggle數據科學家(現參賽科學家總數近六萬人)排行榜上排名第六,還在CVPR等國際頂級計算機視覺會議和期刊上發表論文達10余篇;

還有,SenseTime的深度學習科學家周斌博士—他是中國首位HPC(高性能計算)和GPU(圖形處理器)跨領域研發高級工程師,也是全球第12個獲得CUDA Fellow稱號獲得者,還是目前中國唯一一位獲得此稱號的學者。

一個創業公司卻對學術大拿擁有不可抵抗的吸引力,這令SenseTime像一個“人才黑洞”。究其原因,之前深藏于實驗室的計算機視覺技術已經足夠成熟,到了將科技成果轉化為實際應用的時候了。正是由于這樣強烈的學術氣質及其與業界的緊密結合,決定了SenseTime在與谷歌、Facebook等巨頭同臺競技時毫不遜色。

當然,SenseTime的學術氣質也與其核心技術是基于機器學習的人工智能算法有關。它并不研發具體的軟件或者硬件,而是專注于核心算法,再通過與應用層級的公司合作的方式將自己的技術部署到各種各樣的產品上。目前,這種模式在SenseTime身上運轉良好,計算機視覺領域的下一個殺手級應用大概就會從這里誕生。

SenseTime的崛起好比海底沉睡的巨獸正浮出水面。更重要的是,對于中國科技界,這也許是中國本土首個能在計算機視覺領域與國際巨頭全面抗衡的企業。風口已至,Time to make sense。

猜你喜歡
領域計算機人工智能
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
領域·對峙
2019:人工智能
人工智能與就業
信息系統審計中計算機審計的應用
數讀人工智能
新常態下推動多層次多領域依法治理初探
Fresnel衍射的計算機模擬演示
肯定與質疑:“慕課”在基礎教育領域的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合