近日,清華大學教授、北京智譜華章科技有限公司(以下簡稱:智譜.AI)首席科學家唐杰及其團隊獲得了ACM SIGKDD 2020時間檢驗應用科學獎。這是華人團隊首次在該領域獲得此國際獎項。
所謂時間檢驗獎,指的是這篇論文要在過去十年間對研究,方法論以及實踐產生重大影響。獲獎的論文發(fā)表于2008年,標題為《ArnetMiner: extraction and mining of academic social networks》。
ArnetMiner(以下簡稱AMiner)指的是一個通過挖掘學術社交網絡來索引結果的平臺類學術搜索工具,該工具可以提取網絡中研究者資料,再通過集成數(shù)字圖書館,并對整個學術網絡進行建模,最終構建出了完整的學術搜索工具。根據論文的介紹,AMiner在10年前就已經標記了448470個研究者檔案以供搜索。
起初,AMiner只是一個構思,隨著研究的逐步完善,唐杰依然在10年間不斷地擴充著搜索工具的極限。在采訪中唐杰透露到,他每天凌晨2點睡覺,絕大多數(shù)時間泡在實驗室中,幾無中斷;領域研究熱點潮漲潮落,而他,研究的中心始終是AMiner系統(tǒng)。
截止至今,AMiner已經檢索了19世紀以來全球1億3千余萬學者發(fā)表的2億7千萬余篇學術論文數(shù)據,已吸引全球220個國家/地區(qū)1000多萬獨立IP訪問,數(shù)據下載量230萬次,年度訪問量超過1100萬。
唐杰在采訪中說到,全球的論文數(shù)量已經達到數(shù)億篇,但是論文背后的規(guī)律卻沒有人能總結出來。AMiner 從學術學科意義上就是歸納這種規(guī)律?!拔覀兿M谶@個過程中,能夠挖掘出學科發(fā)展背后的機理?!?/p>
依托于明星產品AMnier,由清華大學教授李涓子、唐杰等人,共同成立了智譜.AI,并且由清華大學計算機系教授、中國科學院院士張鈸擔任首席顧問。這是一家致力于打造可解釋、魯棒、安全可靠、具有推理能力的新一代認知引擎的公司。
智譜.AI董事長為劉德兵,他是中科院計算所博士,師從高文院士,清華數(shù)據科學研究院科技大數(shù)據研究中心副主任,同時也是Thomson北京研究院高級研究員,清華計算機系高級工程師。智譜.AI 的CTO張鵬博士為中國新聞信息標準化分會委員、電子學會標準化工作委員會機器人技術委員會委員。張鵬是2002年本科畢業(yè)于清華大學計算機系,博士在清華大學計算機系的研究方向為知識圖譜。
唐杰指出,AMiner的盈利模式可以分為幾大塊。To C方向,AMiner是完全免費的,任何人都可以去搜索論文、查找資料。另外兩個最主要的應用,一個是面向政府,一個是面向企業(yè)。而其中又可以劃為兩個脈絡,一個是高端人才的發(fā)現(xiàn)和推薦,另一個是技術趨勢、脈絡的梳理和分析。
AMiner最早的一個盈利點是專家推薦。唐杰說到:“比如說項目評審,找誰來評?他就需要一個最合適人選的推薦;另外在高端人才引進方面,哪個方向,引進誰?這也同樣需要作出推薦?!薄笆奈濉币?guī)劃,不僅僅是國家層面,甚至各級政府、各高校院所都希望能夠把握未來的技術脈絡,看清未來趨勢。
智譜.AI所提倡的是一種圖譜式搜索引擎。通過知識獲取、推理與認知這樣的底層技術,篩選網絡資源并返回相關結果。從產品角度具體來講,該公司除AMiner外,還提供了智慧人才挖掘系統(tǒng)。同樣是利用數(shù)據挖掘技術,在學術社交網絡中進行語義抽取和隱含關聯(lián)關系挖掘,最終把匹配結果呈現(xiàn)給用戶。
通過數(shù)據挖掘技術,智譜.AI提供了以開放合作的態(tài)度與行業(yè)研究機構共建領域知識圖譜服務。以平臺億級數(shù)據及技術趨勢分析等工具為客觀依據,百余位行業(yè)專家主導,提供全面深入的行業(yè)發(fā)展、前沿技術、人才狀況、競爭關系、投融資等分析報告。
知識圖譜是一種新型的知識庫技術,即利用語義檢索來獲取結果。相較于以往的關鍵字檢索,語義檢索的結果更符合使用者的預期。知識圖譜除了顯示其他網站的鏈接列表,還提供結構化及詳細的關于主題的信息。其目標是,用戶將能夠使用此功能提供的信息來解決他們查詢的問題,而不必導航到其他網站并自己匯總信息。
谷歌于2012年開始使用這項技術,其語義網絡包含超過570億個對象,超過18億個介紹,這些不同的對象之間有鏈接關系,用來理解搜索關鍵詞的含義。知識圖譜是唐杰的老本行了,他在采訪中說到:“我們最近和美團合作做了食品的知識圖譜,還有我們馬上將開啟的石油的知識圖譜等。這里知識圖譜會面向各個領域,越做越大,隨后我們希望能把所有這些知識圖譜連接起來,構建一個非常大的常識知識圖譜?!?/p>
參考文獻:
Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, and Zhong Su. ArnetMiner: Extraction and Mining of Academic Social Networks. In Proceedings of the Fourteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD'2008). pp.990-998.