盛大文學問鼎國際數(shù)據(jù)挖掘競賽
-
用微信掃描二維碼
- +1 你贊過了
用微信掃描二維碼
【天極網(wǎng)數(shù)碼頻道】數(shù)據(jù)挖掘技術(shù)誰最強?首次在中國大陸舉辦的CMKI CUP(國際數(shù)據(jù)挖掘競賽)日前閉幕,盛大文學力克ebay等等國際強勁對手,以優(yōu)異成績摘得本次競賽的桂冠。這不僅顯示了盛大文學在用戶需求挖掘方面的實力,也代表了 “大數(shù)據(jù)”時代,中國在數(shù)據(jù)挖掘和信息檢索方面的國際領(lǐng)先地位。
數(shù)據(jù)挖掘技術(shù)誰最強?首次在中國大陸舉辦的CMKI CUP(國際數(shù)據(jù)挖掘競賽)日前閉幕,盛大文學力克ebay等等國際強勁對手,以優(yōu)異成績摘得本次競賽的桂冠。這不僅顯示了盛大文學在用戶需求挖掘方面的實力,也代表了 “大數(shù)據(jù)”時代,中國在數(shù)據(jù)挖掘和信息檢索方面的國際領(lǐng)先地位。
CIKM的全稱是International Conference on Information and Knowledge Management,是信息檢索和知識管理領(lǐng)域的國際著名學術(shù)會議,堪稱數(shù)據(jù)挖掘和信息檢索方面技術(shù)的“奧林匹克”,今年首次在中國大陸舉行,會議邀請到了Google的大神級人物Jeff Dean、微軟的執(zhí)行副總裁陸奇博士和德國Max Planck Institute for Informatics的Gerhard Weikum教授擔任主講人,盛況空前。
由盛大文學首席數(shù)據(jù)官陳運文博士帶領(lǐng)的“TOPdata”團隊,占據(jù)主場之利與全世界的數(shù)據(jù)挖掘科學家們一較高下——競賽的目標是通過機器學習技術(shù)來識別用戶查詢意圖(Query Intent Detection,QID)。主辦方聯(lián)合了百度公司,提供了百度線上的6千余萬行用戶的真實查詢?nèi)罩竞忘c擊行為數(shù)據(jù),要求參賽隊伍根據(jù)用戶的行為數(shù)據(jù),設(shè)計算法來自動判讀出用戶的需求意圖。例如當用戶在搜索“北京上海”時,同時還在查詢“上海 天氣”、“高鐵車票”等信息時,計算機要能聰明地判斷出用戶的需求是“從北京到上海的出行”并返回相對應的各類高價值的信息。參賽隊伍所開發(fā)的系統(tǒng),對用戶意圖的識別既要全面又要準確。比賽一共吸引了全球遍布學術(shù)界和企業(yè)界的520支隊伍參賽,盛大文學代表隊所設(shè)計的算法,通過周密的用戶行為特征分析,和多個機器學習算法的訓練和融合技術(shù),在比賽中不斷超越,最終以優(yōu)異的成績一舉奪魁。
據(jù)悉,參加此次競賽的盛大文學數(shù)據(jù)團隊承擔了全公司大數(shù)據(jù)相關(guān)系統(tǒng)的研發(fā)工作,負責從海量的文學作品和用戶數(shù)據(jù)中挖掘高價值的內(nèi)容,不但讀者們提供高質(zhì)量的各類服務(wù),也為文學作品版權(quán)的衍生如影視劇改編、游戲改編等業(yè)務(wù)提供了大量的數(shù)據(jù)指導和幫助!笆⒋笪膶W是全球最大的社區(qū)驅(qū)動型網(wǎng)絡(luò)文學平臺,在我們首創(chuàng)的網(wǎng)絡(luò)文學模式下創(chuàng)造出來的內(nèi)容,天生就帶來了完整的覆蓋了內(nèi)容、社區(qū)、流量、用戶屬性和用戶行為等全方位的海量數(shù)據(jù)”,陳運文表示:“我們的團隊就是在這樣的‘數(shù)據(jù)海洋’中天天鍛煉,拿世界冠軍,舍我其誰?!”
佚名
最新資訊
熱門視頻
新品評測
用微信掃描二維碼