近日,有數據挖掘領域“奧運會”之稱的KDD Cup 2018比賽結果出爐。今年共有4179支隊伍報名參賽,支付寶DeepX首次參賽即脫穎而出,最終斬獲兩項大獎。
作為全球數據挖掘領域最有影響力的賽事,KDD Cup比賽由ACM協(xié)會的國際頂級會議SIGKDD舉辦,自1997年以來每年舉辦一次。賽事一直以來都強調在實際場景中的應用性,每年都會圍繞復雜難解決的現實問題出賽題,今年主辦方提供中國北京和英國倫敦的天氣數據,比賽選手需要以此來“預測未來48小時內PM2.5\PM10\O3濃度”,賽題本身對應對惡劣環(huán)境、改善人類生存有著重要意義。
比別人晚了一個月參賽,數據缺失
作為大數據領域的國際頂級賽事,KDD CUP每年都會吸引世界數據挖掘界的頂尖學者、工程師前來參賽。此次參賽的Deep X成員,全部來自于保護支付寶6.5億用戶賬戶資金安全的,安全風控引擎研發(fā)及運營團隊,由風險與決策中心總經理趙聞飆帶隊,資深數據技術專家茂深、數據工程師昌華、兩位90后算法工程師鯤中、崔世文組隊而成。
不得不提的是,此次賽事從3月中旬開賽至5月底結束,支付寶Deep X則整整晚了一個月才參加比賽。”一共2個多月的比賽時間,我們是臨時決定參賽的,比別人晚了1個月參加。因此數據都遺漏一個月。”
茂深說,更不容易的是,團隊成員都是利用休息時間來完成賽事,“風險與決策中心的每一名同學都很忙碌,工作到九十點是家常便飯,大家利用自己的休息時間參加比賽,沒有熱情的話,根本堅持不下來。”
然而值得肯定的是,即便每天只能擠出2小時參賽,比別人缺失了整整1個月的時間,同時中間還遇到了數據突然波動異常,面對陌生而復雜的系統(tǒng)算法模型等諸多挑戰(zhàn),Deep X團隊依然憑借自己的熱情和扎實的數據挖局技術,斬獲了KDD CUP的兩項大獎。
支付寶交易風控識別,比預測天氣更難
如此忙碌之下,支付寶風控團隊為何還要參加KDD CUP大賽?
作為支付寶第五代風控引擎研發(fā)總指揮趙聞飚認為,和世界技術高手較量、溝通是未來走向全球的關鍵一步。霧霾問題和金融風險識別面對的難題從AI建模角度看是相通的,都是在通過機器學習算法來學習歷史數據,在訓練一個分類模型后對未來的現象做預測,而且都面臨著預測事件的特征與歷史訓練數據中事件的特征不太一致的變數。
區(qū)別的地方是,這種要預測未來模式的變化在霧霾問題中是自然發(fā)生的,而在風控中因為有黑產對抗,使得預測的難度更大。進一步的,作為一個金融安全服務系統(tǒng),“我們需要對風險判斷后的決策做優(yōu)化。這是一個多目標優(yōu)化問題,不存在單一最優(yōu)解,使得解空間可能非常復雜和龐大,高效率而精確的求解極為困難。”茂深說。
作為一款國民級的App,支付寶依靠其高穩(wěn)定的安全性以及一年最高保障百萬的賬戶安全險,讓用戶們更愿意把“身家性命”都放在了支付寶里。 茂深表示,支付寶安全是底線,通過算法、機器學習的不斷深度發(fā)展,支付寶的被盜、欺詐識別能力將更加精準,而如何提升識別率、降低用戶打擾率,追求安全的極致體驗,始終是支付寶追求的重要安全課題。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。