409

參賽隊伍

總獎金 新台幣 23.00 萬元

玉山人工智慧公開挑戰賽2020夏季賽 - NLP應用挑戰賽

已結束

競賽說明

Gotcha!人人都可以是反洗錢大師!

洗錢是指將犯罪不法所得,以各種手段掩飾、隱匿而使犯罪所得在形式上合法化的行為。近年來因國際洗錢與資助恐怖活動事件頻傳,國內吸金、電信詐騙案件也層出不窮,使得政府與各產業皆致力於洗錢防制(AML)工作。

一般來說,顧客與金融機構往來時,銀行需即時確認顧客身份,透過自動化系統比對出顧客是否列於AML焦點人物名單中。若能透過AI的協助定期更新AML焦點人物名單,並搭配自動化比對,將可大幅降低銀行執行AML作業的人力與時間成本。 

本次競賽將提供參賽者公開新聞資料連結與相對應的焦點人物名單,希望大家集思廣益,透過NLP演算法,精準找出AML相關新聞焦點人物,不僅能協助優化AML焦點人物名單的更新作業,更有機會獲得高額獎金!

競賽將以「模型訓練( 2020/06/01 – 2020/07/22 )」、「線上對決 – 模型準度爭霸戰( 2020/07/22 – 2020/08/07 )」兩階段進行。

「模型訓練」進行方式如下:

  1. 參賽隊伍於T-Brain平台上註冊比賽(請各隊隊長妥善保存收到的手機簡訊驗證碼,將作為模型準度爭霸戰階段使用之驗證資料)
  2. 參賽隊伍於 T-Brain 平台Dataset Download區下載訓練資料集,主辦單位提供新聞連結與該新聞對應的焦點人物名單,參賽隊伍需自行實作爬蟲程式 (Crawler)獲取新聞內文。
  3. 參賽隊伍須加入玉山人工智慧挑戰賽Slack Workspace社群,掌握競賽第一手資訊(請參閱Dataset Download區:Slack Workspace連結)。
  4. 開始模型訓練!
  5. 參賽隊伍須提供RESTful API Server並將模型部署於此API Server,並以API服務形式供「線上對決 – 模型準度爭霸戰」使用(請參閱Dataset Download區:API開發說明文件)。
  6. API測試期間(2020/07/1 - 2020/07/22)請於活動Slack上提供API URL與 E.SUN bot進行API測試。
  7. 需注意,各隊伍最後一次測試成功的URL將自動做為「線上對決 – 模型準度爭霸戰」認定之API Endpoint(請參閱Dataset Download區:API開發說明文件)。

 

「線上對決 – 模型準度爭霸戰」階段進行方式如下:
前置作業:參賽者須將「模型訓練」階段產出之模型打包成API並部署於API Server即完成驗證測試。

  1. 爭霸戰為期九天,包含一天測試賽(2020/07/22),與八天正式賽(2020/07/27 - 2020/07/30及2020/08/03 - 2020/08/06),並將於每天的18:00舉行。測試賽會提供分數但不計入最終計分。
  2. 主辦單位將會使用HTTP Request方式驗證參賽者模型成效,每日多輪提問,每輪一題,提問步驟如下: 
    1. 每輪提問包含一個Health Check API呼叫及一個Inference API呼叫。
    2. 主辦單位將以HTTP POST發送request呼叫參賽者的API Server進行健康狀態檢查(Health Check),當參賽者API Server收到呼叫後請立刻回傳response(Status Code:200)以表示API服務正常,timeout時間為1秒,若API Server未能於1秒內回應,則參賽隊伍之 API server 將被視為無法提供 API 服務。
    3. 主辦單位收到參賽者回傳Health Check response 後,將立即發送第二個HTTP request(POST 方法)提供題目(Inference),參賽者API需回傳模型運算結果,timeout時間為5秒。題目與回傳的資料格式請詳見Dataset Download區:API開發說明文件。
    4. 若參賽者API Server無回應,主辦方會嘗試重新呼叫,每輪健康狀態檢查與提供題目皆最多呼叫3次,若皆無回應或逾時則該輪以0分計算。需注意,若健康狀態檢查失敗則不會提供題目,該輪直接以0分計算,並繼續下一輪提問。
  3. 將以模型擷取之名單準確度作為積分(詳見下方評分方式),並於每日24:00前於活動Slack(channel # 公告區)公布當日累積積分排名,每日加總後積分為最終排名依據。
  4. 最終名次將於 2020/8/22公布。

下頁面內說明為「Gotcha!我抓得住你 - AML焦點人物辨識」之競賽細節:

 


預測說明

  • 判斷該新聞內文是否含有AML相關焦點人物,並擷取出焦點人物名單(名單有可能為複數或為空)。


報名規範

  1. 參賽隊伍人數1至8人。
  2. 學生(大專以上,含碩博士生)或業界人士皆可報名參加(玉山現職同仁、與玉山有合約合作關係之團隊或個人、趨勢科技公司現職員工除外)。
  3. 報名時每位成員皆須完成手機認證。
  4. 報名截止後,不可再變更團隊成員名單及人數。
  5. 比賽期間,隊伍不可合併與分割。
  6. 參賽者只能加入一個參賽隊伍(主辦單位將不定期檢查參賽者是否有違規加入多個隊伍的情形)。
  7. 「線上對決 – 模型準度爭霸戰」將使用各隊隊長報名時收到之手機驗證碼作為驗證資料,各隊隊長請妥善保管。倘若團隊保管不慎遺失,遭他人使用而影響正式賽成績,主辦單位恕不負責。
  8. 主辦單位保有對報名規範解釋及裁決的權利

報名教學影片


領獎資格與方式

  1. 隊員至少有一半以上(含)須具備中華民國國籍或具備中華民國工作簽證,該隊伍才具領獎資格。
  2. 得獎隊伍除提交結果之外,比賽結束後需提供主辦單位實作程式及相關說明文件供主辦單位審核以決定名次,且同意於頒獎典禮簡報建模手法並接受提問,否則不具領獎資格。
  3. 參賽者如加入多個隊伍,將不具或喪失領獎資格。
  4. 獎金以新台幣匯款方式發放,發放對象僅限於符合報名規範及具領獎資格之隊伍,得獎隊伍應推派有台灣本地新台幣帳戶之隊員代表受領獎金,並以該隊員為台灣稅務申報人。


評分標準

  1. API傳回之答案內容格式需符合比賽格式規定(請參閱Dataset Download區:API開發說明文件)。
  2. 正式賽期間,參賽者須透過API傳回模型結果,由玉山Leaderboard系統進行計分,並每日24:00前於活動Slack(channel # 公告區)公告最新排名。


評分方式

 


競賽規則

  1. 務必使用Machine Learning來進行辨識與分類,禁止使用任何人工標記。
  2. 禁止使用非開源 AutoML 相關之自動建模服務。
  3. 不可私下共享程式及特徵值,但可在官方交流社群討論區公開討論。
  4. 資料集僅限於此次比賽使用,參賽者不得為自己或他人利益而洩漏或交付資料集予非參賽者。如有違反,參賽者應賠償主辦單位因此所生之一切損失(包括但不限於律師費)及相當於賠償金額三倍之懲罰性違約金。
  5. 如有需要,主辦單位有權在比賽途中調整資料集。
  6. 如有下列情事,主辦單位得無需告知參賽者,逕行取消參賽者資格或領獎資格:
    • 已有具體事證,所屬隊伍有任何抄襲及作弊行為。
    • 已有具體事證,所屬隊伍有對Leaderboard系統進行攻擊。
    • 已有具體事證,所屬隊伍影響其他參賽隊伍導致不公平情事發生。
    • 已有具體事證,所屬隊伍違反本比賽活動辦法或「T-Brain AI實戰吧平台服務」參賽者使用條款。
  7. 正式賽比賽期間,主辦單位將會呼叫參賽者API Server,參賽者須確保自身使用API Server之網路連線品質並於規定秒數內回覆,若未在限制時間內回覆,主辦方每輪將會重新呼叫參賽者API Server,最多嘗試呼叫3次,若3次皆無回應或逾時,則該輪以0分計算,並繼續發送下一輪題目。倘有因連線品質因素導致結果回傳失敗,主辦單位恕不負責,亦不會提供再次答題的機會。
  8. 參賽者使用本活動Slack需遵守下列規範,如違反下列規範,主辦單位得無需告知參賽者,逕行取消使用活動Slack之權利:
    • 不得於活動Slack洩漏他人機敏資訊。
    • 不得發表脅迫、不雅、猥褻或挑釁等影響他人觀感之文字。
    • 不得張貼與本次競賽無關、違法或具商業性等不適宜內容。
    • 其他未明列但經他人檢舉,經主辦單位確認其行為明顯不符合本次競賽目的或影響他人參賽權益者,主辦單位有權取消參賽資格。
  9. 主辦單位保有對競賽規則解釋及裁決的權利。


獎項說明

以下獎項列表為「線上對決 – 模型準度爭霸戰」之獎項。

  • 第一名 新台幣 12 萬元 + 獎狀一只 + 獎牌一個
  • 第二名 新台幣 5 萬元 + 獎狀一只 + 獎牌一個
  • 第三名 新台幣 3 萬元 + 獎狀一只 + 獎牌一個
  • 第四名 新台幣 1 萬元 + 獎狀一只 + 獎牌一個
  • 第五名 新台幣 1 萬元 + 獎狀一只 + 獎牌一個
  • 第六名 新台幣 1 萬元 + 獎狀一只 + 獎牌一個
  • 佳作 獎狀一只 + 獎牌一個
  • 佳作 獎狀一只 + 獎牌一個
  • 佳作 獎狀一只 + 獎牌一個
  • 佳作 獎狀一只 + 獎牌一個
備註:除以上獎項外,獲獎之參賽者玉山銀行亦將優先安排面試機會。

獲勝隊伍及名次

排名 隊伍名稱 總積分
1 ML vs ML 2581.4
2 CodeBrain 2579.3
3 blackbox operator 2574.7
4 Alexhsieh53 2574.0
5 2020專題生台科nlp專題生是頭殼版話題高手刷QS專業團隊NLP話題高手台科資工nlp隊 2573.1
6 PlusMinus 2564.7
7 Brainchild 2562.5
8 好想出國玩 2554.4
9 男五舍109室 2553.4
10 Simple baseline 2552.5


競賽時程

項目時程說明
報名06/01/2020 - 06/30/2020
  1. 註冊T-brain帳號。
  2. 報名玉山NLP挑戰賽,並完成手機驗證。
  3. 註冊Slack帳號並加入玉山人工智慧挑戰賽活動Slack Workspace。
取得建模資料集、訓練模型(賽前準備)06/01/2020 - 07/22/2020
  1. 本次建模階段將不提供測試樣本供測試,參賽者可根據自身需要使用訓練資料作為驗證資料集。
  2. 同時完成API開發。
API測試07/01/2020 - 07/22/2020

於活動Slack進行API測試與問題諮詢與討論(請參閱Dataset download區:Slack Workspace連結)。

線上對決 – 模型準度爭霸戰(測試賽)
07/22/2020與正式賽相同形式進行,主辦方呼叫參賽者的HTTP RESTful API Server進行健康狀態檢查(Health Check)並提供題目,以確保正式賽順利進行。測試賽會提供分數但不計入最終計分。
線上對決 – 模型準度爭霸戰(正式賽)

07/27/2020 - 07/30/2020

08/03/2020 - 08/06/2020

  1. 將分為8個工作日(周一到周四),每日於18:00開始呼叫各參賽者的API Server,每日多輪提問,每輪一題。
  2. 每輪提問包含一個Health Check API  呼叫(timeout時間1秒)及一個Inference API呼叫(timeout時間5秒)。若timeout時間過後參賽者的API無回應,主辦方將會嘗試重新呼叫,最多各呼叫3次。若皆無回應或逾時則該輪以0分計算,並繼續發送下一輪題目。
  3. 每日將結算各組成績並於當天24:00前公布於活動Slack(channel # 公告區)。
公布名次
08/12/2020
  1. 將於T-brain平台公布得獎名次。
  2. 前6名得獎隊伍需準備頒獎典禮競賽作法分享投影片與當天報告素材
頒獎典禮08/22/2020
  1. 頒獎典禮詳細資訊後續將再公告於活動Slack(channel # 公告區)。
  2. 前6名得獎者將於頒獎典禮簡報比賽心得與做法。

備註:以上時程皆為UTC+08:00時區。


主辦單位



玉山銀行成立於1992年。以建立制度、培育人才、發展資訊為三大主軸持續在金融圈快速成長。

  • 獨家與PayPal推出提領服務「玉山全球通」
  • 首家與螞蟻金服旗下支付寶推出「手機掃碼付」服務的銀行
  • 亞洲首創AI認知運算結合金融產品銷售諮詢應用
  • 以chatbot合作應用開發成為LINE企業標竿案例且成為Facebook台灣首家導入chatbot應用銀行,榮獲《The Asset》台灣最佳社群體驗銀行大獎肯定
  • 以Amazon Web Service專案榮獲《The Asset》台灣最佳雲端創新專案大獎
  • 連續3年協辦「Google Ignite 數位火星計劃」並高度發展行銷科技,成為Google在金融業的企業標竿案例


Q&A

【報名相關】
Q:我該如何報名這個比賽?
A:可以參考比賽活動辦法中的「報名教學影片」喔!報名截止日為 2020/06/30,及早報名就可以早一點開始訓練模型啦!

Q:報名參賽時設定的隊伍名稱之後可以更改嗎?
A:隊伍名稱設定後就無法更改,所以建議報名的時候隊名就要想好喔!

Q:報名完成後我還可以新增隊員嗎?
A:可以的,登入T-Brain 帳號後,點擊Team Management即可新增調整隊員。提醒參賽者,根據比賽報名規範,每個參賽者只能加入一組隊伍,比賽期間,隊伍不可合併與分割,2020/06/30報名截止後,亦不可再變更團隊成員名單及人數。

【T-Brain 平台相關】
Q:註冊T-Brain 帳號或是操作平台時遇到狀況怎麼辦?
A:請寄信至 T-Brain email 詢問。

【Slack Workspace社群相關】
Q:我一定要加入玉山人工智慧挑戰賽Slack Workspace社群嗎?
A:一定要喔!主辦單位會在活動Slack上公告重要訊息、回答參賽者問題。同時,API URL的驗證,以及正式賽的積分排名公告、查詢都會在活動Slack 上進行。

Q:不知道怎麼加入玉山人工智慧挑戰賽Slack Workspace社群,怎麼辦?
A:請參考比賽活動辦法中的報名教學影片02’12’’處。 請至Data Download區取得連結

Q:無法成功加入Slack Workspace社群,怎麼辦?
A:請寄信至 intelligent-finance@email.esunbank.com.tw 詢問。

Q:我的Slack帳號使用的Email需要跟註冊T-Brain的帳號一樣嗎?
A:可以不一樣喔!

【API相關】
Q:我沒有架設API的經驗怎麼辦?
A:不用擔心!籌備小組貼心準備了 API開發說明文件, 手把手教你怎麼架API,還有提供API的Demo Code,讓沒有經驗的參賽者們都能輕鬆上手架設API。

Q:發送API 指令時,隊長要使用Slack的Email還是T-Brain的Email?
A:請使用T-Brain 註冊的Email。

Q:為什麼申請GCP帳號架Server時,輸入信用卡號?
A:申請 Google Cloud Platform 會請您綁定信用卡,不過 Google 對於新帳號有提供免費試用額度 $300 美金,參賽者若於額度內使用便不會進行扣款, 詳細操作說明請參考 API開發說明文件

Loading . . .