參賽隊伍
已結束
近年來,新聞媒體及社群網路平台的資訊傳播速度越來越快,這也導致假資訊的問題越來越嚴重,混淆民眾的判斷。然而,目前絕大多數針對假資訊的處理都是基於人工辨識,驗證假資訊的過程繁複且耗時,往往跟不上假資訊的產生速度,如果能將驗證資訊的過程自動化,就能夠可以大幅降低一般民眾接觸到假資訊的頻率。
在AICUP2023中,本競賽將提供一個事實資料庫以及陳述句 (claim),參賽者需要建立自動化的事實檢索與查核系統,以驗證陳述句的真偽。如果陳述句能夠「支持」或「反對」事實,系統也必須透過檢索資料庫中的文章來提供證據句。需要注意的是,由於事實有可能會隨時間推移而產生變化,參賽者只能使用我們提供的資料庫進行事實驗證。
提供參賽者下載之檔案共分三大類:1. 訓練資料集,包含「中文維基百科資料」與「公開訓練資料集」;2. Public測試資料集;3. Private測試資料集。說明如下:
提交檔案請使用.jsonl檔,檔案中的每一行 (row) 代表一個陳述句的樣本,且每一行必須包含"id"、 "predicted_label" 以及 "predicted_evidence",如以下範例所示:
其中:
上傳預測答案可能分為幾種情況,各自會得到不同的評分結果,如下:
學生組前13名隊伍除獎金獎項外,並將獲頒"教育部獎狀"。Private Score位於排名前25%且成績超過 Baseline (0.375) 之隊伍 (不超過30隊),不限身分依規定繳交報告後經主辦單位之評審委員審定後,將獲頒教育部人工智慧競賽計畫辦公室電子獎狀。
項目 | 時程 | 說明 |
---|---|---|
報名開放時程 | 2023/03/17 – 2023/05/10 | 事實檢索與查核競賽開放報名 |
競賽訓練集Public Training Dataset下載 | 2023/03/17 – 2023/06/02 14:00 PM | 公布競賽訓練資料集 |
競賽測試集Public Testing Dataset下載 | 2023/03/30 11:00 AM – 2023/06/02 14:00 PM | 3/30早上11:00起競賽隊伍可下載競賽測試集Public Testing Dataset,並上傳答案,每一日曆日可上傳之次數上限為3次,此期間,參賽者可獲Public Testing Dataset之評分結果做為參考。 |
競賽測試集Private Testing Dataset下載與預測 | 2023/05/29 11:00 AM – 2023/06/02 14:00 PM |
|
結果發佈 | 2023/06/02 18:00 | 公佈 Private Leaderboard成績 |
上傳報告 | 2023/06/02 – 2023/06/08 23:59 | 優勝隊伍提交預測模型的說明文件、自製之訓練資料集、與程式碼 |
公佈最後名次 | 2023/07/07 | 公布最終排名 |
頒獎典禮 | 2024年初(暫訂第一季) | 頒獎典禮將與初階賽及進階賽一同辦理,細節將另行公佈 |
若對於比賽有任何問題,歡迎在 討論區 提出,或是將問題透過 Email 寄到
ikm.ncku@gmail.com
(比賽內容相關)
t_brain@trendmicro.com
(平台相關)