跳到主要內容區

深度學習訓練集資料之汙染清除機制

 

技術名稱

深度學習訓練集資料之汙染清除機制

技術摘要

在近幾年內,隨著深度學習快速進步,許多領域都使用深度學習來幫助解決各種問題,包涵異常偵測、分類、分群與預測等等,深度學習在這之中取得了非常好的成果。然而在其光鮮亮麗的背後,隱含著被攻擊者惡意操作與控制的風險。在機器學習上,資料集是成就良好表現的重要原因之一,使用者在收集資料上卻往往無法保證其是安全無虞的,使用者可能從來路不明的網站來原下載資料,或者是從群眾募集的方式獲得惡意資料,導致資料集被惡意的感染,所謂的感染攻擊便是針對訓練集資料進行操作的攻擊。本研究以深度學習上的感染攻擊為主要對象,針對資料集提出一資料清洗方法,能夠將帶有惡意的操作訊號消除,減緩甚至無效化攻擊者對資料影響。

現有技術描述、現有技術問題及其缺陷描述

  1. 由於非深層神經網路是一次以所有資料進行模型最佳化,而神經網路是小批次輸入更新,在演算法的核心想法不同,針對非深層神經網路之防護無法直接套用。
  2. 相關研究以分群演算法進行異常偵測,或者以準確率之度量進行判定,然而防護所針對的攻擊較為簡單,如標籤反轉,較缺乏對於新興攻擊演算法之防護。

本技術發明目的、所欲解決之問題、能提昇的功效

  1. 清洗資料集裡面的所有資料,進而去除攻擊者對資料的惡意操作訊號。
  2. 針對一般正常的資料在清洗後不會有多餘的影響,然而對惡意的資料能夠有效的改善。
  3. 清洗不針對單一的攻擊演算法或者深度學模型架構,能夠得到廣泛且一般的應用,在面對未知攻擊下,也能夠具有一定成效。

適用產業類別

  1. 智慧停車場之車牌辨識系統
  2. 門禁之人臉辨識系統

聯絡窗口

單位名稱:產學創新總中心

聯絡人:黃意婷

電話:06-2360524133

電子郵件:clairehu@mail.ncku.edu.tw

圖片

F001  圖片資料之資料清洗概念圖

F002  圖片資料之資料清洗效果

瀏覽數: