- Archives
- 2023
淺談隱私計算
隨着人工智能和雲計算的興起,越來越多的應用場景緻力於提供智能化。在實現智能化的過程中,數據是機器學習的核心元素,只有通過對大量的數據進行訓練,才能提高訓練結果的準確性。然而,數據往往包含用戶的隱私。當未加密的數據被黑客獲得時,其所包含的各種敏感資料也將直接暴露給黑客。近年來,隨着隱私泄漏事件的增加,隱私保護和數據安全已經成爲人工智能在實際應用中的關鍵。
針對該問題,人們首先想到的是,對數據進行加密。然而,在執行機器學習算法的過程中,我們不僅需要保護數據,還需要對加密後的數據進行計算。因此,一些密碼學算法(比如DES,AES, 哈希算法等),雖可用於保護數據的機密性,但並不能滿足雲計算和機器學習的計算需求。爲此,人們提出了隱私保護計算技術(簡稱隱私計算)。
目前,用於實現隱私計算的密碼學算法主要有:安全多方計算(Secure Muti-party Computation,MPC)、秘密分享(Secret Sharing,SS)、不經意傳輸(Oblivious Transfer, OT)、同態加密(Homomorphic Encryption,HE)、函數加密(Functional Encryption,FE)等。其中,MPC具備去中心化,輸入數據安全,計算結果準確的優勢,即它可以保證多個參與方在共同計算後,既可以獲得正確的計算結果,也避免了向其他參與方洩露隱私訊息。因此,MPC主要用於聯合數據分析和查詢的場景。通常,SS和OT是構造MPC的輔助算法。HE支持使用者對密文數據進行加法乘法運算後,解密得到的結果(幾乎)等同於使用者對明文數據進行相同的處理。因此,在機器學習訓練的過程中,客戶端只需將加密後的數據發送給雲服務器。這樣,客戶端既可以應用雲服務器的計算力訓練模型,又不用暴露數據。FE不僅允許使用者對密文進行選擇性的計算(比如計算數據的平均值),而且支持訪問控制(即只有具備對應身份/屬性的使用者才能對密文進行運算)。除了人工智能和雲計算外,MPC、HE和FE在醫院、銀行、區塊鏈等場景都有落地應用。
LSCM – Cailing Cai