亞馬遜Transcrib可自動編輯可識別個人身份的數據

亞馬遜在其業務轉錄服務中增加了一項針對隱私的新功能,該功能可自動編輯個人可識別信息(PII),例如姓名,社會安全號碼和信用卡憑證。

亞馬遜Transcrib可自動編輯可識別個人身份的數據

亞馬遜 Transcribe是亞馬遜 AWS雲部門的一部分,於2018年全面上市。Transcribe是自動語音識別(ASR)服務,使企業客戶能夠將語音轉換為文本,例如,這可以幫助使音頻內容可從資料庫中搜索到。聯絡中心還可以使用該工具來挖掘呼叫數據以進行見解和情感分析。但是,隱私問題已成為技術公司如何存儲和管理消費者數據的焦點。

亞馬遜Transcrib可自動編輯可識別個人身份的數據

文本語音轉換服務可在以後用於搜索關鍵字和情感,但電話通常會包含重要的私人數據,這些數據可能會被亞馬遜轉錄並存儲在可搜索的資料庫中-即使該信息對於分析而言是不必要的。同時,全球範圍內正在湧現出保護消費者數據的法規,包括最近實施的《加利福尼亞消費者隱私法》(CCPA)和歐洲的《通用數據保護法規》(GDPR)。

亞馬遜Transcrib可自動編輯可識別個人身份的數據

在此背景下,亞馬遜 Transcribe現在將使公司能夠自動編輯個人數據,包括信用卡/借記卡號,有效期,CVV代碼,PIN,社會保險號,銀行帳號,客戶名,電子郵件地址,電話號碼和郵政地址。值得注意的是,Google Cloud Platform提供了防止數據丟失的API,該API可以與其語音轉文本服務結合使用,以識別和編輯敏感數據。但是,直接在亞馬遜 Transcribe中構建自動修訂會簡化該過程的實現。

亞馬遜Transcrib可自動編輯可識別個人身份的數據

使用亞馬遜 Transcribe的公司可以根據需要使用自動修訂,並可以選擇希望混淆的PII元素。然後,轉錄的文本將顯示[PII]標籤來代替敏感信息,並且相應的時間戳意味著具有足夠系統訪問許可權的任何人仍然可以在原始音頻文件中找到所需的PII。如果公司想要執行額外的音頻處理以完全編輯原始記錄中的信息,這也可能很有用。