本文概略介紹虛擬綁架的構成元素,以及駭客如何運用社交工程手法、AI 聲音模仿工具和 ChatGPT 來從事虛擬綁架。
新技術的發明通常是為了提高生產力、效率及改善我們的生活,例如人工智慧 (AI) 和機器學習 (ML),只可惜,網路駭客同樣也會想盡辦法利用這些技術來獲取不法利益。最近,駭客在攻擊和詐騙中使用了 AI 技術來逼真地模仿人類。
近來 AI 技術遭駭客利用的案例越來越多,本月稍早,美國聯邦調查局 (FBI) 才警告民眾要小心網路駭客利用深偽 (deepfake) 技術來篡改照片和影片以從事色情勒索,因為這類犯罪獲利驚人。根據美國聯邦貿易委員會 (FTC) 的數字,假冒身分的詐騙是 2022 年通報損失第二高的詐騙,高達 26 億美元。
這類假冒身分的詐騙使用了 AI 生成的偽造音檔 (也就是深偽語音),通常駭客只需從公開來源內容當中擷取少量的個人特徵資訊就能生成這類音檔,這些來源包括:TikTok、Facebook、Instagram、其他平台以及政府的入口網站。駭客可利用像 VoiceLab 這樣的 AI 工具來擷取個人聲音的特徵,就能產生與本人非常相似的深偽語音 (又稱為「聲音模仿」),然後用於勒索、恐嚇與詐騙。
有能力製作深偽語音的駭客,會使用一段有人在哭泣、尖叫,或極度悲傷的現成對白作為輸入 (例如電影對白),然後用 AI 讓對白中的聲音聽起來好像某人小孩的聲音。接著,駭客就拿著這段深偽語音來向受害者證明其小孩在他們手裡,藉此逼迫受害者匯一大筆贖金給他們。
本文概略介紹虛擬綁架的構成元素,以及駭客如何運用社交工程手法、AI 聲音模仿工具和 ChatGPT 來從事虛擬綁架。
AI換臉詐騙虛擬綁架的真實案例
2023 年 4 月,美國亞利桑那州一位名叫「Jennifer DeStefano」的婦女向警方報案表示收到一通匿名電話,對方說他已經綁架了她 15 歲的女兒,並要求 1 百萬美元的贖金。如果不付錢,她的小孩就會被餵毒並強暴。
根據 DeStefano 表示,她清楚聽到背景有她女兒在哭泣、叫喊、求饒的聲音,但來電者卻拒絕讓她跟女兒講話。
經過幾分鐘的討價還價之後,贖金降到了 5 萬美元。所幸,受害者在支付贖金之前就已經確認她女兒非常平安,沒有被人綁架。而她也立刻向警方報案,警方確認這通電話只是一般常見的詐騙。
虛擬綁架是一種新興的網路犯罪,專門利用 AI 技術來影響人們的判斷。駭客會利用 AI 來製造一些負面刺激以便操控人們的情緒,並從中獲利。在前述的虛擬綁架真實案例中,駭客想要利用的就是小孩被綁架對受害者所帶來的折磨和痛苦,好讓他們支付贖金。
為了更進一步強化受害者的絕望與恐懼,駭客還可能使用 SIM 卡挾持手法,這是一種盜取受害者手機電話號碼並將所有來電和資料轉向駭客控制裝置的伎倆。SIM 卡被挾持的電話號碼將無法傳送監測資料給資安系統,也無法接聽電話或接收訊息。當虛擬綁架集團使用這種伎倆時,被虛擬綁架的人將無法接到電話或收到訊息,進而提高了勒贖成功的機率。
虛擬綁架攻擊的元素
年輕人與公眾人物向來是新興技術與最新社群平台的早期採用者,因此更容易遇到生物特徵被駭客用於虛擬綁架的情況。社群網站 (如 TikTok、Facebook、Instagram) 讓網路駭客更方便尋找受害者,並取得針對性的背景資訊來讓詐騙盡可能逼真。
虛擬綁架基本上是利用虛假資訊來欺騙受害者好讓他們支付贖金的一種詐騙行動。被這伎倆所騙的受害者,不僅將損失錢財,更會遭受極大的情緒打擊。就算受害者很快就識破詐騙所以並未支付贖金,但曾經一度以為自己的孩子真的被人綁架 (不論贖金多寡),都會讓家長心有餘悸。但不幸的是,虛擬綁架集團有無限多的受害對象可攻擊並帶給他們極大的痛苦,而且駭客只需偶爾成功一次就能賺到不少錢。
虛擬綁架基本上包含以下幾項元素:
- 尋找潛在受害者 (被綁架者的親屬)。這是一名有能力支付贖金的人,在前述的真實案例中就是 DeStefano 太太。
- 尋找潛在的虛擬綁架對象 (被綁架者)。在前述真實案例中就是 15 歲的女兒。
- 編造一個故事。故事的情節越揪心,受害者的判斷力和思考能力就越弱。當一個人在陷入恐懼的下很容易不假思索就立即行動。
- 從被綁架者的社群媒體貼文蒐集聲音特徵。駭客還會從恐怖電影中的綁架場面擷取演員的聲音,然後用深偽技術將演員的聲音換成被綁架者的聲音,聽起來就好像是被綁架者在說這段電影台詞一樣。
- 算好適當時間與距離。駭客會根據受害者在社群媒體上的更新貼文,算好「被綁架者」與「被勒索者」相隔兩地很長一段時間之後才下手。這樣一來,被勒索者就無法很快確認自己的小孩是否平安,進而增加成功拿到贖金的機率。
- 打電話給受害者。駭客可能使用免費的變聲軟體讓他們的聲音聽起來更嚇人或更有恫嚇感。通話過程中,駭客還會播放被綁架者的深偽語音,讓綁架看起來更真實,藉此達到勒索的目的。
- 得逞之後。包括 (但不限於) 透過洗錢方式將贖金處理乾淨、刪除所有相關檔案,以及拋棄所有一次性手機 (俗稱王八機)。
除了洗錢之外,虛擬綁架的其他步驟都不需要太多的知識和實質技能。他們可利用廣告數據分析從大量人口當中找出一些常見的行為元素,然後再根據想要的行為元素篩選出想要的對象。這種將目標分類和評分的方法可以讓駭客提高攻擊效率,而且虛擬綁架的大部分工作都能進一步透過 AI 工具來加以自動化,例如:ChatGPT。
將 AI 聊天工具用於虛擬綁架詐騙
除了 AI 聲音模仿工具之外,還有另一種 AI 工具,也就是自然語言處理聊天機器人 (如 ChatGPT),可以用來彌補駭客在技能上的不足,並加快攻擊程序當中一些原本手動又耗時的流程。例如在尋找受害者時,需要過濾大量的受害者資料。使用 ChatGPT,駭客就能將大量的潛在受害者資料與聲音和影片資訊結合,也可以再結合其他訊號資料,例如透過 API 取得地理定位資訊。這些資料會傳送到 ChatGPT,然後再傳送到目標。駭客會收到目標的回應,接著駭客再將經過 ChatGPT 修改後的回應傳送給目標。廣告數據分析可以透過各種公開來源取得,還可根據潛在的獲利和支付贖金的可能性進一步過濾並排列優先次序。如此就變成了一種根據風險評分來篩選受害者的系統,既可提高攻擊的獲利,又可擴大現有規模。
假使駭客未來 (或目前) 能投入足夠的研究經費,他們甚至可以使用文字轉語音軟體來將 ChatGPT 的文字轉換成音訊檔。這樣一來,駭客和虛擬綁架的被綁架者就全部變成虛擬化。若再透過大宗電話撥打服務來散播這些虛擬檔案,那麼虛擬綁架將變得更有效率、範圍也更廣。
社交工程升級:AI助攻虛擬綁架,防不勝防
虛擬綁架的元素與社群網路分析與傾向 (SNAP) 模型很像。SNAP 會試圖預測社群網路中的人們最可能採取的步驟和行動,例如,SNAP 可產生一份報告來預測哪些人最可能購買某種商品或服務,然後運用這份報告來銷售社群媒體廣告服務以增加公司的銷售業績或利潤。
SNAP 是一種可大量自動化和擴大規模的方法,這方法可將內容 (社群媒體廣告) 透過文情並茂又有美感的貼文提供給目標 (有購買能力又最可能購買某公司產品或服務的人),這通常是經由漂亮或相關的名人或影響力人士來代言以刺激消費者採取行動 (購買產品)。以上這些步驟與虛擬綁架詐騙基本上很像,只不過「購買力」變成了「支付贖金的能力」,而「美感」元素則換成了「恐懼」元素,例如:尖叫、威脅、透過變聲軟體來製造恫嚇感。
未來,駭客可能將受害者傾向分析模型用於建立龐大的潛在受害者名單。此外,模型還能讓詐騙集團透過亂槍打鳥的電訪來擴大規模並將攻擊自動化,這就好像有些企業會亂槍打鳥打電話尋找潛在買家一樣。還有,駭客可能將其部分的營運外包,例如在提供多樣化商品的暗網上購買現成的 SIM 卡挾持漏洞攻擊手法、已經蒐集好的外洩登入憑證,以及錢騾 (money mule) 服務。
虛擬綁架可被視為一種使用 AI 武器的詐騙,其元素與一般正常的行銷手法以及網路釣魚詐騙類似。這是一種新興的 AI 情緒勒索詐騙,而且將會經歷類似我們過去和現在看到的勒索病毒攻擊的演進過程。虛擬綁架詐騙使用的是聲音和影片檔來恐嚇受害者,而這些檔案通常不會被資安軟體攔下來檢查。
不過,隨著「資料情境感應網路」在未來變得更加精良,資安工具也許很快就能取得多種監測資料並將「訊號」套用至這些高情境 (high-context) 的濫用。值得注意的是,「資料情境感應」意味著決策的依據是根據資料之間的關係,而非單純根據單一數值來觸發。
例如,多層式的身分感應系統也許可以判斷虛擬綁架的被綁架人是否正在移動手機 (透過手機上的加速感測器來偵測) 或是在正常使用手機 (如果真的被綁架了應該就不能這麼做)。
結論與資安建議
如同任何其他勒索詐騙一樣,如果受害者支付了贖金,就等於變相鼓勵駭客繼續詐騙其他受害者。不僅如此,一旦受害者支付了贖金,他們就會被加入「肥羊」名單,讓後再被賣給其他駭客集團使用。很不幸地,這將導致受害者不斷遇到其他網路攻擊。
隨著虛擬詐騙變得越來越普遍,一些使用傳統勒贖技巧的網路犯罪 (如勒索病毒攻擊) 也將開始使用更不容易被攔截的通訊管道,例如語音和視訊,甚至是新的環境,例如元宇宙 (metaverse)。
由於這些高情境通訊管道與環境都牽涉到一定程度的抽象化,因此超越了一般「路由器」層次資安解決方案能夠處理的範疇,所以,身分感應的反詐騙技巧將越來越重要。當虛擬綁架的案例越來越多時,資安監測資料的也會跟著增加,這些資料就能用來改善資安數據分析,然後再應用到具備身分感應的資安感測器上。
作者:Craig Gibson 與 Josiah Hagen