在數(shù)字化革命過程中,電子郵件成為最普遍、最強大的通信工具之一。試圖通過電子郵件偽裝成合法的人或機構來欺騙用戶變得十分普遍,以至于它有了自己的名字:網(wǎng)絡釣魚(phishing)。
如今,隨著數(shù)字世界與我們的工作和個人生活深度交織在一起,網(wǎng)絡釣魚仍然是 2021 勒索軟件事件的前三大誘因之一,其復雜度和規(guī)模都在增長。隨著網(wǎng)絡釣魚造成的損失持續(xù)增加,風險也隨之會增加。
如今的網(wǎng)絡釣魚
大多數(shù)的釣魚網(wǎng)絡安全防御結合了基于規(guī)則的電子郵件過濾器和人員培訓來檢測欺詐電子郵件。當過濾器失效時,盡管經(jīng)過培訓加強了對可疑電子郵件的檢測,但是人員仍然也會面臨同樣的風險。
只需一次人為錯誤,企業(yè)就可能蒙受數(shù)百萬美元的損失,并需要時間來解決問題。為了減少違規(guī)行為,至關重要的就是杜絕網(wǎng)絡釣魚進入任何收件箱。
目前,基于規(guī)則的系統(tǒng)在他們看來是有限的。他們只能“看到”已知的問題,而欺詐者通常比這些系統(tǒng)領先一步。捕捉這些問題的過濾器只有在發(fā)現(xiàn)漏洞和弱點之后才能改進,這為時已晚。
為了提前解決網(wǎng)絡釣魚問題,機器必須能夠預測弱點,而不是成為弱點的犧牲品,并開發(fā)增強的情感分析,以跟上甚至比欺詐者先走一步。
基于 NVIDIA Morpheus 的網(wǎng)絡釣魚檢測
NVIDIA Morpheus 是一個開放的人工智能框架,用于實現(xiàn)網(wǎng)絡安全特定的推理管道,現(xiàn)可從 NVIDIA NGC 和 NVIDIA/Morpheus GitHub repo 下載。
通過 NVIDIA Morpheus ,我們的網(wǎng)絡安全團隊應用了一種流行的人工智能技術 - 自然語言處理(NLP),從而創(chuàng)建了一個網(wǎng)絡釣魚檢測應用程序,該應用程序能夠以 99% 以上的準確率對網(wǎng)絡釣魚電子郵件進行正確分類。
使用 Morpheus 管道進行網(wǎng)絡釣魚檢測,您可以使用自己的模型來進一步提高準確性。當您的公司收到新的網(wǎng)絡釣魚郵件時,您可以對模型進行微調(diào),使模型得到持續(xù)改進。
因為 Morpheus 支持大規(guī)模的無監(jiān)督學習,所以您并不必依賴基于規(guī)則的方法來檢測網(wǎng)絡釣魚行為,也不需要這些方法所需的 URL 或可疑的電子郵件地址。相反,Morpheus 從接收到的電子郵件中學習,使其成為管理網(wǎng)絡釣魚檢測的更全面、可持續(xù)的方法。
方法
網(wǎng)絡安全團隊遵循典型人工智能工作流程的前三個步驟來開發(fā)網(wǎng)絡釣魚檢測概念驗證(POC):
數(shù)據(jù)準備
人工智能建模
模擬與測試
通過使用預訓練的模型,他們能夠快速執(zhí)行。我們將逐步執(zhí)行每個步驟,深入了解網(wǎng)絡安全團隊是如何進行開發(fā)的。
數(shù)據(jù)準備
要開發(fā)人工智能模型,必須使用預先存在的相關數(shù)據(jù)對其進行訓練。通常,大部分開發(fā)時間都集中在處理數(shù)據(jù)集上,使其可用于訓練中的模型進行分析。
在這種情況下,該團隊采用了現(xiàn)存的、公開來源的英語網(wǎng)絡釣魚數(shù)據(jù)集,并進行重新調(diào)整以符合概念驗證的需求,從而顯著加快了開發(fā)進程。
概念驗證需要大量良性和欺詐電子郵件數(shù)據(jù)集,以供網(wǎng)絡釣魚模型進行訓練。該團隊從 SPAM_ASSASSIN 數(shù)據(jù)集 開始,該數(shù)據(jù)集包含一個預先存在的電子郵件數(shù)據(jù)組合,標記為 phishing (網(wǎng)絡釣魚)、hard ham(不易識別的正常郵件)和 easy ham (容易識別的正常郵件)。ham 類是各種復雜的良性電子郵件。出于我們的目的,我們將分類簡化為 benign (良性)和 phishing (網(wǎng)絡釣魚),將 hard ham 和 easy ham 分類的電子郵件合并為一個良性類別。
雖然 SPAM_Assassin 數(shù)據(jù)集是一個有用的起點,但該模型需要更多的訓練數(shù)據(jù)。該團隊將 Enron Emails 數(shù)據(jù)集作為良性數(shù)據(jù)源,Clair 數(shù)據(jù)集 的網(wǎng)絡釣魚類作為網(wǎng)絡釣魚數(shù)據(jù)源。該模型在這些數(shù)據(jù)集的各種組合上進行了訓練和評估。
ML 建模
ML(機器學習)開發(fā)的核心是使用數(shù)據(jù)對模型進行培訓和評估,模型最終學會自己執(zhí)行所需的功能。
該團隊沒有從頭開始創(chuàng)建一個新的人工智能模型,而是選擇了一個預訓練的 BERT 模型作為改進 POC 的人工智能模型。BERT 是一個面向 NLP 的開源機器學習框架。BERT 旨在通過使用周圍的文本建立上下文來幫助計算機理解文本中模糊語言的含義。
該團隊通過使用早期數(shù)據(jù)集對現(xiàn)有的網(wǎng)絡釣魚檢測模型進行培訓和評估,并對其進行了微調(diào)。
模擬與測試
這是對模型進行測試、評估和訓練以實現(xiàn)網(wǎng)絡釣魚檢測目的的階段。
SPAM_Assassin、Clair 和 Enron 數(shù)據(jù)集都被隨機分成訓練集和驗證集。然后,對 BERT 模型進行訓練,將來自不同組合的郵件分類為良性郵件或網(wǎng)絡釣魚郵件。當使用一個混合了 Enron、Clair 和 SPAM_Assassin 的驗證數(shù)據(jù)集對改進后的 BERT 模型進行測試時,該模型在根據(jù)郵件分類解析電子郵件方面的準確率再次達到 99.68%。
我們的測試表明,在驗證數(shù)據(jù)集上使用經(jīng)過訓練的 BERT 模型檢測網(wǎng)絡釣魚或良性電子郵件方面的準確率超過 99%。
總結
人工智能可以在解決組織每天面臨的網(wǎng)絡安全問題方面發(fā)揮重要作用,但許多組織對在其組織中發(fā)展人工智能感到害怕。
NVIDIA 正在使人工智能大眾化,使其在任何用例中都能簡單而高效的為任何企業(yè)所開發(fā)。該 POC 就是這樣一個示例, 展示 NVIDIA Morpheus 中的可用資源是如何為期望增強其網(wǎng)絡安全武器庫的企業(yè)開發(fā)者縮短和簡化人工智能應用程序開發(fā)的。
為了進一步加快企業(yè)的網(wǎng)絡安全,請使用 NVIDIA Morpheus 提供的預訓練網(wǎng)絡釣魚模型。NVIDIA Morpheus 人工智能網(wǎng)絡安全框架不僅展示了應用人工智能解決網(wǎng)絡安全威脅的變革能力,而且還使組織能夠輕松地將人工智能與前面描述的開發(fā)周期相結合。隨著更多的數(shù)據(jù)來訓練模型,它將變得更加強大。
Morpheus 是一個開放的人工智能框架,供開發(fā)者實現(xiàn)網(wǎng)絡安全特定的推理管道。Morpheus 為安全開發(fā)者和數(shù)據(jù)科學家提供了一個簡單的接口,用以創(chuàng)建和部署端到端管道,使其可以解決網(wǎng)絡安全、信息安全和通用基于日志管道的問題。本系列重點介紹 Morpheus 與各種技術網(wǎng)絡安全戰(zhàn)略相關的用例和實現(xiàn)。
-
NVIDIA
+關注
關注
14文章
5308瀏覽量
106346 -
網(wǎng)絡安全
+關注
關注
11文章
3339瀏覽量
61449 -
人工智能
+關注
關注
1806文章
49008瀏覽量
249311
發(fā)布評論請先 登錄
NVIDIA將為每家AI工廠提供網(wǎng)絡安全

智慧路燈網(wǎng)絡安全入侵監(jiān)測
Lansweeper:強化網(wǎng)絡安全與資產(chǎn)管理
NVIDIA網(wǎng)絡安全AI平臺助力保護關鍵基礎設施
探索國產(chǎn)網(wǎng)絡安全整機,共筑5G時代網(wǎng)絡安全防護線
NVIDIA推出DRIVE AI安全檢測實驗室
NVIDIA DRIVE Hyperion平臺通過汽車功能安全和網(wǎng)絡安全認證
智能網(wǎng)聯(lián)汽車網(wǎng)絡安全開發(fā)解決方案

NVIDIA推出適用于網(wǎng)絡安全的NIM Blueprint
常見的網(wǎng)絡硬件設備有哪些?國產(chǎn)網(wǎng)絡安全主板提供穩(wěn)定的硬件支持
國產(chǎn)網(wǎng)絡安全主板在防御網(wǎng)絡攻擊中的實際應用
如何利用IP查詢技術保護網(wǎng)絡安全?
IP風險畫像如何維護網(wǎng)絡安全
網(wǎng)絡安全技術商CrowdStrike與英偉達合作

評論