技術主題

什麼是檔分析?

以問號為重點的 IT 項目圖示

概述

檔分析通過映射其數據位置並確定誰有權訪問哪些數據(包括檔共享、電子郵件資料庫、企業檔同步和共用、記錄管理、企業內容管理、Microsoft SharePoint 和數據存檔)來説明組織解決不斷增長的數據量問題。

檔分析解決方案分析、索引、搜索、跟蹤和報告檔元數據和內容。這使組織能夠查看和組織詳細的元數據和上下文資訊,改進 PII 監督和資訊治理,並更有效地管理非結構化數據。

檔分析解決方案還可以保護非結構化數據。組織可以就內容分析做出更好的決策,同時降低風險並降低與數據相關的成本。這些解決方案有助於確保數據安全、生命週期管理、數據訪問治理、映射和分類,同時實現關鍵數據洞察和分析,從而推動和保護業務。這些關鍵功能可幫助組織解決風險緩解、治理和合規性、效率和優化以及數據洞察方面的數字化轉型用例。

檔分析

為什麼要進行檔分析?

企業在業務轉型方面面臨著越來越大的壓力。無論這一旅程是從加速遷移到雲、支援遠端工作者還是為數據隱私做準備開始,檔分析解決方案都可以幫助優化數據和應用程式,並智慧地識別、保護和分類數據。檔分析解決方案還可以提供跨數據的洞察,以確保合規性並實現更智慧的數據遷移。

檔分析解決方案可以擴展以滿足當今現代工作負載的需求,並確定可以優化和防禦性刪除數據的領域,從而降低成本、提高效率並確保合規性。部署檔分析的專案需要速度來跟上不斷變化的業務環境。速度、規模和快速實現價值對於從這些解決方案中實現價值最大化至關重要。

檔分析解決方案提供對最常見的非結構化數據源(本地或雲中)的訪問,以評估風險、識別敏感和高價值數據,並提供在數據生命週期內保護、保護和管理數據的措施。

檔分析如何説明提高數據效率和優化?

要提高非結構化數據的數據效率和優化,首先要瞭解您擁有哪些數據以及數據存儲在何處。通過數據映射,您可以使用檔分析來識別所有數據的位置,並識別放錯位置、孤立、重複、過時或微不足道的“暗數據”。利用檔分析的專案通過主動刪除或優化對組織沒有價值的數據來提供更快的投資回報。

檔分析如何説明降低風險?

檔分析解決方案通過優化、保護和保護在內容分析階段找到的數據來説明降低數據風險。這包括:

  • 檢測、管理和處理 PII、PCI、PHI 和 IP。
  • 管理資訊流。
  • 處理敏感數據。
  • 提供身份保護、元數據報告、身份訪問許可權、以數據為中心的訪問保護、策略控制和審計跟蹤。

數據優化完成後,任何沒有業務價值的數據都不再佔用數據存儲空間。只有非常有價值並被營業單位積極使用的數據才會保留下來。

瞭解訪問許可權和許可權至關重要。提供修正工具的檔分析解決方案有助於確保在數據處於活動使用狀態時對數據應用適當的控制。一些解決方案包括其他保護,例如能夠在端點加密數據以確保正確使用。最後,正確部署的檔分析解決方案可以防止使用者在不瞭解其業務目的的情況下移動或刪除數據。部署「就地管理」模型的檔分析解決方案可最大程度地降低業務用戶中斷的風險。

檔分析如何説明治理和合規性?

部署檔分析解決方案有助於確保在正確的時間向正確的使用者提供正確的數據。它通過以下方式幫助組織實現其監管、法律和內部治理與合規目標:

  • 提供元數據治理、法律保留、隔離和發現。
  • 優化數據量。
  • 管理適當的許可權。
  • 授予基於角色的訪問許可權。
  • 識別高價值資產。
  • 應用數據生命週期策略。

檔分析如何説明 PII 數據和數據隱私合規?

組織正在競相查找、保護和保護個人數據(包括消費者、公民和員工數據)。這一全球趨勢——包括 GDPR(歐盟)、CCPA(加利福尼亞)、KVKK(土耳其)、PIPEDA(加拿大)和 POPIA(南非)——為檔分析解決方案帶來了新的關注。通過利用內容分析功能和檢測技術,檔分析解決方案是確保合規性和協助回應消費者請求或數據主體訪問請求的理想選擇。

數據隱私準備是檔分析解決方案大放異彩的一個例子。它還強調了需要一個可以輕鬆識別、索引和檢索 PII 文件的過程。

端到端過程應如下所示:

  1. 查找存儲庫並識別檔。
  2. 從檔中提取所有元數據和內容。
  3. 分析特定實體的文件內容和元數據,或根據概念內容對文件進行分類。
  4. 通過根據分析結果應用業務規則來保護數據,以確保適當的訪問級別和敏感數據處理(即加密)。您還可以應用類別或分類來説明管理資產的生命週期。

什麼是檔的分類或分類?

檔分析解決方案使用基於元數據標籤、關鍵字或術語清單的簡單分類方法。某些解決方案利用文件內容的概念分類,並將這些方法與找到的文檔、圖像或數據實體相結合,以提高分類的準確性。其他解決方案通過機器學習和使用範例文件的引導式學習更進一步,使您能夠定義要使用的分類。

例如,包含健康或保險資訊的 Human Resources 文件可以使用基於範例數據的數據分類策略。對於其他元素(例如年齡和位置),您可以應用風險評分和其他許可權來進一步定義策略。

檔分析如何提供數據治理和數據保存?

檔分析解決方案提供了説明組織自動對數據採取行動的功能,以及説明管理和保存數據的豐富工具集。這些解決方案通常包括以下選項,由公司數據治理驅動:

  • 刪除資料。如果不需要保留該檔,請將其刪除。是不是太老了?是重複的嗎?它是否為企業提供了任何價值?消費者是否要求銷毀他或她的數據?檔分析解決方案維護對您所做的事情和原因的審計跟蹤。
  • 保護數據。如果您需要保留數據,請保護它。某些檔案分析解決方案可以更改訪問控制或加密數據。另一種選擇是將其移動到安全的位置,例如記錄管理工具,以便長期保存。
  • 編輯數據。您可能需要保留一些數據,但不需要保留 PII。某些檔案分析解決方案支援編輯以創建不含 PII 內容的原始檔案的乾淨副本。然後,如上所述刪除或保護原始檔。

什麼是「就地管理」?

就地管理是數據生命週期管理和治理的一個關鍵概念。它是元數據(包括位置、許可權和內容)所在的檔分析解決方案“如何”分析元數據(包括位置、許可權和內容)。在分析過程中,實際物件不會被移動、複製或存儲在其他位置或保存區域。

了解實體的語法

兩種基本類型的數據發現語法(規則集)用於描述您嘗試標識的實體:精選實體和使用者生成實體。

語法包括:

  • PII:個人身份資訊,可能因地區而異(包括可能導致誤報的格式)。
  • PHI:個人健康資訊,通常與北美健康行業相關。
  • PCI:個人信用卡資訊。
  • PSI:個人安全資訊,用於帳戶詳細資訊訪問密鑰。

查找用戶無法修改的精選和優化語法。這些語法使用上下文和地標來獲得更準確的結果,並提供“置信度分數”來説明您過濾誤報。上下文和地標可以是短語、單個單詞或單個字元。

上下文是關鍵。使用與候選實體的接近度和上下文強度(基於自然語言處理技術)的檔分析解決方案有助於提高置信度分數。您可以通過利用特定實體、國家或地區的綜合清單來獲得更精細的分數。

調優和靈活性。如果這些語法都不涵蓋您的特定用例,則可以使用允許創建自定義語法的檔分析解決方案。這些語法通常通過使用格式描述性 RegX 或簡單清單來定義。

什麼是誤報?

根據定義,「誤報」是指錯誤地指示存在特定條件或屬性的測試結果1。對於檔分析解決方案,誤報表示在內容分析期間錯誤識別的模式、語法或關鍵字匹配。僅使用模式或關鍵字匹配的檔分析解決方案通常比具有上下文感知內容分析功能的檔分析解決方案具有更高的誤報率。

掃描的文件和錄音

檔分析解決方案可以分析基於文本的文件的風險,但 PII 也可以駐留在其他形式的數據中。對掃描的文件、錄製的對話和視頻會議錄製檔執行檔分析正變得越來越普遍。有些檔分析解決方案可以在應用PII發現技術之前處理這些檔。

以圖像形式存儲的掃描紙質文檔(例如,在 PDF 檔中)應使用光學字元識別 (OCR) 進行處理,以提取文本,理想情況下,提取相關的結構資訊。許多組織將掃描的身份證件記錄在案,例如員工的駕駛執照或護照。

支援分析音訊或視頻記錄的檔分析解決方案需要由語音轉文本引擎進行處理,該引擎可以創建用於分析的書面成績單。

上下文、AI 驅動的內容分析的優勢:

  • 提高敏感和高價值數據的準確性和檢測率。
  • 減少誤報。
  • 通過 AI 訓練的分類提高效率,並減少對數據進行分類所需的手動干預。

“就地管理”模式的優點:

  • 數據很容易找到,並且是最終使用者期望它的位置。
  • 減少數據丟失、生產力損失和最終用戶中斷的威脅。
  • 無需通過網路或雲傳輸數據以進行分析,從而節省成本並加快速度。

用於檔分析的本地解決方案和 SaaS 解決方案之間的區別

什麼是檔分析SaaS解決方案?

可以通過軟體即服務 (SaaS) 提供檔分析,客戶可以按月或按年付費使用應用程式安全提供者提供的服務。這種方法不需要硬體採購或傳統的永久許可。它部分或完全依賴 SaaS 供應商(或在某些情況下是託管服務提供者)來提供對應用程式的訪問,以便進行內容分析、搜索、治理操作和分析。SaaS 提供了一種開始內容分析的簡單方法,並提供高可擴充性、速度和快速的價值實現時間。根據 SaaS 託管環境的位置,可能需要權衡數據駐留和數據主權問題與 SaaS 的商業利益

什麼是本地檔分析解決方案?

檔分析解決方案也可以在本地運行,並由內部團隊進行操作和維護。這種方法要求組織提供基礎結構和人員,並獲取和管理應用程式安全解決方案。本地向組織保證其應用程式數據不會與第三方共用,也不會離開本地。通常,本地解決方案通過永久許可證進行銷售。最近,訂閱許可已被用於在軟體的使用和計費方式方面提供更大的靈活性。

OpenText 提供檔案分析工具

Voltage 檔分析套件 作者 OpenText™ SaaS檔分析解決方案使組織能夠快速有效地降低信息風險;確保數據隱私;分析、優化和保護員工對關鍵數據的訪問,從而推動和保護業務。我們的解決方案可確保數據生命週期管理和數據訪問治理,同時降低與管理敏感數據相關的風險。檔分析還提供身份和訪問治理、完整的數據可見性、降低存儲成本、可提高效率和數據品質的可操作分析。此外,它還支持數據隱私合規性,同時解決高價值資產(例如合同、智慧財產權、專利等)和敏感數據(例如 PI/PII、PCI、PHI 等)的治理問題。

OpenText™ File Reporter 清點網路文件系統,並提供優化和保護網路所需的詳細檔存儲智慧,以提高效率和合規性。它使您能夠在發現和分析整個企業中存儲的數據的文件和相關許可權時識別訪問風險。File Reporter 專為企業文件系統報告而設計,可收集分散在構成網路的各種網路存儲設備中的數百萬個檔和資料夾的數據。然後,靈活的報告、篩選和查詢選項會顯示您需要的確切結果,以證明合規性或採取糾正措施。

OpenText™ File Dynamics提供廣泛的服務,以滿足網路數據管理日益增長的需求。身份驅動策略可自動執行傳統上手動完成的任務,從而節省成本並確保任務得到正確執行。目標驅動的策略可防止未經授權的訪問以及數據遷移和清理。File Dynamics還通過對高價值目標的近線存儲備份來防止數據損壞和停機,從而實現檔及其相關許可權的快速恢復。File Dynamics 提供符合數據管理法規所需的基於角色的訪問限制、修復、風險緩解和主動管理。

OpenText™ ControlPoint 是一種檔分析解決方案,它利用 IDOL 用於非結構化數據分析的人工智慧。它使組織能夠識別敏感數據並自動分類(例如,PII、PCI、PHI);清理遺留數據;並發現隱藏在電子郵件存儲庫、檔共用、SharePoint 網站和雲存儲庫(如 Office365、Google Drive 和 Dropbox)中不受管理的暗數據中的風險。ControlPoint 還使組織能夠通過減少冗餘、過時和瑣碎的數據來節省存儲成本。這樣可以更好地訪問有價值的資訊,並通過應用有助於數據生命週期管理、法規遵從性和數據安全性的策略來強制執行數據保存。

檔分析

今天就開始吧。

申請演示

我們能提供什麼協助?

腳注