기술 주제

파일 분석이란 무엇인가요?

물음표에 초점을 맞춘 IT 항목의 일러스트레이션

개요

파일 분석은 데이터의 위치를 매핑하고 누가 어떤 데이터(파일 공유, 이메일 데이터베이스, 엔터프라이즈 파일 동기화 및 공유, 기록 관리, 엔터프라이즈 콘텐츠 관리, Microsoft SharePoint 및 데이터 아카이브 포함)에 액세스할 수 있는지 식별하여 조직이 증가하는 데이터 양을 처리하는 데 도움이 됩니다.

파일 분석 솔루션은 파일 메타데이터와 콘텐츠를 분석, 색인, 검색, 추적, 보고합니다. 이를 통해 조직은 상세한 메타데이터와 컨텍스트 정보를 보고 정리하고, PII 감독과 정보 거버넌스를 개선하며, 비정형 데이터를 보다 효율적으로 관리할 수 있습니다.

파일 분석 솔루션은 또한 비정형 데이터를 보호하고 보안을 유지합니다. 조직은 콘텐츠 분석에 대한 더 나은 의사 결정을 내리는 동시에 데이터와 관련된 위험을 완화하고 비용을 절감할 수 있습니다. 이러한 솔루션은 데이터 보안, 수명 주기 관리, 데이터 액세스 거버넌스, 매핑, 분류를 보장하는 동시에 비즈니스를 주도하고 보호하는 핵심 데이터 인사이트와 분석을 가능하게 합니다. 이러한 핵심 기능을 통해 조직은 위험 완화, 거버넌스 및 규정 준수, 효율성 및 최적화, 데이터 인사이트를 위한 디지털 트랜스포메이션 사용 사례를 해결할 수 있습니다.

파일 분석

왜 파일 분석인가요?

조직은 비즈니스를 혁신해야 한다는 압박을 점점 더 많이 받고 있습니다. 클라우드로의 이전, 원격 근무자 지원, 데이터 개인정보 보호에 대한 준비 등 그 여정의 시작이 무엇이든, 파일 분석 솔루션은 데이터와 애플리케이션을 최적화하고 데이터를 지능적으로 식별, 보호, 분류하는 데 도움을 줄 수 있습니다. 또한 파일 분석 솔루션은 데이터 전반에 대한 인사이트를 제공하여 규정 준수를 보장하고 더 스마트한 데이터 마이그레이션을 가능하게 합니다.

파일 분석 솔루션은 오늘날의 최신 워크로드에 맞게 확장할 수 있으며, 데이터를 최적화하고 방어적으로 삭제할 수 있는 영역을 식별하여 비용을 절감하고 효율성을 개선하며 규정 준수를 보장할 수 있습니다. 파일 분석을 배포하는 프로젝트에는 끊임없이 변화하는 비즈니스 환경을 따라잡을 수 있는 속도가 필요합니다. 이러한 솔루션의 가치를 극대화하기 위해서는 속도, 확장성, 빠른 가치 실현 시간이 필수적입니다.

파일 분석 솔루션은 가장 일반적인 비정형 데이터 소스(온프레미스 또는 클라우드)에 액세스하여 위험을 평가하고, 민감한 고가치 데이터를 식별하며, 수명 주기 동안 데이터를 보호, 보안 및 관리할 수 있는 조치를 제공합니다.

파일 분석은 데이터 효율성과 최적화에 어떻게 도움이 되나요?

비정형 데이터 전반의 데이터 효율성과 최적화는 어떤 데이터가 어디에 저장되어 있는지 파악하는 것에서부터 시작됩니다. 데이터 매핑을 통해 파일 분석을 사용하면 모든 데이터의 위치를 파악하고 잘못 배치되었거나 고아, 중복, 오래되었거나 사소한 '다크 데이터'를 식별할 수 있습니다. 파일 분석을 활용하는 프로젝트는 조직에 가치가 없는 데이터를 적극적으로 삭제하거나 최적화함으로써 더 빠른 투자 수익률을 제공합니다.

파일 분석은 위험 완화에 어떻게 도움이 되나요?

파일 분석 솔루션은 콘텐츠 분석 단계에서 발견된 데이터를 최적화, 보호, 보안함으로써 데이터 위험 완화를 지원합니다. 여기에는 다음이 포함됩니다:

  • PII, PCI, PHI 및 IP를 감지, 관리 및 처리합니다.
  • 정보 흐름 관리
  • 민감한 데이터 처리.
  • ID 보호, 메타데이터 보고, ID 액세스 권한, 데이터 중심 액세스 보호, 정책 제어 및 감사 추적 기능을 제공합니다.

데이터 최적화가 완료되면 비즈니스 가치가 없는 데이터는 더 이상 데이터 스토리지 공간을 차지하지 않습니다. 비즈니스 가치가 높고 비즈니스에서 적극적으로 사용하는 데이터만 남게 됩니다.

액세스 및 권한에 대한 이해는 필수적입니다. 수정 도구를 제공하는 파일 분석 솔루션은 데이터가 활발하게 사용되는 동안 적절한 제어가 적용되도록 도와줍니다. 일부 솔루션에는 엔드포인트에서 데이터를 암호화하여 적절한 사용을 보장하는 기능과 같은 추가 보호 기능이 포함되어 있습니다. 마지막으로, 제대로 배포된 파일 분석 솔루션은 사용자가 비즈니스 목적을 이해하지 못한 채 데이터를 이동하거나 삭제하는 것을 방지할 수 있습니다. '제자리에서 관리' 모델을 배포하는 파일 분석 솔루션은 비즈니스 사용자의 업무 중단 위험을 최소화합니다.

파일 분석은 거버넌스 및 규정 준수에 어떻게 도움이 되나요?

파일 분석 솔루션을 배포하면 적절한 사용자가 적절한 데이터를 적시에 사용할 수 있도록 보장할 수 있습니다. 이를 통해 조직은 규제, 법률, 내부 거버넌스 및 규정 준수 목표를 달성할 수 있습니다:

  • 메타데이터 거버넌스, 법적 보류, 격리 및 검색 기능을 제공합니다.
  • 데이터 볼륨 최적화.
  • 적절한 권한 관리.
  • 역할 기반 액세스 권한을 부여합니다.
  • 고부가가치 자산 식별.
  • 데이터 수명 주기 정책 적용.

파일 분석은 PII 데이터 및 데이터 개인정보 보호 규정 준수에 어떻게 도움이 되나요?

조직들은 개인 데이터(소비자, 시민, 직원 데이터 포함)를 찾고, 보호하고, 보호하기 위한 경쟁에 뛰어들고 있습니다. GDPR(EU), CCPA(캘리포니아), KVKK(터키), PIPEDA(캐나다), POPIA(남아공) 등 이러한 글로벌 추세는 파일 분석 솔루션에 대한 새로운 관심을 불러일으켰습니다. 파일 분석 솔루션은 콘텐츠 분석 기능과 탐지 기술을 활용하여 규정 준수를 보장하고 소비자 요청 또는 데이터 주체의 액세스 요청에 대응하는 데 이상적입니다.

데이터 프라이버시 대비는 파일 분석 솔루션이 빛을 발하는 예입니다. 또한 PII 파일을 쉽게 식별, 색인화 및 검색할 수 있는 프로세스의 필요성을 강조합니다.

엔드투엔드 프로세스는 다음과 같은 모습이어야 합니다:

  1. 리포지토리를 찾고 파일을 식별합니다.
  2. 파일에서 모든 메타데이터와 콘텐츠를 추출합니다.
  3. 특정 개체에 대한 파일 콘텐츠와 메타데이터를 분석하거나 개념적 콘텐츠를 기반으로 파일을 분류합니다.
  4. 분석 결과를 바탕으로 비즈니스 규칙을 적용하여 적절한 액세스 수준과 민감한 데이터 처리(예: 암호화)를 보장함으로써 데이터를 보호하세요. 카테고리나 분류를 적용하여 자산의 수명 주기를 관리할 수도 있습니다.

파일 분류 또는 분류란 무엇인가요?

파일 분석 솔루션은 메타데이터 태그, 키워드 또는 용어 목록에 기반한 간단한 분류 방법을 사용합니다. 일부 솔루션은 파일 콘텐츠의 개념적 분류를 활용하고 이러한 방법을 검색된 문서, 이미지 또는 데이터 엔티티와 결합하여 분류의 정확성을 높입니다. 다른 솔루션은 샘플 문서를 사용한 머신 러닝과 가이드 학습을 통해 한 단계 더 발전하여 사용할 분류를 정의할 수 있습니다.

예를 들어, 건강 또는 보험 정보가 포함된 인사 문서에서는 샘플 데이터를 기반으로 한 데이터 분류 정책을 사용할 수 있습니다. 연령 및 위치와 같은 다른 요소의 경우 위험 점수 및 추가 권한을 적용하여 정책을 추가로 정의할 수 있습니다.

파일 분석은 데이터 거버넌스 및 데이터 보존을 어떻게 제공하나요?

파일 분석 솔루션은 조직이 데이터에 대해 자동으로 조치를 취할 수 있는 기능과 데이터 관리 및 보존에 도움이 되는 다양한 도구 세트를 제공합니다. 솔루션에는 일반적으로 기업 데이터 거버넌스에 따라 다음과 같은 옵션이 포함됩니다:

  • 데이터를 삭제합니다. 파일을 보관할 필요가 없다면 삭제하세요. 너무 오래된 파일인가요? 중복된 파일인가요? 비즈니스에 어떤 가치를 제공하는가? 소비자가 데이터 파기를 요청했나요? 파일 분석 솔루션은 사용자가 수행한 작업과 그 이유에 대한 감사 추적을 유지합니다.
  • 데이터를 안전하게 보호하세요. 데이터를 보관해야 한다면 데이터를 보호하세요. 일부 파일 분석 솔루션은 액세스 제어를 변경하거나 데이터를 암호화할 수 있습니다. 또 다른 옵션은 장기 보존을 위해 기록 관리 도구와 같은 안전한 위치로 옮기는 것입니다.
  • 데이터를 삭제합니다. 일부 데이터는 보관하되 PII는 보관하지 않아야 할 수도 있습니다. 일부 파일 분석 솔루션은 PII 콘텐츠가 없는 원본 파일의 깨끗한 사본을 생성하는 삭제 기능을 지원합니다. 그런 다음 원본 파일을 위에서 설명한 대로 삭제하거나 보안을 유지합니다.

"제자리 관리"란 무엇인가요?

제자리 관리는 데이터 수명 주기 관리 및 거버넌스의 핵심 개념입니다. 메타데이터(위치, 권한, 콘텐츠 포함)가 있는 곳에서 파일 분석 솔루션이 메타데이터를 '어떻게' 분석하는지를 말합니다. 실제 개체는 분석 중에 다른 위치나 보존 영역으로 이동, 복사 또는 저장되지 않습니다.

엔티티에 대한 문법 이해

데이터 검색 문법(규칙 세트)의 두 가지 기본 유형은 식별하려는 엔티티를 설명하는 데 사용됩니다: 큐레이션된 것과 사용자 생성된 것.

문법에는 다음이 포함됩니다:

  • 개인 식별 정보: 지역마다 다를 수 있는 개인 식별 정보(오탐을 유발할 수 있는 형식 포함)입니다.
  • PHI: 일반적으로 북미 의료 산업과 관련된 개인 건강 정보.
  • PCI: 개인 신용카드 정보.
  • PSI: 개인 보안 정보, 계정 세부 정보 액세스 키에 대한 정보입니다.

사용자가 수정할 수 없는 선별되고 최적화된 문법을 찾아보세요. 이러한 문법은 문맥과 랜드마크를 사용하여 보다 정확한 결과를 제공하며 오탐을 걸러내는 데 도움이 되는 '신뢰도 점수'를 제공합니다. 문맥과 랜드마크는 구문, 단일 단어 또는 개별 문자가 될 수 있습니다.

컨텍스트가 핵심입니다. 파일 분석 솔루션은 엔티티 후보와의 근접성과 문맥의 강도(자연어 처리 기술 기반)를 사용하여 신뢰도 점수에 기여합니다. 특정 법인, 국가 또는 지역의 포괄적인 목록을 활용하여 보다 세분화된 점수를 얻을 수 있습니다.

조정 및 유연성. 이러한 문법 중 특정 사용 사례에 맞는 문법이 없는 경우, 사용자 지정 문법을 만들 수 있는 파일 분석 솔루션을 사용할 수 있습니다. 이러한 문법은 일반적으로 형식 설명형 RegX 또는 간단한 목록을 사용하여 정의됩니다.

오탐이란 무엇인가요?

정의에 따르면 '오탐'은 특정 조건이나 속성의 존재를 잘못 나타내는 테스트 결과입니다1. 파일 분석 솔루션의 경우, 오탐은 콘텐츠 분석 중에 잘못 식별된 패턴, 문법 또는 키워드 일치를 나타냅니다. 단순히 패턴이나 키워드 매칭을 사용하는 파일 분석 솔루션은 일반적으로 문맥 인식 콘텐츠 분석 기능을 갖춘 솔루션보다 오탐률이 높습니다.

스캔한 문서 및 오디오 녹음

파일 분석 솔루션은 텍스트 기반 문서에 대한 위험성을 분석할 수 있지만, PII는 다른 형태의 데이터에도 존재할 수 있습니다. 스캔 문서, 녹음된 대화, 화상 회의 녹화 파일에 대한 파일 분석 수행이 점점 더 보편화되고 있습니다. 일부 파일 분석 솔루션은 PII 검색 기술을 적용하기 전에 이러한 파일을 처리할 수 있습니다.

이미지로 저장된 스캔한 종이 문서(예: PDF 파일 내부)는 광학 문자 인식(OCR)으로 처리하여 텍스트와 관련 구조 정보를 추출해야 합니다. 많은 조직에서 직원의 운전면허증이나 여권 등 신분증을 스캔한 문서를 기록으로 보관합니다.

오디오 또는 비디오 녹취 분석을 지원하는 파일 분석 솔루션은 분석을 위해 서면 기록을 생성할 수 있는 음성-텍스트 엔진으로 처리해야 합니다.

문맥에 따른 AI 기반 콘텐츠 분석의 이점:

  • 민감한 고가치 데이터의 정확도와 탐지율을 높입니다.
  • 오탐을 줄입니다.
  • AI로 학습된 분류를 통해 효율성을 높이고 데이터 분류에 필요한 수작업을 줄입니다.

'관리형' 모델의 이점:

  • 데이터는 쉽게 찾을 수 있고 최종 사용자가 기대하는 위치에 있습니다.
  • 데이터 손실, 생산성 저하, 최종 사용자 중단의 위협을 줄입니다.
  • 데이터를 분석하기 위해 네트워크나 클라우드로 전송할 필요가 없어 비용 절감과 속도 향상.

파일 분석을 위한 온프레미스 솔루션과 SaaS 솔루션의 차이점

파일 분석 SaaS 솔루션이란 무엇인가요?

파일 분석은 고객이 애플리케이션 보안 제공업체가 제공하는 서비스를 월별 또는 연간 요금으로 사용하는 서비스형 소프트웨어(SaaS)를 통해 제공할 수 있습니다. 이 접근 방식은 하드웨어 조달이나 기존의 영구 라이선스가 필요하지 않습니다. 콘텐츠 분석, 검색, 거버넌스 작업 및 분석을 수행하기 위해 애플리케이션에 대한 액세스를 제공하기 위해 SaaS 공급업체(또는 경우에 따라 관리형 서비스 제공업체)에 부분적으로 또는 전체적으로 의존합니다. SaaS는 콘텐츠 분석을 쉽게 시작할 수 있는 방법을 제공하며 높은 확장성, 속도 및 빠른 가치 창출 시간을 제공합니다. SaaS 호스팅 환경의 위치에 따라 데이터 보존 및 데이터 주권에 대한 우려와 SaaS의 상업적 이점을 비교 검토해야 할 수도 있습니다.

파일 분석 온프레미스 솔루션이란 무엇인가요?

파일 분석 솔루션은 온프레미스에서 실행하고 사내 팀에서 운영 및 유지 관리할 수도 있습니다. 이 접근 방식에서는 조직이 인프라와 인력을 제공하고 애플리케이션 보안 솔루션을 구입 및 관리해야 합니다. 온프레미스는 조직이 애플리케이션 데이터가 제3자와 공유되지 않고 외부로 유출되지 않도록 보장합니다. 일반적으로 온프레미스 솔루션은 영구 라이선스를 통해 판매됩니다. 최근에는 소프트웨어 사용 및 청구 방식에 더 많은 유연성을 제공하기 위해 구독 라이선싱이 사용되고 있습니다.

OpenText 파일 분석 도구 제공

Voltage File Analysis Suite( OpenText™ ) SaaS 파일 분석 솔루션을 통해 조직은 정보 위험을 빠르고 효율적으로 줄이고, 데이터 프라이버시를 보장하며, 비즈니스를 주도하고 보호하는 중요한 데이터에 대한 직원 액세스를 분석, 최적화 및 보호할 수 있습니다. Dropbox 솔루션은 데이터 수명주기 관리와 데이터 액세스 거버넌스를 보장하는 동시에 민감한 데이터 관리와 관련된 위험을 완화합니다. 또한 파일 분석은 ID 및 액세스 거버넌스, 완벽한 데이터 가시성, 스토리지 비용 절감, 효율성을 개선하는 실행 가능한 분석, 데이터 품질을 제공합니다. 또한 고가치 자산(예: 계약서, 지적 재산, 특허 등) 및 민감한 데이터(예: PI/PII, PCI, PHI 등)에 대한 거버넌스를 해결하면서 데이터 개인정보 보호 규정 준수를 지원합니다.

OpenText™ File Reporter는 네트워크 파일 시스템을 인벤토리화하고 효율성과 규정 준수를 위해 네트워크를 최적화하고 보호하는 데 필요한 상세한 파일 스토리지 인텔리전스를 제공합니다. 기업 전체에 저장된 데이터의 파일과 관련 권한을 검색하고 분석할 때 액세스 위험을 식별할 수 있습니다. 엔터프라이즈 파일 시스템 보고를 위해 설계된 File Reporter는 네트워크를 구성하는 다양한 네트워크 스토리지 장치에 흩어져 있는 수백만 개의 파일과 폴더에서 데이터를 수집합니다. 그런 다음 유연한 보고, 필터링, 쿼리 옵션을 통해 규정 준수 여부를 입증하거나 시정 조치를 취하는 데 필요한 정확한 결과를 제공합니다.

OpenText™ File Dynamics는 네트워크 데이터 관리의 확대되는 요구사항을 해결하기 위한 광범위한 서비스를 제공합니다. ID 기반 정책은 기존에 수동으로 수행하던 작업을 자동화하여 비용을 절감하고 작업이 제대로 수행되고 있다는 확신을 줍니다. 대상 중심 정책은 무단 액세스로부터 보호하고 데이터 마이그레이션 및 정리 기능을 제공합니다. 또한 File Dynamics는 중요도가 높은 대상의 니어라인 스토리지 백업을 통해 데이터 손상과 다운타임을 방지하여 파일과 관련 권한을 신속하게 복구할 수 있습니다. File Dynamics는 데이터 관리 규정 준수에 필요한 역할 기반 액세스 제한, 수정, 위험 완화, 사전 예방적 관리 기능을 제공합니다.

OpenText™ ControlPoint는 비정형 데이터 분석을 위해 IDOL 인공 지능을 활용하는 파일 분석 솔루션입니다. 이를 통해 조직은 민감한 데이터(예: PII, PCI, PHI)를 식별하고 자동으로 분류하며, 레거시 데이터를 정리하고, 이메일 저장소, 파일 공유, SharePoint 사이트, 클라우드 저장소(예: Office365, Google Drive, Dropbox)에 관리되지 않는 다크 데이터에 숨겨진 위험을 발견할 수 있습니다. 또한, ControlPoint를 통해 조직은 중복되거나 쓸모없고 사소한 데이터를 줄여 스토리지 비용을 절감할 수 있습니다. 또한 데이터 수명 주기 관리, 규정 준수, 데이터 보안을 지원하는 정책을 적용하여 중요한 정보에 더 잘 액세스하고 데이터 보존을 강화할 수 있습니다.

파일 분석

지금 바로 시작하세요.

데모 요청하기

어떻게 도와드릴까요?

각주