Tópicos técnicos

O que é análise de arquivos?

Ilustração de itens de TI com foco em um ponto de interrogação

Visão geral

A análise de arquivos ajuda as organizações a lidar com seus volumes crescentes de dados, mapeando os locais de seus dados e identificando quem tem acesso a quais dados (incluindo compartilhamentos de arquivos, bancos de dados de e-mail, sincronização e compartilhamento de arquivos corporativos, gerenciamento de registros, gerenciamento de conteúdo corporativo, Microsoft SharePoint e arquivos de dados).

As soluções de análise de arquivos analisam, indexam, pesquisam, rastreiam e geram relatórios sobre metadados e conteúdo de arquivos. Isso permite que as organizações visualizem e organizem metadados detalhados e informações contextuais, aprimorem a supervisão de PII e a governança de informações e gerenciem dados não estruturados com mais eficiência.

As soluções de análise de arquivos também protegem e asseguram dados não estruturados. As organizações podem tomar decisões melhores sobre a análise de conteúdo e, ao mesmo tempo, mitigar os riscos e reduzir os custos associados aos dados. Essas soluções ajudam a garantir a segurança dos dados, o gerenciamento do ciclo de vida, a governança do acesso aos dados, o mapeamento e a classificação, ao mesmo tempo em que permitem insights e análises de dados importantes que impulsionam e protegem os negócios. Esses recursos essenciais ajudam as organizações a abordar casos de uso de transformação digital para mitigação de riscos, governança e conformidade, eficiência e otimização e insight de dados.

Análise de arquivos

Por que analisar arquivos?

As organizações estão sob crescente pressão para transformar seus negócios. Quer essa jornada comece com a aceleração dos esforços para migrar para a nuvem, dar suporte a funcionários remotos ou preparar-se para a privacidade dos dados, as soluções de análise de arquivos podem ajudar a otimizar dados e aplicativos e identificar, proteger e classificar dados de forma inteligente. As soluções de análise de arquivos também podem fornecer insights sobre os dados para garantir a conformidade e permitir migrações de dados mais inteligentes.

As soluções de análise de arquivos podem ser dimensionadas para atender às necessidades das cargas de trabalho modernas de hoje e identificar áreas em que os dados podem ser otimizados e excluídos de forma defensiva, reduzindo custos, melhorando a eficiência e garantindo a conformidade. Os projetos que implementam a análise de arquivos exigem velocidade para acompanhar um ambiente de negócios em constante mudança. A velocidade, a escala e o rápido tempo de obtenção de valor são essenciais para maximizar o valor dessas soluções.

As soluções de análise de arquivos fornecem acesso às fontes mais comuns de dados não estruturados (no local ou na nuvem) para avaliar o risco, identificar dados confidenciais e de alto valor e fornecer ações que protejam, resguardem e controlem os dados durante seu ciclo de vida.

Como a análise de arquivos ajuda na eficiência e otimização dos dados?

A eficiência e a otimização de dados em dados não estruturados começam com a compreensão dos dados que você tem e onde eles estão armazenados. Por meio do mapeamento de dados, você pode usar a análise de arquivos para identificar onde todos os seus dados estão localizados e identificar "dados obscuros" que estão perdidos, órfãos, duplicados, obsoletos ou triviais. Os projetos que utilizam a análise de arquivos proporcionam um retorno mais rápido do investimento, excluindo ou otimizando ativamente os dados que não têm valor para a organização.

Como a análise de arquivos ajuda na mitigação de riscos?

As soluções de análise de arquivos auxiliam na mitigação do risco dos dados, otimizando, protegendo e protegendo os dados encontrados durante o estágio de análise de conteúdo. Isso inclui:

  • Detectar, gerenciar e processar PII, PCI, PHI e IP.
  • Gerenciar o fluxo de informações.
  • Manuseio de dados confidenciais.
  • Fornecimento de proteção de identidade, relatórios de metadados, direitos de acesso de identidade, proteção de acesso centrada em dados, controles de políticas e trilhas de auditoria.

Quando a otimização dos dados estiver concluída, todos os dados que não tiverem valor comercial não estarão mais consumindo espaço de armazenamento de dados. Somente os dados altamente valiosos e ativamente usados pela empresa permanecem.

Compreender o acesso e as permissões é essencial. As soluções de análise de arquivos que fornecem ferramentas de correção ajudam a garantir que os controles adequados sejam aplicados aos dados enquanto eles estiverem em uso ativo. Algumas soluções incluem proteções adicionais, como a capacidade de criptografar dados no endpoint para garantir o uso adequado. E, por fim, as soluções de análise de arquivos implantadas corretamente podem impedir que os usuários movam ou excluam dados sem entender sua finalidade comercial. As soluções de análise de arquivos que implementam um modelo de "gerenciamento no local" minimizam o risco de interrupção para os usuários corporativos.

Como a análise de arquivos ajuda na governança e na conformidade?

A implementação de uma solução de análise de arquivos pode ajudar a garantir que os dados certos estejam disponíveis para o usuário certo no momento certo. Ela ajuda as organizações a cumprir seus objetivos regulamentares, legais e internos de governança e conformidade ao:

  • Fornecimento de governança de metadados, retenções legais, quarentena e descoberta.
  • Otimização de volumes de dados.
  • Gerenciar as permissões apropriadas.
  • Concessão de acesso baseado em função.
  • Identificação de ativos de alto valor.
  • Aplicação de políticas de ciclo de vida de dados.

Como a análise de arquivos ajuda na conformidade com dados de PII e privacidade de dados?

As organizações estão em uma corrida para encontrar, proteger e resguardar dados pessoais (incluindo dados de consumidores, cidadãos e funcionários). Essa tendência global - que inclui GDPR (UE), CCPA (Califórnia), KVKK (Turquia), PIPEDA (Canadá) e POPIA (África do Sul) - chamou a atenção para as soluções de análise de arquivos. Ao aproveitar os recursos de análise de conteúdo e as técnicas de detecção, as soluções de análise de arquivos são ideais para garantir a conformidade e ajudar a responder às solicitações dos consumidores ou às solicitações de acesso dos titulares dos dados.

A preparação para a privacidade dos dados é um exemplo de como as soluções de análise de arquivos se destacam. Isso também enfatiza a necessidade de um processo no qual os arquivos PII possam ser facilmente identificados, indexados e recuperados.

O processo de ponta a ponta deve ser mais ou menos assim:

  1. Localizar repositórios e identificar arquivos.
  2. Extraia todos os metadados e o conteúdo do arquivo.
  3. Analisar o conteúdo do arquivo e os metadados para entidades específicas ou classificar o arquivo com base no conteúdo conceitual.
  4. Proteja os dados aplicando regras de negócios com base nos resultados da análise para garantir níveis de acesso apropriados e manuseio de dados confidenciais (ou seja, criptografia). Você também pode aplicar uma categoria ou classificação para ajudar a gerenciar o ciclo de vida dos ativos.

O que é classificação ou categorização de arquivos?

As soluções de análise de arquivos usam métodos de classificação simples com base em tags de metadados, palavras-chave ou listas de termos. Algumas soluções aproveitam a classificação conceitual do conteúdo do arquivo e combinam esses métodos com documentos, imagens ou entidades de dados encontrados para melhorar a precisão da categorização. Outras soluções vão além com o aprendizado de máquina e o aprendizado orientado usando documentos de amostra, o que permite definir as classificações a serem usadas.

Por exemplo, um documento de Recursos Humanos com informações sobre saúde ou seguro pode usar uma política de classificação de dados baseada em dados de amostra. Para outros elementos, como idade e localização, você pode aplicar uma pontuação de risco e permissões adicionais para definir melhor a política.

Como a análise de arquivos oferece governança e preservação de dados?

As soluções de análise de arquivos oferecem recursos para ajudar as organizações a agir automaticamente sobre os dados, bem como um rico conjunto de ferramentas para ajudar a governar e preservar os dados. Normalmente, as soluções incluem as seguintes opções, orientadas pela governança de dados corporativos:

  • Exclua os dados. Se não houver necessidade de manter o arquivo, remova-o. Ele é muito antigo? É uma duplicata? Ele tem algum valor para a empresa? O consumidor solicitou que seus dados fossem destruídos? As soluções de análise de arquivos mantêm uma trilha de auditoria do que você fez e por que o fez.
  • Proteja os dados. Se você precisar manter os dados, proteja-os. Algumas soluções de análise de arquivos podem alterar os controles de acesso ou criptografar os dados. Outra opção é movê-los para um local seguro, como uma ferramenta de gerenciamento de registros, para preservação a longo prazo.
  • Reduzir os dados. Talvez você precise manter alguns dos dados, mas não as PII. Algumas soluções de análise de arquivos suportam a redação para criar uma cópia limpa do arquivo original sem o conteúdo de PII. O arquivo original é então excluído ou protegido conforme descrito acima.

O que é "gerenciar no local"?

O Manage-in-place é um conceito fundamental do gerenciamento e da governança do ciclo de vida dos dados. É "como" os metadados (incluindo localização, permissões e conteúdo) são analisados pela solução de análise de arquivos onde eles residem. O objeto real não é movido, copiado ou armazenado em outro local ou área de preservação durante a análise.

Compreensão de gramáticas para entidades

Dois tipos básicos de gramáticas de descoberta de dados (conjuntos de regras) são usados para descrever as entidades que você está tentando identificar: com curadoria e geradas pelo usuário.

As gramáticas incluem:

  • PII: informações de identificação pessoal, que podem diferir de região para região (incluindo o formato, que pode causar falsos positivos).
  • PHI: Informações pessoais de saúde, normalmente associadas ao setor de saúde norte-americano.
  • PCI: informações pessoais de cartão de crédito.
  • PSI: Informações de segurança pessoal, para chaves de acesso aos detalhes da conta.

Procure gramáticas selecionadas e otimizadas, que não podem ser modificadas pelo usuário. Essas gramáticas usam contexto e pontos de referência para obter resultados mais precisos e fornecem uma "pontuação de confiança" para ajudá-lo a filtrar os falsos positivos. O contexto e os pontos de referência podem ser frases, palavras isoladas ou caracteres individuais.

O contexto é fundamental. As soluções de análise de arquivos que usam a proximidade com a entidade candidata e a força do contexto (com base em técnicas de processamento de linguagem natural) contribuem para as pontuações de confiança. Você pode obter pontuações mais granulares aproveitando listas abrangentes de entidades, países ou regiões específicos.

Ajuste e flexibilidade. Se nenhuma dessas gramáticas abranger seu caso de uso específico, você poderá usar uma solução de análise de arquivos que permita a criação de gramáticas personalizadas. Essas gramáticas são normalmente definidas com o uso de RegX descritivo de formato ou listas simples.

O que são falsos positivos?

Por definição, um "falso positivo" é um resultado de teste que indica incorretamente a presença de uma determinada condição ou atributo1. No caso de soluções de análise de arquivos, um falso positivo indica uma correspondência de padrão, gramática ou palavra-chave que é identificada incorretamente durante a análise de conteúdo. As soluções de análise de arquivos que simplesmente usam a correspondência de padrões ou palavras-chave geralmente têm taxas de falsos positivos mais altas do que aquelas com recursos de análise de conteúdo contextualmente conscientes.

Documentos digitalizados e gravações de áudio

As soluções de análise de arquivos podem analisar documentos baseados em texto quanto a riscos, mas as PII também podem residir em outras formas de dados. A realização de análise de arquivos em documentos digitalizados, conversas gravadas e gravações de videoconferências está se tornando cada vez mais comum. Algumas soluções de análise de arquivos podem processar esses arquivos antes de aplicar técnicas de descoberta de PII.

Os documentos em papel digitalizados armazenados como imagens (dentro de um arquivo PDF, por exemplo) devem ser processados com reconhecimento óptico de caracteres (OCR) para extrair o texto e, idealmente, as informações estruturais associadas. Muitas organizações mantêm documentos de identificação digitalizados em registro, como carteiras de motorista ou passaportes de funcionários.

As soluções de análise de arquivos que suportam a análise de gravações de áudio ou vídeo exigem o processamento por um mecanismo de conversão de fala em texto que possa criar uma transcrição escrita para análise.

Benefícios da análise de conteúdo contextual e orientada por IA:

  • Aumenta a precisão e a detecção de dados confidenciais e de alto valor.
  • Reduz os falsos positivos.
  • Aumenta a eficiência por meio da categorização treinada por IA e reduz a intervenção manual necessária para classificar os dados.

Benefícios dos modelos de "gerenciamento no local":

  • Os dados são fáceis de encontrar e estão onde os usuários finais esperam que estejam.
  • Reduz a ameaça de perda de dados, perda de produtividade e interrupção do trabalho do usuário final.
  • Aumenta a economia de custos e a velocidade, eliminando a necessidade de transferir dados pela rede ou para a nuvem a fim de analisá-los.

A diferença entre soluções locais e SaaS para análise de arquivos

O que é uma solução SaaS de análise de arquivos?

A análise de arquivos pode ser oferecida por meio de software como serviço (SaaS), em que o cliente consome os serviços fornecidos por um provedor de segurança de aplicativos por uma taxa mensal ou anual. Essa abordagem não requer a aquisição de hardware nem o licenciamento perpétuo tradicional. Ela depende parcial ou totalmente do fornecedor de SaaS (ou de um provedor de serviços gerenciados em alguns casos) para fornecer acesso ao aplicativo a fim de realizar análise de conteúdo, pesquisa, ações de governança e análises. O SaaS é uma maneira fácil de começar a fazer análise de conteúdo e oferece alta escalabilidade, velocidade e rápido tempo de obtenção de valor. Dependendo da localização do ambiente de hospedagem do SaaS, as preocupações com a residência e a soberania dos dados talvez precisem ser ponderadas em relação aos benefícios comerciais do SaaS

O que é uma solução de análise de arquivos no local?

As soluções de análise de arquivos também podem ser executadas no local e operadas e mantidas por equipes internas. Essa abordagem exige que as organizações forneçam a infraestrutura e a equipe e adquiram e gerenciem soluções de segurança de aplicativos. A solução local garante às organizações que os dados de seus aplicativos não sejam compartilhados com terceiros e não saiam do local. Normalmente, as soluções locais são vendidas por meio de uma licença perpétua. Mais recentemente, o licenciamento por assinatura tem sido usado para oferecer mais flexibilidade na forma como o software é consumido e cobrado.

OpenText fornece ferramentas de análise de arquivos

Voltage File Analysis Suite by OpenText™ A solução SaaS de análise de arquivos permite que as organizações reduzam de forma rápida e eficiente o risco das informações, garantam a privacidade dos dados e analisem, otimizem e protejam o acesso dos funcionários aos dados essenciais que impulsionam e protegem os negócios. Nossa solução garante o gerenciamento do ciclo de vida dos dados e a governança do acesso aos dados, além de reduzir o risco associado ao gerenciamento de dados confidenciais. O File Analysis também oferece governança de identidade e acesso, visibilidade completa dos dados, redução dos custos de armazenamento, análises acionáveis que melhoram a eficiência e a qualidade dos dados. Além disso, ele oferece suporte à conformidade com a privacidade dos dados, abordando a governança de ativos de alto valor (por exemplo, contratos, propriedade intelectual, patentes etc.) e dados confidenciais (por exemplo, PI/PII, PCI, PHI etc.).

OpenText™ O File Reporter faz o inventário dos sistemas de arquivos de rede e oferece a inteligência detalhada de armazenamento de arquivos necessária para otimizar e proteger a sua rede em termos de eficiência e conformidade. Ele permite que você identifique os riscos de acesso ao descobrir e analisar arquivos e permissões associadas aos dados armazenados em toda a empresa. Projetado para a geração de relatórios de sistemas de arquivos corporativos, o File Reporter reúne dados de milhões de arquivos e pastas espalhados entre os vários dispositivos de armazenamento de rede que compõem a sua rede. As opções flexíveis de geração de relatórios, filtragem e consulta apresentam as descobertas exatas de que você precisa para demonstrar conformidade ou tomar medidas corretivas.

OpenText™ O File Dynamics oferece serviços abrangentes para atender aos requisitos de expansão do gerenciamento de dados de rede. As políticas orientadas por identidade automatizam tarefas que tradicionalmente são feitas manualmente, resultando em economia de custos e na garantia de que as tarefas estão sendo executadas corretamente. As políticas orientadas por destino oferecem proteção contra acesso não autorizado, bem como migração e limpeza de dados. O File Dynamics também protege contra a corrupção de dados e o tempo de inatividade por meio de backup de armazenamento quase em linha de alvos de alto valor, permitindo a recuperação rápida de arquivos e de suas permissões associadas. O File Dynamics oferece as restrições de acesso baseadas em funções, a correção, a atenuação de riscos e o gerenciamento proativo necessários para a conformidade com as normas de gerenciamento de dados.

OpenText™ O ControlPoint é uma solução de análise de arquivos que utiliza a inteligência artificial IDOL para análise de dados não estruturados. Ele permite que as organizações identifiquem e classifiquem automaticamente dados confidenciais (por exemplo, PII, PCI, PHI); limpem dados legados; e descubram riscos ocultos em dados obscuros que não são gerenciados em repositórios de e-mail, compartilhamentos de arquivos, sites do SharePoint e repositórios em nuvem (como Office365, Google Drive e Dropbox). O ControlPoint também permite que as organizações economizem em custos de armazenamento, reduzindo dados redundantes, obsoletos e triviais. Isso proporciona melhor acesso a informações valiosas e reforça a preservação dos dados por meio da aplicação de políticas que auxiliam no gerenciamento do ciclo de vida dos dados, na conformidade normativa e na segurança dos dados.

Análise de arquivos

Comece hoje mesmo.

Solicite uma demonstração

Notas de rodapé