Tekniska ämnen

Vad är filanalys?

Illustration av IT-objekt med fokus på ett frågetecken

Översikt

Filanalys hjälper organisationer att hantera sina ökande datavolymer genom att kartlägga var deras data finns och identifiera vem som har tillgång till vilken data (inklusive fildelning, e-postdatabaser, synkronisering och delning av företagsfiler, registerhantering, innehållshantering för företag, Microsoft SharePoint och dataarkiv).

Filanalyslösningar analyserar, indexerar, söker, spårar och rapporterar om metadata och innehåll i filer. Detta gör det möjligt för organisationer att visa och organisera detaljerade metadata och kontextuell information, förbättra PII-övervakning och informationsstyrning samt hantera ostrukturerade data mer effektivt.

Lösningar för filanalys skyddar och säkrar även ostrukturerad data. Organisationer kan fatta bättre beslut om innehållsanalys, samtidigt som de minskar riskerna och sänker kostnaderna som är förknippade med data. Dessa lösningar bidrar till att säkerställa datasäkerhet, livscykelhantering, styrning av dataåtkomst, kartläggning och klassificering samtidigt som de möjliggör viktiga datainsikter och analyser som driver och skyddar verksamheten. Dessa viktiga funktioner hjälper organisationer att hantera användningsfall för digital transformation för riskreducering, styrning och efterlevnad, effektivitet och optimering samt datainsikt.

Filanalys

Varför filanalys?

Organisationer utsätts för allt större press att förändra sin verksamhet. Oavsett om resan börjar med att påskynda arbetet med att flytta till molnet, stödja distansarbetare eller förbereda sig för datasekretess, kan filanalyslösningar hjälpa till att optimera data och applikationer och på ett intelligent sätt identifiera, säkra och klassificera data. Filanalyslösningar kan också ge insikt i data för att säkerställa efterlevnad och möjliggöra smartare datamigreringar.

Filanalyslösningar kan skalas upp för att möta behoven hos dagens moderna arbetsbelastningar och identifiera områden där data kan optimeras och raderas på ett försvarbart sätt - vilket sänker kostnaderna, förbättrar effektiviteten och säkerställer efterlevnad. Projekt som använder filanalys kräver snabbhet för att hålla jämna steg med en ständigt föränderlig affärsmiljö. Snabbhet, skalbarhet och snabb tid till värde är avgörande för att maximera värdet av dessa lösningar.

Filanalyslösningar ger tillgång till de vanligaste källorna till ostrukturerade data (lokalt eller i molnet) för att bedöma risker, identifiera känsliga och värdefulla data och vidta åtgärder som skyddar, säkrar och styr data under hela dess livscykel.

Hur kan filanalys bidra till effektivisering och optimering av data?

Dataeffektivitet och optimering av ostrukturerade data börjar med att förstå vilka data du har och var de är lagrade. Genom datakartläggning kan du använda filanalys för att identifiera var alla dina data finns och identifiera "mörka data" som är felplacerade, föräldralösa, duplicerade, föråldrade eller triviala. Projekt som utnyttjar filanalys ger snabbare avkastning på investeringen genom att aktivt radera eller optimera data som inte har något värde för organisationen.

Hur kan filanalys bidra till riskreducering?

Filanalyslösningar hjälper till att minska datarisker genom att optimera, skydda och säkra data som hittas under innehållsanalysfasen. Detta inkluderar:

  • Upptäcka, hantera och bearbeta PII, PCI, PHI och IP.
  • Hantering av informationsflödet.
  • Hantering av känsliga uppgifter.
  • Tillhandahåller identitetsskydd, metadatarapportering, identitetsåtkomsträttigheter, datacentrerat åtkomstskydd, policykontroller och verifieringskedjor.

När dataoptimeringen är klar tar data som inte har något affärsvärde inte längre upp lagringsutrymme. Endast data som är mycket värdefull och som används aktivt av verksamheten finns kvar.

Det är viktigt att förstå åtkomst och behörigheter. Filanalyslösningar som tillhandahåller åtgärdsverktyg hjälper till att säkerställa att korrekta kontroller tillämpas på data medan de används aktivt. Vissa lösningar innehåller ytterligare skydd, till exempel möjligheten att kryptera data vid slutpunkten för att säkerställa korrekt användning. Slutligen kan filanalyslösningar som används på rätt sätt förhindra att användare flyttar eller raderar data utan att förstå dess affärssyfte. Filanalyslösningar som använder en "manage-in-place"-modell minimerar risken för störningar för affärsanvändare.

Hur kan filanalys hjälpa till med styrning och efterlevnad?

En lösning för filanalys kan bidra till att säkerställa att rätt data finns tillgänglig för rätt användare vid rätt tidpunkt. Det hjälper organisationer att uppfylla sina mål för reglering, juridik och intern styrning och efterlevnad genom att:

  • Tillhandahåller metadatastyrning, lagliga innehav, karantän och upptäckt.
  • Optimering av datavolymer.
  • Styrning av lämpliga behörigheter.
  • Tilldelning av rollbaserad åtkomst.
  • Identifiering av tillgångar med högt värde.
  • Tillämpning av policyer för datalivscykel.

Hur kan filanalys hjälpa till med PII-data och efterlevnad av dataskydd?

Organisationer är i full färd med att hitta, skydda och säkra personuppgifter (inklusive uppgifter om konsumenter, medborgare och anställda). Denna globala trend - som omfattar GDPR (EU), CCPA (Kalifornien), KVKK (Turkiet), PIPEDA (Kanada) och POPIA (Sydafrika) - har lett till att filanalyslösningar fått ny uppmärksamhet. Genom att utnyttja funktioner för innehållsanalys och detekteringstekniker är filanalyslösningar idealiska för att säkerställa efterlevnad och hjälpa till att svara på konsumentförfrågningar eller förfrågningar om tillgång till registrerade uppgifter.

Beredskap för datasekretess är ett exempel där filanalyslösningar är utmärkta. Det understryker också behovet av en process där PII-filer enkelt kan identifieras, indexeras och hämtas.

Processen från början till slut bör se ut ungefär så här:

  1. Hitta repositories och identifiera filer.
  2. Extrahera alla metadata och allt innehåll från filen.
  3. Analysera filinnehållet och metadata för specifika enheter eller klassificera filen baserat på begreppsmässigt innehåll.
  4. Säkra data genom att tillämpa affärsregler baserade på analysresultaten för att säkerställa lämpliga åtkomstnivåer och hantering av känsliga data (t.ex. kryptering). Du kan också tillämpa en kategori eller klassificering för att hjälpa till att hantera tillgångarnas livscykel.

Vad är klassificering eller kategorisering för filer?

Filanalyslösningar använder enkla klassificeringsmetoder som baseras på metadatataggar, nyckelord eller termlistor. Vissa lösningar utnyttjar konceptuell klassificering av filinnehållet och kombinerar dessa metoder med hittade dokument, bilder eller dataenheter för att förbättra kategoriseringens noggrannhet. Andra lösningar tar det ett steg längre med maskininlärning och guidad inlärning med hjälp av exempeldokument, vilket gör att du kan definiera de klassificeringar som ska användas.

Ett dokument från personalavdelningen med hälso- eller försäkringsinformation kan t.ex. använda en policy för dataklassificering som baseras på exempeldata. För andra element, t.ex. ålder och plats, kan du tillämpa en riskpoäng och ytterligare behörigheter för att ytterligare definiera policyn.

Hur kan filanalys bidra till styrning och bevarande av data?

Filanalyslösningar erbjuder funktioner som hjälper organisationer att automatiskt vidta åtgärder på data, samt en omfattande verktygslåda för att styra och bevara data. Lösningarna innehåller vanligtvis följande alternativ, som styrs av företagets datastyrning:

  • Radera data. Om det inte finns något behov av att behålla filen, ta bort den. Är den för gammal? Är det en dubblett? Tillför den något värde för verksamheten? Har konsumenten begärt att hans eller hennes data ska förstöras? Filanalyslösningar upprätthåller en verifieringskedja för både vad du gjorde och varför du gjorde det.
  • Säkra uppgifterna. Om du behöver behålla uppgifterna ska du säkra dem. Vissa filanalyslösningar kan ändra åtkomstkontrollerna eller kryptera data. Ett annat alternativ är att flytta dem till en säker plats, t.ex. ett arkivhanteringsverktyg, för långsiktigt bevarande.
  • Redigera uppgifterna. Du kan behöva behålla en del av data, men inte PII. Vissa filanalyslösningar stöder redigering för att skapa en ren kopia av originalfilen utan PII-innehållet. Originalfilen raderas eller säkras sedan enligt beskrivningen ovan.

Vad är "manage-in-place"?

Hantera på plats är ett nyckelbegrepp för hantering och styrning av datalivscykeln. Det är "hur" metadata (inklusive plats, behörigheter och innehåll) analyseras av filanalyslösningen där den finns. Det faktiska objektet flyttas inte, kopieras inte eller lagras inte på en annan plats eller i ett annat bevarandeområde under analysen.

Förstå grammatiker för enheter

Två grundläggande typer av grammatiker (regeluppsättningar) för datautvinning används för att beskriva de enheter som du försöker identifiera: kuraterade och användargenererade.

Grammatikerna omfattar:

  • PII: Personligt identifierbar information, som kan skilja sig från region till region (inklusive format, vilket kan orsaka falska positiva resultat).
  • PHI: Personlig hälsoinformation, som vanligtvis förknippas med den nordamerikanska hälsoindustrin.
  • PCI: Personlig kreditkortsinformation.
  • PSI: Personlig säkerhetsinformation, för åtkomstnycklar till kontouppgifter.

Leta efter kurerade och optimerade grammatiker som inte kan ändras av användaren. Dessa grammatiker använder kontext och landmärken för mer exakta resultat och ger en "förtroendepoäng" som hjälper dig att filtrera bort falska positiva resultat. Kontexten och riktmärkena kan vara fraser, enstaka ord eller enskilda tecken.

Sammanhanget är nyckeln. Filanalyslösningar som använder närhet till enhetskandidaten och styrkan i sammanhanget (baserat på tekniker för bearbetning av naturligt språk) bidrar till förtroendepoäng. Du kan få mer detaljerade poäng genom att utnyttja omfattande listor över specifika enheter, länder eller regioner.

Inställning och flexibilitet. Om ingen av dessa grammatiker täcker ditt specifika användningsfall kan du använda en filanalyslösning som gör det möjligt att skapa anpassade grammatiker. Dessa grammatiker definieras vanligtvis genom att använda formatbeskrivande RegX eller enkla listor.

Vad är falska positiva resultat?

Per definition är ett "falskt positivt" ett testresultat som felaktigt indikerar förekomsten av ett visst tillstånd eller attribut1. När det gäller filanalyslösningar är ett falskt positivt resultat en matchning av ett mönster, en grammatik eller ett nyckelord som identifieras felaktigt under innehållsanalysen. Filanalyslösningar som helt enkelt använder mönster- eller nyckelordsmatchning har vanligtvis högre andel falska positiva resultat än de som har kontextuellt medvetna innehållsanalysfunktioner.

Skannade dokument och ljudinspelningar

Filanalyslösningar kan analysera textbaserade dokument för att upptäcka risker, men PII kan också finnas i andra former av data. Det blir allt vanligare att utföra filanalys på skannade dokument, inspelade samtal och videokonferensinspelningar. Vissa filanalyslösningar kan bearbeta dessa filer innan de tillämpar tekniker för upptäckt av PII.

Skannade pappersdokument som lagras som bilder (t.ex. i en PDF-fil) bör bearbetas med optisk teckenigenkänning (OCR) för att extrahera texten och helst även den tillhörande strukturinformationen. Många organisationer har skannade ID-dokument i sina register, t.ex. anställdas körkort eller pass.

Filanalyslösningar som stöder analys av ljud- eller videoinspelningar kräver bearbetning av en tal-till-text-motor som kan skapa en skriftlig utskrift för analys.

Fördelar med kontextuell, AI-driven innehållsanalys:

  • Ökar noggrannheten och upptäckten av känsliga och värdefulla data.
  • Minskar antalet falska positiva resultat.
  • Ökar effektiviteten genom AI-tränade kategoriseringar och minskar de manuella insatser som krävs för att klassificera data.

Fördelar med "manage-in-place"-modeller:

  • Data är lätta att hitta och finns där slutanvändarna förväntar sig att de ska finnas.
  • Minskar risken för dataförluster, produktivitetsförluster och störningar för slutanvändarna.
  • Ökar kostnadsbesparingarna och hastigheten genom att eliminera behovet av att överföra data över nätverket eller till molnet för att analysera dem.

Skillnaden mellan lokala lösningar och SaaS-lösningar för filanalys

Vad är en SaaS-lösning för filanalys?

Filanalys kan erbjudas via SaaS (Software as a Service), där kunden konsumerar tjänster som tillhandahålls av en leverantör av applikationssäkerhet mot en månads- eller årsavgift. Detta tillvägagångssätt kräver inte upphandling av hårdvara eller traditionell evig licensiering. Den förlitar sig helt eller delvis på att SaaS-leverantören (eller i vissa fall en managed service-leverantör) ger åtkomst till applikationen för att kunna utföra innehållsanalys, sökning, styrning och analys. SaaS är ett enkelt sätt att komma igång med innehållsanalys och erbjuder hög skalbarhet, snabbhet och snabb tid till värde. Beroende på var SaaS-värdsmiljön är placerad kan problem med dataresidens och datasuveränitet behöva vägas mot de kommersiella fördelarna med SaaS.

Vad är en lokal lösning för filanalys?

Filanalyslösningar kan också köras lokalt och drivas och underhållas av interna team. Detta tillvägagångssätt kräver att organisationerna tillhandahåller infrastruktur och personal samt förvärvar och hanterar lösningar för applikationssäkerhet. On-premises försäkrar organisationerna om att deras applikationsdata inte delas med tredje part och inte lämnar lokalerna. Vanligtvis säljs on-premise-lösningar genom en evig licens. På senare tid har abonnemangslicenser använts för att ge större flexibilitet i hur programvaran används och faktureras.

OpenText tillhandahåller verktyg för filanalys

Voltage File Analysis Suite från OpenText™ SaaS filanalyslösning gör det möjligt för organisationer att snabbt och effektivt minska informationsrisken, säkerställa datasekretess och analysera, optimera och säkra anställdas tillgång till kritisk data som driver och skyddar verksamheten. Vår lösning säkerställer hantering av datalivscykeln och styrning av dataåtkomst samtidigt som den minskar risken i samband med hantering av känslig data. File Analysis tillhandahåller också identitets- och åtkomststyrning, fullständig datasynlighet, minskade lagringskostnader, användbara analyser som förbättrar effektiviteten och datakvaliteten. Dessutom stöder File Analysis efterlevnad av dataskyddsbestämmelser och hanterar styrning av tillgångar med högt värde (t.ex. kontrakt, immateriella rättigheter, patent etc.) och känsliga data (t.ex. PI/PII, PCI, PHI etc.).

OpenText™ File Reporter inventerar nätverksfilsystem och levererar den detaljerade information om fillagring som du behöver för att optimera och säkra ditt nätverk för effektivitet och efterlevnad. Det gör att du kan identifiera åtkomstrisker när du upptäcker och analyserar filer och tillhörande behörigheter för data som lagras i hela företaget. File Reporter är konstruerad för rapportering av filsystem i företag och samlar in data från miljontals filer och mappar som är utspridda på de olika nätverkslagringsenheterna i ditt nätverk. Flexibla alternativ för rapportering, filtrering och frågor presenterar sedan exakt de resultat du behöver för att visa efterlevnad eller vidta korrigerande åtgärder.

OpenText™ File Dynamics tillhandahåller omfattande tjänster för att möta de växande kraven på hantering av nätverksdata. Identitetsdrivna policyer automatiserar uppgifter som traditionellt utförs manuellt, vilket leder till kostnadsbesparingar och en försäkran om att uppgifterna utförs korrekt. Målstyrda policyer ger skydd mot obehörig åtkomst samt migrering och rensning av data. File Dynamics skyddar också mot datakorruption och driftstopp genom säkerhetskopiering av högvärdiga mål, vilket möjliggör snabb återställning av filer och deras tillhörande behörigheter. File Dynamics levererar de rollbaserade åtkomstbegränsningar, åtgärder, riskreducering och proaktiv hantering som krävs för att följa reglerna för datahantering.

OpenText™ ControlPoint är en filanalyslösning som utnyttjar IDOL artificiell intelligens för analys av ostrukturerad data. Det gör det möjligt för organisationer att identifiera och automatiskt klassificera känsliga data (t.ex. PII, PCI, PHI); rensa upp äldre data; och avslöja risker som är dolda i mörka data som sitter ohanterade i e-postförvar, fildelning, SharePoint-webbplatser och molnförvar (t.ex. Office365, Google Drive och Dropbox). ControlPoint gör det också möjligt för organisationer att spara på lagringskostnader genom att minska överflödiga, föråldrade och triviala data. Detta ger bättre tillgång till värdefull information och verkställer databevarande genom att tillämpa policyer som hjälper till med datalivscykelhantering, regelefterlevnad och datasäkerhet.

Filanalys

Kom igång redan idag.

Begär en demo

Hur kan vi hjälpa till?

Fotnoter