기술 주제

AIOps란 무엇인가요?

물음표에 초점을 맞춘 IT 항목의 일러스트레이션

개요

AIOps는 IT 운영을 위한 인공 지능의 일반적인 약식 명칭입니다. AIOps의 다른 이름으로는 ITOA(IT 운영 분석), 고급 운영 분석, ITOM용 AI, IT 데이터 분석, 인지 운영 등이 있습니다.

AIOps는 IT 운영 데이터에 빅데이터 분석, AI, 머신러닝을 다층적으로 적용하는 것입니다. 목표는 IT 운영을 자동화하고, 패턴을 지능적으로 식별하며, 일반적인 프로세스와 작업을 보강하고, IT 문제를 해결하는 것입니다.

서비스 관리, 성능 관리 및 자동화를 통합함으로써 AIOps는 조직이 지속적인 인사이트와 개선을 실현할 수 있도록 지원합니다. 애플리케이션 및 하드웨어 시스템의 성능과 안정성을 모니터링 및 관리하고, 비정상적인 문제를 감지하고, 부하 변화에 적응하고, 장애를 처리하고, 중단을 최소화하면서 선제적으로 조정할 수 있습니다.

AIOps

AIOps 정의

AIOps는 IT 운영을 위한 인공 Intelligence 의 약자입니다. 애플리케이션과 하드웨어 시스템의 성능과 안정성을 모니터링 및 관리하고, 비정상적인 문제를 감지하고, 부하 변화에 적응하고, 장애를 처리하고, 서비스 중단 없이 또는 최소화하면서 선제적으로 또는 신속하게 조정하기 위한 머신 러닝과 AI를 포함한 고급 분석입니다. AIOps의 다른 이름으로는 ITOA(IT 운영 분석), 고급 운영 분석, ITOM용 AI, IT 데이터 분석, 인지 운영 등이 있습니다.

AIOps는 IT 운영 데이터에 적용된 빅데이터 분석과 머신러닝을 다층적으로 사용하는 것입니다. 목표는 IT 운영을 자동화하고, 패턴을 지능적으로 식별하며, 일반적인 프로세스와 작업을 보강하고, IT 문제를 해결하는 것입니다. AIOps는 서비스 관리, 성능 관리, 이벤트 관리, 자동화를 통합하여 지속적인 인사이트와 개선을 실현합니다.

업계 분석가들은 AIOps 플랫폼이 제공해야 하는 일련의 기능을 정의했습니다. 여기에는 다음이 포함됩니다:

  • 네트워크, 애플리케이션, 데이터베이스, 도구, 클라우드 등 다양한 소스에서 데이터를 수집하고 집계하며, 메트릭, 이벤트, 인시던트, 변경 사항, 토폴로지, 로그 파일, 구성 데이터, KPI, 스트리밍 및 소셜 미디어 게시물과 같은 비정형 데이터, 문서(자연어 처리) 등 다양한 형태의 데이터도 수집할 수 있습니다.
  • 데이터를 관리하고, 분석 및 보고에 액세스할 수 있는 단일 위치에 데이터를 저장하며, 인덱싱 및 만료와 같은 기능도 포함합니다.
  • 패턴 탐지, 이상 징후 탐지, 예측 분석 등 머신 러닝을 통해 데이터를 분석합니다.
  • 중요한 알림을 '노이즈'와 분리하세요.
  • 실시간 처리와 함께 데이터를 상호 연관시키고 문맥을 파악하여 문제를 파악하세요.
  • 여러 모니터링 도구와 기타 투자를 통합하는 전략적 오버레이 역할을 합니다.
  • 대응 및 수정의 자동화 및 오케스트레이션으로 지식을 체계화하세요.
  • 향후 문제 처리 및 해결을 개선하기 위한 지속적인 학습.

AIOps가 필요한 이유는 무엇인가요?

많은 조직이 정적이고 이질적인 현장 시스템에서 리소스를 지속적으로 확장하고 재구성하는 온프레미스, 퍼블릭 클라우드, 프라이빗 클라우드 및 관리형 클라우드 환경의 보다 동적인 조합으로 전환하고 있습니다.

더 많은 디바이스(특히 Internet of Things, 또는 IoT), 시스템 및 애플리케이션이 IT가 모니터링해야 할 데이터의 쓰나미를 제공하고 있습니다. 예를 들어 10,000개의 서버 또는 가상 머신이 있고 분당 100개의 메트릭을 모니터링하는 경우 시간당 6천만 개의 데이터 포인트가 있습니다. 

IT 운영팀에서 처리해야 하는 데이터의 폭증을 사람이 처리할 수는 없습니다. IT 팀은 다양한 문제를 적시에 해결하기 위해 우선순위를 정할 수 없습니다. 대량의 알림이 넘쳐나고, 그 중 상당수는 중복되는 알림입니다. 이로 인해 중요하지 않은 알림의 소음으로 인해 중요한 알림이 무시되는 알림 피로가 발생할 수 있습니다. 이는 사용자 및 고객 경험에 부정적인 영향을 미칩니다.

기존의 IT 관리 솔루션은 이 방대한 양을 따라잡을 수 없습니다. 이러한 솔루션은 정보의 바다에서 메트릭과 이벤트를 지능적으로 선별할 수 없습니다. 상호 의존적이지만 분리된 환경 전반에서 데이터를 상호 연관시킬 수 없습니다. IT 운영팀이 문제에 신속하게 대응하는 데 필요한 예측 분석과 실시간 인사이트를 제공할 수 없습니다.

영향이 큰 가동 중단 및 기타 IT 운영 문제를 더 빠르게 식별, 해결, 예방하기 위해 조직은 AIOps로 눈을 돌리고 있습니다. AIOps를 통해 IT 운영팀은 훨씬 적은 노력으로 중단 및 속도 저하에 신속하고 능동적으로 대응할 수 있습니다. 한편으로는 역동적이고 다양하며 까다로운 IT 환경과 다른 한편으로는 시스템 가용성 및 성능의 중단을 최소화하거나 아예 없애고자 하는 사용자의 기대 사이의 간극을 메워줍니다.


AIOps의 이점은 무엇인가요?

AIOps가 IT 운영에 가져다주는 이점은 다음과 같습니다:

  • 인프라 및 용량을 보다 효율적으로 사용하세요.
  • 변경과 성과 간의 상관관계가 개선되고 기타 변경 관리 효율성이 향상됩니다.
  • 이상 징후 탐지를 통해 고객이 영향을 받기 전에 문제를 예방하세요.
  • 보다 빠른 근본 원인 분석(RCA)을 통해 문제를 정확히 찾아내거나 인시던트 발생 시 운영자가 살펴봐야 하는 항목 수를 줄여보세요.
  • 필수 IT 시스템의 평균 문제 탐지 시간(MTTD)과 평균 문제 해결 시간(MTTR)을 단축하세요.
  • IT 환경에 대한 뷰를 통합하세요.
  • 어떤 워크로드가 비용을 유발하는지에 대한 인사이트를 얻으세요.
  • 비용이 많이 드는 중단을 줄이세요.
  • 기존 인프라, 퍼블릭 클라우드, 프라이빗 클라우드 및 하이브리드 클라우드를 지원합니다.
  • 새로운 IT 서비스 제공 시간을 단축하세요.

직원 및 고객 경험의 이점은 다음과 같습니다:

AIOps는 일반적으로 네트워크 최적화를 통해 IT 서비스 품질을 개선하고, IT 운영과 IT 운영 팀을 현대화하며, 문제 해결을 넘어 시간이 지남에 따라 IT 시스템과 운영을 개선합니다.

이를 통해 서비스 품질과 고객 만족도를 개선하고 고객 이탈을 줄이는 동시에 기존 수작업 방식의 IT 운영 관리보다 비용을 크게 절감할 수 있습니다.


AIOps의 3단계

IT 인시던트 탐지

IT 인시던트가 발생하거나 발생한 경우 이를 식별하고 보고하세요.

  • 기록 분석
  • 성능 분석
  • 병목 현상 찾기
  • 과부하가 걸린 디바이스 표시
  • 서비스 장애 찾기
  • 다양한 이벤트, 로그, 메트릭의 상호 연관성 및 컨텍스트화

IT 인시던트 예측

잠재적인 IT 사고를 식별하고 사용자에게 영향을 미치기 전에 보고하세요.

  • 이상 징후 탐지
  • 변경 영향 분석
  • 사용자에게 영향을 미치기 전에 오류, 과부하 또는 기타 장애 조건 예측
  • 용량 관리

IT 인시던트 완화

IT 인시던트를 자동으로 수정하거나 사람에게 보고서를 보내 문제를 더 쉽게 해결할 수 있도록 하세요.

  • 근본 원인 분석
  • 자동 또는 보조 예측 유지보수
  • 네트워크 최적화 자동화 또는 지원
  • 증강 기술 지원

AIOps를 시작하는 방법

AIOps를 진행하기로 결정하면 두 가지 주요 경로가 있습니다:

각각의 장단점이 있지만, 나만의 자동차를 만들기 위해 훌륭한 엔진을 구입하거나 빠른 자동차를 구입하는 것과 비슷합니다. 어떤 것을 원하는지 생각해 보세요.

나만의 AIOps 솔루션 구축

빠른 임베디드 AIOps 엔진으로 자체 엔진을 구축할 수 있는 이유는 다음과 같습니다:

  • 고유한 IT 환경이나 비정형적인 요구 사항이 있습니다.
  • AIOps를 더 광범위한 회사 AI 프로젝트에 통합하려고 합니다.
  • 숙련된 IT, 데이터 과학 및 소프트웨어 엔지니어링 부서를 보유하고 있습니다.
  • 통신과 같은 산업에 중점을 둔 다른 회사에 AIOps 솔루션을 구축하여 판매하고자 합니다.

OpenText™ Vertica™ 데이터 플랫폼은 특정 산업이나 지역에 맞게 커스터마이징된 AI옵스 솔루션을 판매하는 많은 AI옵스 솔루션 회사 내부의 강력한 데이터 분석 엔진입니다.

예를 들면 다음과 같습니다:

즉시 사용 가능한 AIOps 솔루션 구매하기

사전 패키지로 제공되는 즉시 사용 가능한 AIOps 솔루션을 구매해야 하는 이유:

  • 공급업체의 전문성을 활용하고 싶습니다.
  • 더 빠르게 성장하고 싶지만 직접 구축할 시간이 없습니다.
  • IT 운영이 아닌 회사의 핵심 역량에 전문가를 집중시키고자 합니다.
  • 소프트웨어에 대한 지속적인 지원을 제공하고 싶지 않습니다.

OpenText™ Operations Bridge 는 모든 데이터 유형에 걸쳐 모든 장치, 운영 체제, 데이터베이스, 애플리케이션 또는 서비스에 대한 멀티 클라우드 및 온프레미스 리소스의 상태와 성능을 자동으로 모니터링하고 분석하는 엔터프라이즈 이벤트 및 성능 관리 소프트웨어입니다.

AIOps 기술이 고객 경험과 궁극적으로 매출에 영향을 미치는 서비스 안정성 문제에서 앞서 나갈 수 있는 속도와 확장성을 제공하는 방법을 알아보세요.


AIOps 성공 사례

노이즈를 줄이기 위한 AI 기반 상관관계를 제공하는 AIOps 플랫폼

포르투갈 최대 통신 및 엔터테인먼트 그룹인 NOS는 머신 러닝과 알고리즘을 사용하여 이벤트 스트림의 패턴을 분석하고 이러한 패턴을 사용하여 동일한 문제에서 비롯되었을 가능성이 높은 이벤트를 그룹화함으로써 AI 기반 자동 이벤트 상관관계(AEC)를 통해 노이즈와 사실을 구분할 수 있도록 AIOps를 지원합니다. 이러한 그룹화를 통해 운영자는 집중적으로 이벤트를 처리할 수 있습니다. 모든 관련 이벤트가 AEC에 의해 그룹화되어 표시되므로 근본 원인을 쉽게 파악하고 해결할 수 있습니다.

자동화된 IT 모니터링 솔루션을 지원하는 AIOps

프랑스의 IT 서비스 제공업체인 NXO France는 AIOps를 사용하여 혁신적인 자동화된 IT 모니터링 솔루션을 구축 및 배포하여 NXO 고객이 사용하는 역동적이고 복잡한 네트워크를 완전하고 정확하게 파악하고 수천 개의 즉시 사용 가능한 작업으로 문제 해결 작업을 자동화합니다.

AIOps를 통한 사전 예방적 문제 해결, 서비스 품질 개선, 의사 결정 프로세스 개선

터키 텔레콤은 터키의 선도적인 정보 통신 기술 회사입니다. 이 회사는 AIOps를 사용하여 즉각적인 영향 분석과 문제의 근본 원인을 감지하는 알고리즘을 자동으로 실행하는 기능을 제공하고 그 결과를 실시간으로 모니터링합니다. "우리는 비즈니스의 다른 영역에서 OpenText 와 파트너 관계를 맺고 있으며, AIOps 솔루션 제품군이 이 프로젝트에 도움이 될 것이라고 생각했습니다."

어떻게 도와드릴까요?

각주