技術主題

什麼是 AIOps?

以問號為重點的 IT 項目圖示

概述

AIOps 是 IT 運營人工智慧的通用簡稱。AIOps 的其他名稱包括 IT 運營分析 (ITOA)、高級運營分析、面向 ITOM 的 AI、IT 資料分析和認知運營。

AIOps 是大數據分析、人工智慧和機器學習對 IT 運營數據的多層應用。目標是實現 IT 運營自動化,智慧地識別模式,增強常見流程和任務,並解決 IT 問題。

通過將服務管理、績效管理和自動化結合在一起,AIOps 幫助組織實現持續的洞察和改進。它可以監控和管理應用程式和硬體系統的性能和可靠性,檢測異常問題,適應負載變化,處理故障,並以最小的中斷進行主動調整。

AIOps

定義 AIOps

AIOps 代表人工Intelligence 用於 IT 營運。它是包括機器學習和人工智慧在內的高級分析,用於監控和管理應用程式和硬體系統的性能和可靠性、檢測異常問題、適應負載變化、處理故障以及主動或快速調整,而不會造成服務中斷或服務中斷程度最小。 AIOps 的其他名稱包括 IT 營運分析 (ITOA)、高階營運分析、ITOM 人工智慧、IT 數據分析和認知營運。

AIOps 是應用於 IT 運營數據的大數據分析和機器學習的多層使用。目標是實現 IT 運營自動化,智慧識別模式,增強常見流程和任務,並解決 IT 問題。AIOps 將服務管理性能管理、事件管理和自動化結合在一起,以實現持續的洞察和改進。

行業分析師定義了 AIOps 平臺應提供的一組功能。這些包括:

  • 從許多來源收集和聚合數據,例如:網路、應用程式、資料庫、工具和雲,以及各種形式的數據,包括指標、事件、事件、更改、拓撲、日誌檔、配置數據、KPI、流和非結構化數據,如社交媒體帖子和文檔(自然語言處理)。
  • 管理數據,將數據存儲在可進行分析和報告的單個位置,還包括索引和過期等功能。
  • 通過機器學習分析數據,包括模式檢測、異常檢測和預測分析。
  • 將重要警報與「噪音」分開。
  • 將數據關聯起來並置於情境中,並即時處理以識別問題。
  • 作為戰略疊加層,聚合了多種監控工具和其他投資。
  • 將知識編入回應和補救的自動化和編排中。
  • 不斷學習,以改進未來問題的處理和解決。

為什麼需要 AIOps?

許多組織已經從靜態的、不同的現場系統過渡到更動態的本地、公共雲、私有雲和託管雲環境的組合,在這些環境中,資源不斷擴展和重新配置。

更多設備(最值得注意的是 Internet of Things或IoT),系統和應用程式正在提供IT需要監控的海嘯數據。例如,如果你有 10,000 台伺服器或 VM,並且每分鐘監視 100 個指標,則每小時有 6000 萬個數據點。 

沒有人可以處理 IT 運營部門預期要處理的數據爆炸式增長。IT 團隊無法及時確定不同問題的優先順序。它們被大量警報淹沒,其中許多是多餘的。這可能會導致警報疲勞,其中重要的警報可能會由於不重要警報的所有噪音而被忽略。這會對用戶和客戶體驗產生負面影響。

傳統的IT管理解決方案無法跟上這一數量。他們無法從資訊海洋中智慧地篩選指標和事件。它們無法在相互依賴但獨立的環境中關聯數據。它們無法提供 IT 運營所需的預測性分析和即時洞察,以足夠快地響應問題。

為了更快地識別、解決和防止高影響中斷和其他IT運營問題,組織正在轉向AIOps。AIOps 使 IT 運營團隊能夠快速、主動地響應中斷和速度變慢,同時花費更少的精力。它彌合了動態、多樣化和困難的IT環境與使用者對系統可用性和性能最小或沒有中斷的期望之間的差距。


AIOps 有哪些優勢?

AIOps 對 IT 運營的好處包括:

  • 更有效地利用基礎設施和容量
  • 在變更與績效之間建立更好的關聯性,並提高變更管理效率。
  • 通過 異常檢測在客戶受到影響之前防止出現問題。
  • 通過更快的根本原因分析 (RCA) 查明問題或減少操作員在事件發生時必須查看的項目數量。
  • 在基本 IT 系統中實現更快的平均問題檢測時間 (MTTD) 和平均解決問題時間 (MTTR)。
  • 統一IT環境檢視
  • 深入瞭解哪些工作負載會增加成本。
  • 減少代價高昂的中斷。
  • 支援傳統基礎架構、公有雲、私有雲和混合雲。
  • 更快地交付新的IT服務。

對員工和客戶體驗的好處包括:

由於網路的優化,AIOps 通常會提高 IT 服務的品質,它使 IT 運營和 IT 運營團隊現代化,不僅僅是解決問題,而是改進,使 IT 系統和運營隨著時間的推移變得更好。

所有這些都將提高服務品質、客戶滿意度並減少客戶流失,同時與更多的手動IT運營管理方法相比,顯著節省成本。


AIOps 的三個階段

檢測IT事件

在發生或已經發生的IT事件時識別並報告這些事件。

  • 歷史分析
  • 性能分析
  • 查找瓶頸
  • 顯示哪些設備過載
  • 查找服務故障
  • 將各種事件、日誌和指標關聯並置於上下文中

預測 IT 事件

識別潛在的 IT 事件,並在它們影響使用者之前進行報告。

  • 異常檢測
  • 變更影響分析
  • 在故障、過載或其他故障情況影響使用者之前對其進行預測
  • 容量管理

緩解IT事件

自動修復IT事件或向人員發送報告,使他們更輕鬆地解決問題。

  • 根本原因分析
  • 自動化或輔助預測性維護
  • 自動化或輔助網路優化
  • 增強技術支援

如何開始使用 AIOps

當您決定繼續使用 AIOps 時,有兩條主要路徑:

每種方法都有優點和缺點,但它們大致相當於購買一台出色的發動機來製造自己的汽車或購買一輛快速的汽車。考慮一下你想做什麼。

構建您自己的 AIOps 解決方案

您可以使用快速嵌入式 AIOps 引擎建構自己的引擎的原因包括:

  • 您具有獨特的 IT 環境或非典型需求。
  • 你希望將 AIOps 合併到更廣泛的公司 AI 專案中。
  • 您擁有一支技術嫻熟的IT、數據科學和軟體工程部門。
  • 您希望構建 AIOps 解決方案並將其銷售給專注於某個行業(例如電信)的其他公司。

OpenText™ Vertica™ 資料平台是許多銷售 AIOps 解決方案的 AIOps 解決方案公司內部強大的資料分析引擎,通常針對特定產業或地理位置進行客製化。

範例包括:

購買開箱即用的 AIOps 解決方案

購買預打包的開箱即用 AIOps 解決方案的原因:

  • 您希望利用供應商的專業知識。
  • 你想更快地提升,也就是說你沒有時間建立自己的。
  • 您希望將專家的重點放在公司的核心競爭力上,而不是 IT 運營上。
  • 您不希望為軟體提供持續支援。

OpenText™ Operations Bridge是一款企業事件和效能管理軟體,可自動監控和分析所有資料類型的任何裝置、作業系統、資料庫、應用程式或服務的多雲和本地資源的運作狀況和效能。

探索 AIOps 技術如何提供速度和規模,以領先於影響客戶體驗並最終影響收入的服務可靠性問題。


AIOps 成功案例

AIOps 平臺提供基於 AI 的關聯以降低雜訊

AIOps 説明葡萄牙最大的通信和娛樂集團 NOS 通過使用基於人工智慧的自動事件關聯 (AEC) 來區分雜訊和事實 ,使用機器學習和演算法來分析事件流中的模式,並使用這些模式將事件組合在一起,這些事件很有可能起源於同一個問題。此分組支援對操作員進行集中事件處理。它顯示按 AEC 分組在一起的所有相關事件,從而更容易識別和解決根本原因。

AIOps 協助自動化 IT 監控解決方案

法國IT服務提供者NXO France使用AIOps構建和部署創新的自動化IT監控解決方案 ,以完整準確地瞭解NXO客戶使用的動態和複雜網路,並通過數千個開箱即用的操作自動執行補救行動任務。

借助 AIOps 主動解決問題、提高服務品質和更好的決策流程

土耳其電信是土耳其領先的資訊和通訊技術公司。他們使用 AIOps 提供即時影響分析,並能夠自動運行演算法來檢測問題的根本原因,並即時監控結果。 “我們與合作夥伴OpenText 在我們業務的其他領域,我們認為 AIOps 解決方案套件將使該專案受益。

我們能提供什麼協助?

腳注