技術主題

什麼是混沌工程?

以燈泡為重點的 IT 項目圖示

概述

詢問任何專案經理、開發人員或團隊負責人。在軟體開發生命週期中,有幾件事可能會出錯,例如故障、網路攻擊和系統中斷。意外的故障必然會發生,這可能會破壞整個過程,限制結果並浪費重要資源。

混沌工程

混沌工程是一門研究這些故障如何發生並提供説明避免它們的方法的學科。通過瞭解故障的根本原因,混沌工程師可以制定計劃來預防或減輕故障。

混沌工程不是要製造混沌;它是關於使用受控實驗來識別系統中的潛在故障點,以免它們引起問題。通過這樣做,混沌工程師可以主動防止中斷和其他中斷。

混沌工程到底是什麼?

混沌工程是有意識地將故障注入系統以測試其彈性的做法。目標是識別潛在的故障點,並在它們導致實際中斷或其他中斷之前對其進行糾正。

有很多方法可以在系統中製造混亂,但最重要的是有一個計劃。如果沒有計劃,很容易產生比您解決的問題更多的問題。在創建計劃時,您需要決定要測試的內容以及如何進行測試。一旦你有了計劃,你就可以開始實驗。

軟體開發人員可以輕鬆地將混沌工程引入他們的工作流程,使用 OpenText™ Professional Performance EngineeringOpenText™ Enterprise Performance Engineering.這些解決方案不僅能利用效能負載測試,還能直接在軟體中輕鬆執行其他混沌工程實驗。

通過在受控的非生產環境中創建這些事件,您可以測試系統的反應方式並識別任何潛在問題。

一旦確定了潛在的故障點,就可以開始努力緩解它們。這可能涉及添加監視或日誌記錄以幫助在問題發生時識別問題,或更改設計以使其更能抵禦故障。

什麼是混沌工程原理?

混沌工程的原則是:

  • 計劃:決定您要測試什麼以及如何測試。這裡的目標是建立一個假設。系統可能會出什麼問題?有哪些潛在弱點可以被利用?
  • 實驗:將故障注入系統,看看系統的反應。故障注入簡而言之就是將問題引入現有系統以暴露漏洞的過程。它基本上是一種習慣,故意將扳手「拋進」系統,看看會發生什麼。
  • 分析:使用實驗資料找出潛在故障點。
  • 緩解:如果您發現問題,您可以結束實驗,專注於緩解問題。否則,您可以擴大實驗規模,直到找到問題的癥結。

混沌工程有什麼好處?

那麼,為什麼任何公司都會故意破壞東西呢?暴露系統缺陷是使其更加健壯的必要條件。混沌工程可以説明您避免中斷和其他中斷。通過識別潛在的故障點並在它們引起問題之前進行糾正,您可以主動防止中斷。

此外,混沌工程還為客戶、業務和技術提供了多項優勢。主要好處是允許公司創造更強大的產品,這些產品將影響他們的底線並滿足客戶的期望。

混沌工程 (Chaos Engineering) 也稱為彈性測試,可協助企業遵守數位營運彈性法 (Digital Operational Resilience Act, DORA),其目的在於定期測試系統的彈性以評估弱點。

混沌工程與測試有何不同?

混沌工程在幾個關鍵方面與測試不同。混沌工程的重點是在潛在的故障點引起問題之前發現它們。另一方面,測試的重點是驗證系統是否按預期工作。簡而言之,混沌工程是主動的,而測試是被動的。

混沌工程師通過引入和糾正受控故障來防止中斷和其他中斷,以免它們在實時環境中引起問題。這些受控故障有助於確定系統的哪些部分更具彈性,哪些部分需要更多工作。測試只能驗證系統在完成後是否正常工作。

它與OpenText Professional Performance Engineering 有何相似之處?

OpenText Professional Performance Engineering是一種主要針對特定類型效能工程的工具。使用OpenText Professional Performance Engineering ,您可以部署先進的負載測試,模擬真實世界的使用條件,這可以幫助您在問題發生之前找出潛在的負載效能問題。

但OpenText Professional Performance Engineering 並非只是在穩定環境中執行負載測試的效能工程工具,而是將效能工程與混亂工程結合為一個平台的工具。

OpenText Professional Performance Engineering 可直接與 Gremlin 搭配使用,Gremlin 是知名的故障即服務 (FaaS) 平台,可讓您建立不同類型的混沌事件,例如 CPU 尖峰、網路延遲和磁碟故障。您可以直接在OpenText Professional Performance Engineering 內輕鬆組織和啟動 Gremlin 混沌實驗,並根據異常狀況執行負載測試。

總體而言,OpenText Professional Performance Engineering 可讓您在不同類型的混亂事件中主動預防負載中斷。透過在潛在故障點造成問題前找出它們,此工具可協助您節省時間、金錢和寶貴的資源。

以效能工程解決方案實現混沌工程

歸根結底,混沌工程是任何成功的軟體項目的動力。軟體開發人員可以實施混沌工程來執行經得起時間考驗的專案。

透過OpenText 與 Gremlin 和 Steadybit 的合作關係,OpenText 效能工程解決方案可以同時測試系統在負載和不同混亂事件下的效能,讓您能夠找到潛在的故障點,並主動糾正問題。

我們能提供什麼協助?

腳注