機器學習是人工智慧的一個子集,專注於構建可以從歷史數據中學習、識別模式並做出邏輯決策的系統,幾乎不需要人工干預。它是一種數據分析方法,通過使用包含各種形式的數字資訊(包括數位、文字、點擊和圖像)的數據來自動構建分析模型。
機器學習應用程式從輸入數據中學習,並使用自動優化方法不斷提高輸出的準確性。機器學習模型的質量取決於兩個主要方面:
機器學習模型越好,它就越能準確地找到數據中的特徵和模式。反過來,這意味著它的決策和預測將更加精確。
為什麼要使用機器學習?由於數據量和種類的增加、計算能力的可及性和可負擔性以及高速互聯網的可用性,機器學習的重要性與日俱增。這些數字化轉型因素使人們能夠快速、自動地開發模型,這些模型可以快速準確地分析非常大和複雜的數據集。
機器學習可以應用於多種用例,以降低成本、降低風險和提高整體生活品質,包括推薦產品/服務、檢測網路安全漏洞和啟用自動駕駛汽車。隨著對數據和計算能力的訪問越來越多,機器學習每天都變得越來越普遍,並將很快融入人類生活的許多方面。
創建機器學習模型時,需要遵循四個關鍵步驟。
訓練數據是代表機器學習應用程式將引入以優化模型參數的數據的資訊。訓練數據有時會被標記,這意味著它已被標記以調用機器學習模式需要預測的分類或期望值。其他訓練數據可能未標記,因此模型必須自動提取特徵並分配聚類。
對於標記,數據應分為訓練子集和測試子集。前者用於訓練模型,後者用於評估模型的有效性並找到改進方法。
您選擇的機器學習演算法類型主要取決於以下幾個方面:
對於預測或分類用例,您通常會使用回歸演算法,例如普通最小二乘回歸或邏輯回歸。對於未標記的數據,您可能會依賴聚類演算法,例如 k 均值或最近鄰。一些演算法(如神經網路)可以配置為同時處理聚類和預測用例。
訓練演算法是調整模型變數和參數以更準確地預測適當結果的過程。機器學習演算法的訓練通常是反覆運算的,並根據所選模型使用各種優化方法。這些優化方法不需要人工干預,這是機器學習功能的一部分。機器從你提供的數據中學習,幾乎沒有使用者的具體指導。
最後一步是向模型提供新數據,作為隨著時間的推移提高其有效性和準確性的一種手段。新資訊的來源取決於要解決的問題的性質。例如,自動駕駛汽車的機器學習模型將攝取有關道路狀況、物體和交通法規的真實資訊。
什麼是監督式機器學習
監督式機器學習演算法使用標記數據作為訓練數據,其中輸入數據的適當輸出是已知的。機器學習演算法引入一組輸入和相應的正確輸出。該演算法將自己的預測輸出與正確的輸出進行比較,以計算模型精度,然後優化模型參數以提高精度。
監督式機器學習依賴於模式來預測未標記數據的值。它最常用於自動化、大量數據記錄或數據輸入過多而人類無法有效處理的情況。例如,該演算法可以識別可能具有欺詐性的信用卡交易,或者識別最有可能提出索賠的保險客戶。
什麼是無監督機器學習
無監督機器學習最好應用於沒有結構化或客觀答案的數據。對於給定的輸入,沒有預先確定正確的輸出。相反,演算法必須理解輸入並形成適當的決策。目的是檢查資訊並識別其中的結構。
無監督機器學習在事務資訊上效果很好。例如,該演算法可以識別具有相似屬性的客戶群。然後,這些細分市場中的客戶可以通過類似的行銷活動成為目標。無監督學習中使用的流行技術包括最近鄰映射、自組織映射、奇異值分解和 k 均值聚類。這些演算法隨後用於細分主題、識別異常值和推薦專案。
方面 |
監督學習 |
無監督學習 |
過程 |
提供輸入和輸出變數來訓練模型。 |
僅向訓練模型提供輸入數據。不使用輸出數據。 |
輸入數據 |
使用標記的數據。 |
使用未標記的數據。 |
支援的演算法 |
支援回歸演算法、基於實例的演算法、分類演算法、神經網路和決策樹。 |
支援聚類演算法、關聯演算法和神經網路。 |
複雜性 |
簡單。 |
更複雜。 |
主觀性 |
目的。 |
主觀。 |
班級數 |
類數是已知的。 |
類數未知。 |
主要缺點 |
使用監督學習對海量數據進行分類是很困難的。 |
選擇集群數量可能是主觀的。 |
主要目標 |
訓練模型以在出現新輸入時預測輸出。 |
查找有用的見解和隱藏的模式。 |
雖然機器學習功能已經存在了幾十年,但最近應用和自動計算涉及大數據的複雜數學計算的能力賦予了它前所未有的複雜性。當今機器學習應用的領域非常廣泛,從企業 AIOps 到在線零售。當今機器學習功能的一些真實範例包括:
隨著數據量的增長、計算能力的提高、互聯網頻寬的擴展以及數據科學家專業知識的增強,機器學習只會繼續推動工作和家庭的更高、更深入的效率。
隨著當今企業面臨的網路威脅不斷增加,需要機器學習來保護有價值的資料並防止駭客入侵內部網路。我們一流的 UEBA SecOps 軟體, ArcSight Intelligence ,使用機器學習來檢測可能表明惡意操作的異常情況。它在檢測內部威脅、零時差攻擊甚至激進的紅隊攻擊方面擁有良好的記錄。
主動檢測內部風險、新型攻擊和高級持續性威脅
通過即時檢測和本機 SOAR 加速威脅檢測和回應
人工智慧驅動的測試自動化
Interset 利用機器智慧增強人類智慧,增強網路彈性
簡化日誌管理和合規性,同時加快取證調查