O aprendizado de máquina é um subconjunto da inteligência artificial focado na criação de sistemas que podem aprender com dados históricos, identificar padrões e tomar decisões lógicas com pouca ou nenhuma intervenção humana. É um método de análise de dados que automatiza a criação de modelos analíticos por meio do uso de dados que abrangem diversas formas de informações digitais, incluindo números, palavras, cliques e imagens.
Os aplicativos de aprendizado de máquina aprendem com os dados de entrada e melhoram continuamente a precisão dos resultados usando métodos de otimização automatizados. A qualidade de um modelo de aprendizado de máquina depende de dois aspectos principais:
Quanto melhor for o modelo de aprendizado de máquina, mais precisamente ele poderá encontrar recursos e padrões nos dados. Isso, por sua vez, implica que suas decisões e previsões serão mais precisas.
Proteção sem precedentes que combina aprendizado de máquina e segurança de endpoint com caça a ameaças de classe mundial como um serviço.
Saiba maisPor que usar o aprendizado de máquina? A importância do aprendizado de máquina está crescendo devido aos volumes e à variedade cada vez maiores de dados, ao acesso e à acessibilidade do poder computacional e à disponibilidade de Internet de alta velocidade. Esses fatores de transformação digital possibilitam o desenvolvimento rápido e automático de modelos que podem analisar com rapidez e precisão conjuntos de dados extraordinariamente grandes e complexos.
Há uma infinidade de casos de uso aos quais o aprendizado de máquina pode ser aplicado para reduzir custos, mitigar riscos e melhorar a qualidade de vida em geral, incluindo a recomendação de produtos/serviços, a detecção de violações de segurança cibernética e a habilitação de carros autônomos. Com maior acesso a dados e poder de computação, o aprendizado de máquina está se tornando mais onipresente a cada dia e, em breve, será integrado a muitas facetas da vida humana.
Há quatro etapas principais que você deve seguir ao criar um modelo de aprendizado de máquina.
Os dados de treinamento são informações representativas dos dados que o aplicativo de aprendizado de máquina ingerirá para ajustar os parâmetros do modelo. Às vezes, os dados de treinamento são rotulados, o que significa que foram marcados para indicar classificações ou valores esperados que o modo de aprendizado de máquina deve prever. Outros dados de treinamento podem não ser rotulados, de modo que o modelo terá de extrair recursos e atribuir clusters de forma autônoma.
Para serem rotulados, os dados devem ser divididos em um subconjunto de treinamento e um subconjunto de teste. O primeiro é usado para treinar o modelo e o segundo para avaliar a eficácia do modelo e encontrar maneiras de melhorá-lo.
O tipo de algoritmo de aprendizado de máquina que você escolher dependerá principalmente de alguns aspectos:
Para casos de uso de previsão ou classificação, você normalmente usaria algoritmos de regressão, como regressão de mínimos quadrados comuns ou regressão logística. Com dados não rotulados, é provável que você confie em algoritmos de agrupamento, como k-means ou vizinho mais próximo. Alguns algoritmos, como redes neurais, podem ser configurados para trabalhar com casos de uso de clustering e previsão.
O treinamento do algoritmo é o processo de ajuste das variáveis e dos parâmetros do modelo para prever com mais precisão os resultados apropriados. O treinamento do algoritmo de aprendizado de máquina geralmente é iterativo e usa uma variedade de métodos de otimização, dependendo do modelo escolhido. Esses métodos de otimização não requerem intervenção humana, o que faz parte do poder do aprendizado de máquina. A máquina aprende com os dados que você fornece a ela, com pouca ou nenhuma orientação específica do usuário.
A última etapa é alimentar o modelo com novos dados como forma de melhorar sua eficácia e precisão ao longo do tempo. A origem das novas informações depende da natureza do problema a ser resolvido. Por exemplo, um modelo de aprendizado de máquina para carros autônomos receberá informações do mundo real sobre as condições da estrada, objetos e leis de trânsito.
O que é aprendizado de máquina supervisionado
Os algoritmos de aprendizado de máquina supervisionados usam dados rotulados como dados de treinamento, em que as saídas apropriadas para os dados de entrada são conhecidas. O algoritmo de aprendizado de máquina recebe um conjunto de entradas e as saídas corretas correspondentes. O algoritmo compara suas próprias saídas previstas com as saídas corretas para calcular a precisão do modelo e, em seguida, otimiza os parâmetros do modelo para melhorar a precisão.
O aprendizado de máquina supervisionado se baseia em padrões para prever valores em dados não rotulados. Ele é usado com mais frequência na automação, em grandes quantidades de registros de dados ou em casos em que há muitas entradas de dados que não podem ser processadas com eficiência por humanos. Por exemplo, o algoritmo pode detectar transações de cartão de crédito que provavelmente são fraudulentas ou identificar o cliente de seguro que provavelmente registrará um sinistro.
O que é aprendizado de máquina não supervisionado
O aprendizado de máquina não supervisionado é melhor aplicado a dados que não têm respostas estruturadas ou objetivas. Não há pré-determinação do resultado correto para uma determinada entrada. Em vez disso, o algoritmo deve entender a entrada e tomar a decisão apropriada. O objetivo é examinar as informações e identificar a estrutura dentro delas.
O aprendizado de máquina não supervisionado funciona bem com informações transacionais. Por exemplo, o algoritmo pode identificar segmentos de clientes que possuem atributos semelhantes. Os clientes desses segmentos podem, então, ser alvo de campanhas de marketing semelhantes. As técnicas populares usadas no aprendizado não supervisionado incluem mapeamento do vizinho mais próximo, mapas auto-organizáveis, decomposição de valor singular e agrupamento k-means. Os algoritmos são usados posteriormente para segmentar tópicos, identificar outliers e recomendar itens.
Aspecto |
Aprendizagem supervisionada |
Aprendizado não supervisionado |
Processo |
As variáveis de entrada e saída são fornecidas para treinar o modelo. |
Somente os dados de entrada são fornecidos para treinar o modelo. Nenhum dado de saída é usado. |
Dados de entrada |
Usa dados rotulados. |
Usa dados não rotulados. |
Algoritmos suportados |
Oferece suporte a algoritmos de regressão, algoritmos baseados em instâncias, algoritmos de classificação, redes neurais e árvores de decisão. |
Oferece suporte a algoritmos de agrupamento, algoritmos de associação e redes neurais. |
Complexidade |
Mais simples. |
Mais complexo. |
Subjetividade |
Objetivo. |
Subjetivo. |
Número de classes |
O número de classes é conhecido. |
O número de aulas é desconhecido. |
Principal desvantagem |
É difícil classificar dados massivos com aprendizado supervisionado. |
A escolha do número de clusters pode ser subjetiva. |
Objetivo principal |
Treine o modelo para prever a saída quando receber novas entradas. |
Encontre percepções úteis e padrões ocultos. |
Embora a funcionalidade de aprendizado de máquina já exista há décadas, foi a capacidade mais recente de aplicar e computar automaticamente cálculos matemáticos complexos envolvendo big data que lhe conferiu uma sofisticação sem precedentes. Atualmente, o campo de aplicação do aprendizado de máquina é vasto e vai desde a AIOps empresarial até o varejo on-line. Alguns exemplos do mundo real dos recursos de aprendizado de máquina atualmente incluem o seguinte:
À medida que os volumes de dados crescem, a capacidade de computação aumenta, a largura de banda da Internet se expande e os cientistas de dados aprimoram seus conhecimentos, o aprendizado de máquina continuará a impulsionar uma eficiência maior e mais profunda no trabalho e em casa.
Com as ameaças cibernéticas cada vez maiores que as empresas enfrentam atualmente, o aprendizado de máquina é necessário para proteger dados valiosos e manter os hackers fora das redes internas. Nosso principal software UEBA SecOps, ArcSight Intelligence , usa o aprendizado de máquina para detectar anomalias que podem indicar ações mal-intencionadas. Ele tem um histórico comprovado de detecção de ameaças internas, ataques de dia zero e até mesmo ataques agressivos de equipes vermelhas.
Detectar proativamente riscos internos, novos ataques e ameaças persistentes avançadas
Acelere a detecção e a resposta a ameaças com correlação em tempo real e SOAR nativo
Acelere a automação de testes com o poder da IA
Acelere a detecção de ameaças com insights de segurança úteis e acionáveis
Interset aumenta a inteligência humana com inteligência de máquina para fortalecer sua resiliência cibernética