Inteligência artificial: o que é aprendizado supervisionado de máquina?

Em Tecnologias inovadoras por André M. Coelho

A inteligência artificial tem como um de seus aspectos a capacidade de aprender. Pra realizar esse aprendizado, a inteligência artificial pode fazê-lo através da aprendizagem supervisionada, que é o tipo de aprendizagem que ocorre quando as instâncias de treinamento são rotuladas com o resultado correto, o que dá feedback sobre como a aprendizagem está progredindo. Isso é semelhante a ter um supervisor que pode dizer ao empregado se ele estava correto ou não ao realizar uma certa tarefa. Na aprendizagem não supervisionada, o objetivo é mais difícil porque não há categorizações pré-determinadas. Vamos entender mais a fundo cada uma delas.

Aprendizado de máquina supervisionada: conceito e funcionamento

Aprendizagem supervisionada é bastante comum em problemas de classificação porque o objetivo é muitas vezes para fazer o computador aprender um sistema de classificação criado. Reconhecimento de dígitos é um exemplo comum de aprendizagem de classificação. De um modo mais geral, a aprendizagem de classificação é apropriada para qualquer problema em que a classificação é útil fácil de determinar. Em alguns casos, pode nem sequer ser necessário dar classificações pré determinadas a cada instância de um problema se o agente puder elaborar as classificações para si mesmo. Este seria um exemplo de aprendizagem não supervisionada em um contexto de classificação.

A aprendizagem supervisionada é a técnica mais comum para o treinamento de redes neurais e árvores de decisão na inteligência artificial. Ambas as técnicas são altamente dependentes da informação dada pelas classificações pré determinadas. No caso das redes neurais, a classificação é usada para determinar o erro da rede e, em seguida, ajustar a rede para minimizar os erros; e em árvores de decisão, as classificações são usadas para determinar quais atributos fornecem a maior informação que pode ser usada para resolver o enigma de classificação. Para nossa explicação, deve ser suficiente saber que ambos os exemplos prosperam em ter alguma supervisão na forma de classificações pré-determinadas.

Funcionamento do aprendizado não supervisionado

A aprendizagem de máquina supervisionada é utilizada para reduzir os erros nos processos pelos quais as inteligências artificiais passam, criando então uma máquina mais eficiente para realizar seu trabalho. (Foto: Toptal)

O objetivo do algoritmo de aprendizagem é minimizar o erro em relação às entradas fornecidas. Estas entradas, muitas vezes chamadas de conjunto de treinamento, são os exemplos dos quais o agente tenta aprender. Mas aprender o treinamento não é necessariamente a melhor coisa a fazer. Por exemplo, se eu tentasse te ensinar exclusivamente algo para a máquina, mas apenas mostrasse combinações consistindo de um verdadeiro e um falso, e nunca ambos falsos ou ambos verdadeiros, a máquina pode aprender a regra de que a resposta é sempre verdadeira. Da mesma forma, com algoritmos de aprendizado, um problema comum é o ajuste exagerado dos dados e essencialmente a memorização do conjunto de treinamento ao invés de aprender uma técnica de classificação mais geral.

Como você pode imaginar, nem todos os conjuntos de treinamento tem os inputs classificados corretamente. Isso pode levar a problemas se o algoritmo usado é poderoso o suficiente para memorizar até mesmo os aparentemente casos especiais que não se encaixam nos princípios mais gerais. Isso também pode levar a um excesso de capacidade e é um desafio encontrar algoritmos que sejam suficientemente poderosos para aprender funções complexas e suficientemente robustas para produzir resultados generalizáveis.

Aprendizado de máquina não supervisionado: conceito e funcionamento

A aprendizagem não supervisionada parece muito mais difícil: o objetivo é fazer com que o computador aprenda a fazer algo que não lhe dizemos como fazer. Na verdade, existem duas abordagens para a aprendizagem não supervisionada. A primeira abordagem é ensinar ao agente não dando categorizações explícitas, mas usando algum tipo de sistema de recompensa para indicar o sucesso. Note-se que este tipo de treinamento geralmente se encaixa na estrutura do decisões porque o objetivo não é produzir uma classificação, mas sim tomar decisões que maximizem recompensas. Esta abordagem generaliza muito melhor para o mundo real, onde os agentes podem ser recompensados por fazer certas ações e punidos por fazer outras.

Muitas vezes, uma forma de aprendizado de reforço pode ser usada para a aprendizagem sem supervisão, onde o agente baseia suas ações nas recompensas e punições anteriores, sem necessariamente aprender qualquer informação sobre as formas exatas em que suas ações afetam o mundo. De certa forma, toda essa informação é desnecessária porque, ao aprender uma função de recompensa, o agente simplesmente sabe o que fazer sem qualquer processamento, pois sabe a recompensa exata que espera alcançar por cada ação que poderia realizar. Isso pode ser extremamente benéfico nos casos em que o cálculo de cada possibilidade é muito demorado, mesmo que todas as probabilidades de transição entre os estados fossem conhecidas. Por outro lado, pode ser muito demorado aprender por esse processo de tentativa e erro. Mas este tipo de aprendizagem pode ser poderoso porque não assume nenhuma classificação prévia de exemplos. Em alguns casos, por exemplo, as classificações podem não ser as melhores possíveis, dando resultados abaixo do esperado.

Um segundo tipo de aprendizagem não supervisionada é chamado de clustering/agrupamento. Neste tipo de aprendizagem, o objetivo não é maximizar uma função de utilidade, mas simplesmente encontrar semelhanças nos dados de treinamento. A suposição é muitas vezes que os clusters/agrupamentos descobertos corresponderão razoavelmente bem com uma classificação intuitiva. Por exemplo, agrupar indivíduos com base em dados demográficos pode resultar em um agrupamento dos ricos em um grupo e os pobres em outro.

Embora o algoritmo não tenha nomes para atribuir a esses clusters, ele pode produzi-los e, em seguida, usar esses clusters para atribuir novos exemplos em um ou outro dos clusters. Esta é uma abordagem baseada em dados que pode funcionar bem quando há dados suficientes; Por exemplo, algoritmos de filtragem de informações sociais, baseiam-se no princípio de encontrar grupos semelhantes de pessoas e, em seguida, atribuir novos usuários a grupos. Em alguns casos, como com a filtragem de informações sociais, as informações sobre outros membros de um cluster podem ser suficientes para que o algoritmo produza resultados significativos. Em outros casos, pode ser que os clusters sejam meramente uma ferramenta útil para um analista humano. Infelizmente, mesmo o aprendizado sem supervisão sofre com o problema de sobrecarregar os dados de treinamento. Qualquer algoritmo que pode aprender com suas entradas deve ser bastante poderoso.

Aprendizado supervisionado e não supervisionado de máquinas: conclusões

Aprendizagem sem supervisão produziu muitos sucessos, como inteligências artificiais capazes de aprender a jogar jogos complexos e até mesmo máquinas capazes de dirigir carros. Pode ser uma técnica poderosa quando há uma maneira fácil de atribuir valores às ações. Clustering ou agrupamento pode ser útil quando há dados suficientes para formar clusters, embora isso às vezes seja difícil, e especialmente quando dados adicionais sobre membros de um cluster podem ser usados para produzir resultados adicionais devido a dependências nos dados.

A aprendizagem de classificação é poderosa quando se sabe que as classificações são corretas ou quando as classificações são simplesmente coisas arbitrárias que gostaríamos que o computador fosse capaz de reconhecer para nós. A aprendizagem de classificação é muitas vezes necessária quando as decisões tomadas pelo algoritmo serão necessárias como entrada em outro lugar. Caso contrário, não seria fácil para quem exige essa entrada para descobrir o que significa.

Ambas as técnicas podem ser valiosas e qual você escolher deve depender das circunstâncias: que tipo de problema está sendo resolvido, quanto tempo é alocado para resolvê-lo, pois a aprendizagem supervisionada ou agrupamento é muitas vezes mais rápido do que técnicas de aprendizagem de reforço, e se a aprendizagem de máquina supervisionada é mesmo possível.

Ficou alguma dúvida? Deixe nos comentários suas perguntas, e teremos o prazer em responder!

Sobre o autor

Engenheiro eletricista, André sempre foi interessado em novas tecnologias. Na primeira década dos anos 2000, atuou como consultor tecnológico em empresas, ajudando as empresas a escolherem as melhores tecnologias para suas necessidades. Desde então, continuou estudando o assunto e hoje compartilha o que aprendeu e continua aprendendo através do site Tecnologia É.

Veja também