Com todo o jargão em rápida evolução na indústria atualmente, é importante sermos capazes de diferenciar entre AI, aprendizado de máquina e aprendizagem profunda. A maneira mais fácil de pensar em seu relacionamento é visualizá-los como um modelo concêntrico, conforme ilustrado na figura ao lado neste post, com cada termo definido. Aqui, a AI – a ideia que veio primeiro – tem a maior área, seguida pelo machine learning – que floresceu mais tarde e é mostrado como um subconjunto da AI. Finalmente, o deep learning – que tem direcionado a explosão da inteligência artificial – se encaixa dentro de ambos.

O machine learning toma algumas das ideias centrais da AI e as concentra na resolução de problemas do mundo real com redes neurais concebidas para imitar a capacidade humana de tomada de decisão. O deep learning se concentra ainda mais estreitamente em um subconjunto de ferramentas e técnicas de machine learning, e as aplica para resolver qualquer problema que exija o “pensamento” – humano ou artificial.

O machine learning é adequado para domínios problemáticos normalmente encontrados na empresa, como fazer previsões com métodos de aprendizagem supervisionados (por exemplo, regressão e classificação) e descoberta de conhecimento com métodos não supervisionados (por exemplo, clustering). O deep learning é uma área de aprendizado de máquina que tem alcançado progresso significativo em determinadas áreas de aplicação que incluem reconhecimento de padrões, classificação de imagens, processamento de linguagem natural (PNL), condução autônoma, e assim por diante. Técnicas de aprendizagem de máquina como random forests e gradient boosting muitas vezes funcionam melhor no espaço do problema empresarial do que o deep learning.

O deep learning tenta aprender vários níveis de recursos de grandes conjuntos de dados com redes neurais de camadas múltiplas e tomar decisões preditivas para os novos dados. Isto indica duas fases no deep learning: primeiro, a rede neural é “treinada” com um grande número de dados de entrada; segundo, a rede neural treinada é usada para “inferência” projetada para fazer previsões com novos dados. Devido ao grande número de parâmetros e tamanho do conjunto de treinamento, a fase de treinamento requer enormes quantidades de poder de computação.

A figura abaixo resume os papéis do treinamento versus inferência na aprendizagem profunda:

Fonte: insideBIGDATA