Aprendizagem de máquina é uma área de estudo que consiste em fazer com que as máquinas aprendam a partir da experiência. Essa experiência é representada por dados, e a partir desses dados, a máquina aprende a fazer previsões ou classificações.
Aprendizagem de máquina é uma área de estudo que está em constante crescimento e que está presente em diversas áreas do conhecimento. Por exemplo, a área de saúde utiliza aprendizagem de máquina para prever doenças, a área de finanças utiliza aprendizagem de máquina para prever o comportamento do mercado financeiro, a área de segurança utiliza aprendizagem de máquina para prever crimes, a área de marketing utiliza aprendizagem de máquina para prever o comportamento do consumidor, a área de engenharia utiliza aprendizagem de máquina para prever falhas em máquinas, a área de meteorologia utiliza aprendizagem de máquina para prever o tempo, a área de agronomia utiliza aprendizagem de máquina para prever a produtividade de culturas.
Um algoritmo de aprendizagem de máquina é um algoritmo que recebe dados e aprende a partir desses dados. A aprendizagem pode ser classificada em quatros tipos:
- Aprendizagem supervisionada
- Aprendizagem não supervisionada
- Aprendizagem por reforço
- Aprendizagem por semissupervisionada
Aprendizagem supervisionada é um tipo de aprendizagem em que os dados de entrada são rotulados. Por exemplo, se temos um conjunto de dados com a altura e o peso de pessoas, e queremos prever o sexo dessas pessoas, então temos um conjunto de dados de entrada com altura e peso, e um conjunto de dados de saída com o sexo.
Aprendizagem não supervisionada é um tipo de aprendizagem em que os dados de entrada não são rotulados. Por exemplo, se temos um conjunto de dados com a altura e o peso de pessoas, e queremos agrupar essas pessoas em grupos, então temos um conjunto de dados de entrada com altura e peso, mas não temos um conjunto de dados de saída.
Aprendizagem por reforço é um tipo de aprendizagem em que o algoritmo de aprendizagem de máquina recebe uma recompensa ou uma punição a cada ação que ele toma. Por exemplo, se temos um robô que precisa aprender a andar, então o robô recebe uma recompensa a cada passo que ele dá, e uma punição a cada passo que ele dá errado.
Aprendizagem por semissupervisionada é um tipo de aprendizagem em que temos um conjunto de dados rotulados e um conjunto de dados não rotulados. Por exemplo, se temos um conjunto de dados com a altura e o peso de pessoas, e queremos prever o sexo dessas pessoas, e temos um conjunto de dados com a altura e o peso de outras pessoas, e queremos agrupar essas pessoas em grupos, então temos um conjunto de dados de entrada com altura e peso, e um conjunto de dados de saída com o sexo, e um conjunto de dados de entrada com altura e peso, mas não temos um conjunto de dados de saída.
Um modelo de aprendizagem de máquina é um modelo que representa o conhecimento que o algoritmo de aprendizagem de máquina aprendeu a partir dos dados. Por exemplo, se temos um conjunto de dados com a altura e o peso de pessoas, e queremos prever o sexo dessas pessoas, então o modelo de aprendizagem de máquina é uma função que recebe a altura e o peso de uma pessoa, e retorna o sexo dessa pessoa.
Nessa parte do curso, veremos uma introdução a machine learning. Os topicos que veremos são:
- Introdução a aprendizagem de máquina
- Método KNN (K-Nearest Neighbors)
- Avaliação de modelos de aprendizagem de máquina
- Otimização de hiperparâmetros
- Validação cruzada