Introdução Machine Learning
1
Aula de Hoje
O que vimos até agora?
O que há em comum?
Machine Learning
“Campo de estudo em que computadores possuem a habilidade de aprender sem ser explicitamente programados”.
Machine learning
Machine learning é o estudo científico de algoritmos e modelos estatísticos para executar uma tarefa usando inferência em vez �de instruções.
6
Fluxo de machine learning
Dados
Modelo
Previsão
Machine Learning
Machine Learning
Machine Learning
Machine Learning
Reconhecer spam
Reconhecimento de fala
Outras aplicações
Dado
Dado
Previsão do Tempo | Temperatura | Umidade | Vento |
Nublado | 22 celsius | 83% | 40 km/h |
Dataset
Previsão do Tempo | Temperatura | Umidade | Vento |
Nublado | 22 celsius | 83% | 40 km/h |
Ensolarado | 30 celsius | 22% | 5 km/h |
Chuvoso | 15 celsius | 100% | 10 km/h |
Ensolarado | 32 celsius | 70% | 1 km/h |
Ensolarado | 35 celsius | 75% | 12 km/h |
Nublado | 25 celsius | 80% | 20 km/h |
Instância
| Previsão do Tempo | Temperatura | Umidade | Vento | |
| Nublado | 22 celsius | 83% | 40 km/h | |
| Ensolarado | 30 celsius | 22% | 5 km/h | |
Chuvoso | 15 celsius | 100% | 10 km/h | ||
Ensolarado | 32 celsius | 70% | 1 km/h | ||
Ensolarado | 35 celsius | 75% | 12 km/h | ||
Nublado | 25 celsius | 80% | 20 km/h |
Atributo
Previsão do Tempo | Temperatura | Umidade | Vento |
Nublado | 22 celsius | 83% | 40 km/h |
Ensolarado | 30 celsius | 22% | 5 km/h |
Chuvoso | 15 celsius | 100% | 10 km/h |
Ensolarado | 32 celsius | 70% | 1 km/h |
Ensolarado | 35 celsius | 75% | 12 km/h |
Nublado | 25 celsius | 80% | 20 km/h |
| | | |
Tipos de Atributos
Tipos de Machine Learning
Aprendizado Supervisionado
Entrada
x
Saída
y
f(x)
Aprendizado Supervisionado
Entrada (x) | Saída (y) | Aplicação |
Spam? (sim ou não) | Filtro de spam | |
Áudio | Transcrição do áudio | Reconhecimento de fala |
Texto em Português | Texto em inglês | Tradução de máquina |
ad, informação do usuário | Usuário vai clicar? (sim ou não) | Propaganda online |
Imagem de um produto | Defeituoso? | Inspeção visual |
Aprendizado Supervisionado
Classificação = aprender função para predizer um valor de saída categórico.
Tipos de Aprendizado Supervisionado
Regressão = aprender função para predizer um valor numérico.
Exemplo de Classificação
f(x) = Girafa
f(x) = Girafa
f(x) = Girafa
f(x) = Lhama
f(x) = Lhama
f(x) = Lhama
Conjunto de Treinamento
X =
f(x) = ?
Outros exemplos de Classificação
Exemplo de Regressão
Tamanho da Casa (em m²) | Valor da casa (em R$ 1000 reais) |
45 | 200 |
60 | 300 |
100 | 500 |
200 | 1.000 |
300 | 1.500 |
Qual valor de uma casa com tamanho de 150 m²?
Aproximadamente R$ 750.000
Exemplo de Regressão – Ajuste de Curva
Aprendizado Não-Supervisionado
rotulado.
28
Aprendizado Não-Supervisionado
29
Aprendizado
Aprendizado de
Máquina
Não Supervisionado
Anomalias
Agrupamento
Supervisionado
Classificação
Regressão
Conjunto de dados rotulados. Rótulo é a saída esperada da função.
Conjunto de dados sem nenhum rótulo. Não há qualquer informação sobre a saída esperada.
Predizer uma
classe categórica.
Predizer um
valor númerico.
Encontrar exemplos fora do comum do dataset.
Encontrar agrupamentos entre exemplos do dataset.
30
Aprendizado por Reforço
Examplo: Aprendendo a caminhar
Início
[Video: AIBO WALK – initial]
[Kohl and Stone, ICRA 2004]
Examplo: Aprendendo a caminhar
Treinamento
[Video: AIBO WALK – training]
[Kohl and Stone, ICRA 2004]
Examplo: Aprendendo a caminhar
Finalizado
[Video: AIBO WALK – finished]
[Kohl and Stone, ICRA 2004]
Sobre aprendizado
Sobre aprendizado
deixados de fora do treinamento
Estratégias de treinamento
conjunto de validação.
(poucos exemplos).
Entradas: conceitos, instâncias, atributos…
Exemplo: Previsão do tempo - Classificação
Atributos
Classe a ser prevista
Conceito que queremos generalizar
Atributos
Atributo nominal
Atributo ordenado
Intervalos
Ratio
Exemplo: Previsão do tempo - Classificação
Atributos misturados
Classe a ser prevista
Exemplo: Previsão do tempo - Regressão
| | |||
Outlook | Temperature | Humidity | Windy | Play-time |
Sunny | Hot | High | False | 5 |
Sunny | Hot | High | True | 0 |
Overcast | Hot | High | False | 55 |
Rainy | Mild | Normal | False | 40 |
… | … | … | … | … |
| | |||
Saída numérica a ser prevista
Exemplo: Classificação de flores Iris
Conjunto de Treinamento e de Validação
Treinamento
Teste
Prever corretamente a classe
Saídas
Representando padrões estruturais
Tabelas de decisão
Árvore de decisão
Weka
Padrão de dados Weka - ARFF
Brincando no weka
Principais algoritmos
Atividade