Cos'è il machine learning supervisionato

Un algoritmo di machine learning supervisionato ( Supervised ML ) elabora in input una collezione di esempi (dataset di training) con le risposte corrette. L'algoritmo costruisce in output un modello statistico di classificazione o di regressione.

A cosa serve il modello?

Il modello è usato per elaborare altri esempi senza soluzione e dedurre l'etichetta (label) dalle caratteristiche (features) degli esempi.

Esempio. Un algoritmo elabora un dataset di training con 1000 esempi di email spam e no spam. Elabora un modello e lo utilizza per decidere se una email in arrivo è spam oppure no.

Come funziona il Supervised ML

Il dataset di training è una collezione di esempi etichettati

$$ \{ x_i, y_i \}_{i=1}^N $$

Il dataset di training è composto da N esempi.

un esempio di training set

Ogni esempio(riga) è composto da

  • Un vettore di caratteristiche xi (features vector) con j caratteristiche. Ogni colonna indica una caratteristica dell'esempio.

    Esempio. La colonna x(1) indica il peso, x(2) l'altezza, x(3) l'età, ecc.

  • Un'etichetta yi (label) indica la risposta corretta, quella che ci si attende dalla macchina. Può trattarsi di una classe o di un numero..

    Esempio. In un problema di classificazione la label è una classe. Ad esempio la classe spam o no spam, una risposta yes o no. Le classi possono essere anche più di due. In un problema di regressione la label è un numero intero o reale ( es. un prezzo ), un vettore o una matrice.

L'algoritmo elabora gli N esempi etichettati e crea un modello decisionale.

il funzionamento del machine learning

Il modello viene verificato con un dataset di test contenente esempi non etichettati.

Per ogni esempio di test il modello fornisce in output una risposta di classificazione o regressione

la verifica del modello

Qual è la differenza tra classification e regression?

  • Classification. In un problema di classificazione la risposta è l'assegnazione a una classe. Ad esempio, spam o no spam, Yes o No, ecc.
  • Regression. In un problema di regressione la risposta è un numero intero o reale. Ad esempio, il prezzo di vendita di una casa.

Se il modello risponde correttamente agli esempi di test, allora il modello è affidabile.

In questo caso può essere usato per prendere decisioni.

Esempio. Se un modello per classificare le email spam e no-spam è affidabile con gli esempi di test, può essere utilizzato nelle webmail per filtrare le email di spam in arrivo. Lo stesso accade in un problema di regressione.

Se il modello non classifica correttamente gli esempi o il tasso di errore è troppo alto, la costruzione del modello ricomincia da zero con un altro dataset di training.

https://how.okpedia.org/it/informatica/cos-e-il-machine-learning-supervisionato


Segnala un errore o invia un suggerimento per migliorare la pagina


Supervised Machine Learning (ML)


FacebookTwitterLinkedinLinkedin