Una guida rapida alla comprensione di un algoritmo KNN
Con il mondo degli affari che adotta in modo aggressivo la Data Science , è diventata uno dei campi più ambiti. Spieghiamo cos’è un algoritmo del vicino più vicino K e come funziona.
Cos’è l’algoritmo KNN?
L’algoritmo K-Nearest Neighbors (o KNN) è uno degli algoritmi di apprendimento più utilizzati grazie alla sua semplicità. L’algoritmo KNN o K-più vicino è un algoritmo di apprendimento supervisionato che funziona in base al principio che ogni punto dati che si avvicina l’uno all’altro appartiene alla stessa classe. Il presupposto di base qui è che le cose che sono vicine l’una all’altra siano uguali. Per lo più, l’algoritmo KNN viene utilizzato per la sua facilità di interpretazione e il basso tempo di calcolo.
KNN è ampiamente utilizzato per la classificazione e i problemi di regressione nell’apprendimento automatico . Alcuni esempi di KNN sono algoritmi utilizzati dai portali di e-commerce per consigliare prodotti simili.
Rivediamo un esempio:
Nell’immagine data, abbiamo due classi di dati. Classe A che rappresenta i quadrati e Classe B che rappresenta i triangoli.
Il problema è assegnare un nuovo punto dati di input a una delle due classi con l’uso dell’algoritmo KNN
Il primo passo è definire il valore di “K” che sta per il numero di Nearest Neighbors.
Se il valore di “k” è 6, cercherà i 6 Vicini più vicini a quel punto dati. Se il valore di “k” è 5, cercherà i 5 Vicini più vicini a quel punto dati.
Consideriamo ‘K’ = 4, il che significa che l’algoritmo prenderà in considerazione i quattro vicini più vicini al punto dati.
Ora, a ‘K’ = 4, un triangolo e due quadrati possono essere visti come i vicini più prossimi. Quindi, il nuovo punto dati basato su ‘K’ = 4, sarebbe assegnato alla Classe A.
Dove usare KNN?
KNN è utilizzato sia nella classificazione che nei problemi predittivi di regressione. Tuttavia, quando viene applicato per scopi industriali, viene utilizzato principalmente nella classificazione poiché è compatibile con tutti i parametri valutati quando si determina l’usabilità di una tecnica.
Potere di previsione
Tempo di calcolo
Facilità di interpretazione dell’output
Come viene impiegato nei problemi quotidiani?
Nonostante la sua semplicità, KNN funziona molto meglio di altri potenti classificatori e viene utilizzato in luoghi come le previsioni economiche e la compressione dei dati, il riconoscimento video, il riconoscimento delle immagini, il rilevamento della scrittura a mano e il riconoscimento vocale.
Alcuni dei principali utilizzi dell’algoritmo KNN
L’algoritmo KNN viene utilizzato nel sistema bancario per prevedere se una persona è adatta o meno all’approvazione del prestito prevedendo se ha tratti simili a un inadempiente. KNN aiuta anche a calcolare i punteggi di credito degli individui confrontandoli con persone con tratti simili.
Aziende che utilizzano KNN
La maggior parte delle società di e-commerce e intrattenimento come Amazon o Netflix utilizzano KNN quando consigliano prodotti da acquistare o film / programmi da guardare.
Come fanno anche queste raccomandazioni? Bene, queste aziende raccolgono dati sul comportamento dell’utente come prodotti precedenti che hai acquistato o film che hai guardato sul loro sito web e applicano KNN.
Le società inseriranno i dati dei clienti disponibili e li confronteranno con altri clienti che hanno acquistato prodotti simili o hanno guardato film simili.
I prodotti e i film ti verranno quindi consigliati, a seconda di come l’algoritmo classifica quel punto dati.
Vantaggi e svantaggi di KNN
Vantaggi di KNN
Calcolo veloce
Algoritmo semplice: interpretare
Versatile: utile per la classificazione e la regressione
Alta precisione
Nessuna ipotesi sui dati, nessuna necessità di formulare ipotesi aggiuntive o creare un modello.
Svantaggi di KNN
La precisione dipende dalla qualità dei dati
La previsione diventa lenta con dati di grandi dimensioni
Non è rilevante per set di dati di grandi dimensioni
È necessario memorizzare tutti i dati di allenamento, quindi richiede una memoria elevata
Può essere costoso dal punto di vista computazionale in quanto memorizza tutta la formazione
In questo blog abbiamo cercato di spiegare l’algoritmo K-NN che è ampiamente utilizzato per la classificazione. Abbiamo discusso l’approccio di base alla base di KNN, come funziona e i suoi vantaggi e svantaggi.
L’algoritmo KNN è uno degli algoritmi più semplici e può fornire risultati altamente aggressivi. Gli algoritmi KNN possono essere utilizzati sia per la classificazione che per i problemi di regressione.