Il grande disastro della scienza dei dati di Zillow
A novembre, Zillow ha deciso di interrompere l’acquisto di nuove case, ha deciso di vendere tutto il suo inventario e ha licenziato il 25% dei suoi dipendenti.
Iniziando inizialmente il suo viaggio come società di media, guadagnando vendendo annunci sui suoi siti Web, la società americana Zillow Group Inc., o semplicemente Zillow, si è poi trasformata in una società immobiliare online.
Fondata nel 2006 da ex dirigenti Microsoft e fondatori di Expedia: Rich Barton e Llyod Frink; co-fondatore di Hotwire.com Spencer Rascoff; David Beitel e Kristin Acker, Zillow hanno iniziato ad acquistare case nel 2018, affermando di sfruttare i dati per rendere redditizio il ribaltamento delle case su larga scala. Nel 2019, la società ha generato $ 2,7 miliardi.
Tuttavia, automatizzare tutto non ha sempre senso. Nel novembre di quest’anno, il CEO Barton ha annunciato che Zillow avrebbe smesso di acquistare case, in un momento in cui possedeva già 7.000 case. Inoltre, la società immobiliare ha deciso di vendere tutto il suo inventario e licenziare circa il 25% dei suoi 8.000 dipendenti. Come risultato di questa decisione, il suo ramo di acquisizione e vendita della casa, Zillow Offers, ha perso $ 420 milioni nel terzo trimestre del 2021.
Oggi, ci immergiamo in profondità per esplorare cosa è andato storto esattamente con la tecnologia di Zillow.
La storia dice…
Il ribaltamento delle case comporta l’acquisto di un immobile a un valore inferiore, la spesa per miglioramenti e ristrutturazioni e quindi la vendita a un prezzo più elevato. Ciò che è difficile qui è analizzare e prevedere il prezzo potenziale della casa o della proprietà. Zillow voleva eliminare l’intero processo di offerta e chiusura quando si trattava di acquistare e vendere case.
Quando ha iniziato a operare, Zillow ha creato Zestimate , uno strumento che utilizzava le origini dati per creare un valore approssimativo delle proprietà. Nel 2006 Zillow aveva un database di circa 43 milioni di case. Utilizzando questo, la società immobiliare è stata in grado di prevedere il prezzo delle proprietà abitative con un errore percentuale assoluto mediano del 14%. Andando avanti, Zillow ha acquisito i dati di circa 110 milioni di case, riducendo i tassi di errore al cinque per cento.
Sebbene gli strumenti o i metodi di valutazione automatizzati non fossero nuovi sul mercato, Zillow è stato in grado di farlo su larga scala e questo ha sconvolto il mercato immobiliare.
La grande caduta e la ragione dietro di essa
Le cose hanno iniziato a peggiorare una volta che il modello di previsione di Zillow ha iniziato a degradarsi. Ciò ha portato l’azienda ad acquistare proprietà a un prezzo molto più alto di quello a cui era in grado di venderle. Nel novembre di quest’anno, la società ha smesso di acquistare case adducendo come motivo “l’economia vincolata dal lavoro e dall’offerta”.
Tuttavia, la caduta di Zillow può essere definita un fallimento della scienza dei dati . Valutiamo cosa è andato storto con il suo modello di previsione dei prezzi, o come lo chiama l’azienda, Zestimate .
I modelli di machine learning (ML) funzionano in modo efficace quando vengono addestrati su dati di qualità. Quando l’algoritmo viene alimentato con dati scadenti, i risultati o le previsioni saranno altrettanto. Con molta probabilità, il modello di previsione dei prezzi di Zillow è stato quello che è andato storto. Il modello è stato iniettato con dati pubblicamente disponibili o resi disponibili dai suoi utenti.
Ad esempio, per la proprietà “X” in vendita, Zestimate potrebbe prevedere il prezzo di acquisto di X pari a $ 50.000. Poiché il modello non è accurato al 100%, un errore del 10% significherebbe che il prezzo effettivo di X è di $ 45.000. La società ha già perso $ 5.000 lì. Per di più, spenderebbe ancora di più per le riparazioni e i miglioramenti di X e poi lo venderebbe.
Inoltre, dati errati in termini di numero di stanze in X, dimensione della proprietà, distanza da scuole, ospedali e mercati, ecc., influenzeranno tutti la valutazione di X. Pertanto, la società avrebbe dovuto concentrarsi maggiormente su la qualità dei dati utilizzati per addestrare il modello ML.
In secondo luogo, sebbene gli algoritmi siano ottimi per ricavare informazioni utili, dovrebbero fare affidamento al 100%, specialmente nei casi in cui le possibilità di incertezza sono elevate. Il mercato immobiliare immobiliare è volatile e comporta un enorme impatto monetario. Un errore del 10% potrebbe portare a molte differenze. Pertanto, quando si risolvono problemi che comportano incertezza, è essenziale testare i cambiamenti prima di fare affidamento su algoritmi per prevedere il risultato. Pertanto, le aziende che risolvono un problema di data science che comporta impatti ad alto rischio dovrebbero sempre avere un team che si occupi degli output del modello.
Riassumendo
I modelli di automazione e scienza dei dati sono estremamente utili per analizzare e fornire approfondimenti. Tuttavia, anche alcuni di loro falliscono, come nel caso di Zillow.
In precedenza, in un’intervista con la società di media ZDNet , Chief Analytics Officer di Zillow, lo stesso Stan Humphries ha affermato che in un dato giorno, metà di tutte le case che l’azienda ha negoziato erano al di sopra del valore di Zestimate e la metà al di sotto.
Il fallimento di Zillow, tuttavia, non indica le sfide associate all’acquisto e alla vendita di case con profitto, ma al modo in cui l’intelligenza artificiale e il machine learning potrebbero andare storto quando si risolvono i problemi del mondo reale.