Negli e-commerce, la precisione nelle ricerche degli utenti è fondamentale per garantire un’esperienza fluida e soddisfacente. Zepto, la startup indiana di quick commerce, ha affrontato questa sfida sviluppando un correttore ortografico multilingue potenziato da modelli linguistici di grandi dimensioni (LLM). Questa innovazione ha portato a un aumento del 7,5% nelle conversioni per le query interessate, dimostrando l’efficacia dell’approccio adottato.
In India, le ricerche degli utenti spesso combinano lingue diverse e utilizzano traslitterazioni fonetiche. Termini come “balekayi cheeps” (chips di banana) o “kottimbeer pudina” (foglie di coriandolo e menta) sono comuni, ma difficili da interpretare per i tradizionali sistemi di correzione ortografica. Zepto ha riconosciuto che, oltre alla semplice correzione ortografica, è essenziale comprendere il contesto culturale e linguistico delle ricerche per fornire risultati pertinenti.
Per affrontare questa sfida, Zepto ha scelto di fine-tunare il modello Llama3-8B di Meta, ospitandolo su Databricks per garantire scalabilità e ridurre la dipendenza da API costose. Invece di modificare i pesi del modello, l’azienda ha lavorato sulla definizione dei prompt, fornendo istruzioni chiare come “You are a spell corrector that understands multilingual inputs” e esempi pratici di correzione. Questa metodologia ha permesso al modello di apprendere schemi generali senza sovraccaricare il sistema.
Tuttavia, la semplice correzione ortografica non era sufficiente. Per evitare che brand come “Kellogs” venissero erroneamente corretti, Zepto ha implementato un sistema di Retrieval Augmented Generation (RAG). Ogni query viene trasformata in un embedding e confrontata con un database di titoli di prodotti, marchi e varianti ortografiche. I risultati più pertinenti vengono utilizzati per costruire dinamicamente il prompt, fornendo al modello chiarezza contestuale senza sovraccaricarlo.
Un aspetto distintivo dell’approccio di Zepto è l’apprendimento automatico basato sul comportamento dell’utente. Se un utente corregge manualmente una ricerca da “banan chips” a “banana chips”, il sistema registra questa modifica come un segnale per aggiornare i dati di addestramento. Questo ciclo di feedback continuo consente al modello di adattarsi e migliorare senza la necessità di etichettatura manuale o raccolta dati aggiuntiva.
L’implementazione di questo sistema ha avuto un impatto diretto sulle performance aziendali. Le conversioni per le query interessate sono aumentate del 7,5%, evidenziando l’efficacia della soluzione. Inoltre, questa tecnologia ha posto le basi per future innovazioni, come la correzione delle query vocali e spiegazioni dei prodotti basate sull’IA. Zepto ha sottolineato che questo sistema è ora un elemento fondamentale del loro processo di comprensione delle query in lingue vernacolari.