Didattica 2
Frontiere avanzate
Introduzione al Mining | Introduzione al Mining |
| Scritto da Marco V. Principato (Roma - IT) | |
| domenica 20 maggio 2007 | |
|
In queste tavole cercheremo di affrontare un argomento relativamente nuovo, del quale forse avete sentito parlare, che vi incuriosisce ma non avete ancora capito cos'è: il Data Mining e il Text Mining. Non sarà impresa facile, ci proveremo nel modo più semplice possibile: l'importante non sarà certo mettervi in condizioni di creare da zero uno strumento software di Mining, ma solo di farvi capire la straordinaria potenzialità che ha e quanto spesso sia utilizzato, anche a nostra insaputa. Diamo alcune semplici definizioni.
{mosgoogle left}
Confusi? Gettate la confusione: è proprio così semplice. A dirsi, ma molto di meno a farsi!... Ciò non toglie che si tratti esattamente di questo. Nelle pagine successive scenderemo un pochino di più nel dettaglio, ma in questa introduzione vorremmo che capissero proprio tutti, anche coloro che, con il computer, a malapena sanno scrivere una lettera e salvarla.
Che bisogno c'è di andare a caccia di dati? O di testo? I dati ce li ho sul disco, direte voi. Ed è vero. Solo che ne avete quasi sempre a disposizione molti altri, con il piccolo particolare che... non sapete assolutamente di averli. Non vi spaventate, non è un gioco di prestigio. Facciamo un banale esempio, che vi chiarirà una parte delle idee. Discorsivo e divertente, ma... continuate a leggere.
Supermercato: carrello, articoli nel carrello, fila, cassa. Mettete tutto sul nastro, la cassiera passa gli articoli davanti ad uno strano oggetto che manda lampi di luce rossa: quando quell'arnese "capisce", fa "beep" e lo scontrino avanza, con una riga su cui di volta in volta è riportato l'articolo. E così via con tutti gli articoli che state per pagare. Al termine la cassiera schiaccia il tasto del "Totale" e vi dice "sono 94 Euro e 37 centesimi". Voi replicate "avete il Bancomat?". "Certo", risponde. Gli consegnate la tessera, la cassiera la passa nella macchinetta e vi consegna la tastiera. Voi digitate il PIN, la vostra banca concede il pagamento e la cassiera vi consegna scontrino e copia della transazione Bancomat (a volte è la stessa cassa a farlo e, pertanto, sullo scontrino stesso appare la scritta "pagamento Bancomat"). Voi spingete fuori il carrello, mettete la "spesa" nel bagagliaio, riportate a posto il carrello, vi riprendete la monetina e filate a casa, pensando a tutta la spesa da mettere in ordine.
30 minuti di un'ordinaria giornata, direte voi. Neanche per sogno! Per voi è stata un'ordinaria giornata, ma sapeste quante cose che vi riguardano direttamente sono accadute in quei trenta minuti! Volete saperle? Eccole.
Non avete acquistato articoli a caso, bensì seguendo criteri precisi come il reintegro di una scorta, la necessità di un bene specifico perché avete ospiti, il dovervi rifornire di articoli per i vostri figli neonati, il prevedere una possibile vacanza in casa senza dover fare le piccole spese, il caldo che vi ha fatto decidere per qualche bevanda in più o il freddo che vi ha spinto a qualche bel pezzo di carne di maiale non prevista, le lamette da barba che stanno finendo, il dentifricio che è agli sgoccioli, lo struccante delle signore che non era di qualità e la candeggina che era finita.
Tutte queste cose che avete comprato sono elencate nello scontrino, sia come tipologia di articolo che come quantità acquistata. Così come nello scontrino, stanno anche nel computer del supermercato, perché in prima battuta occorreranno per stabilire se le scorte di magazzino di ogni articolo si stiano avvicinando al termine.
Be'? E con questo? Direte voi.
Esatto. Con (solo) questo, proprio nulla, eccezion fatta per la possibilità che questa automatizzazione offre al supermercato, il cui primo vantaggio consiste nel non dover tenere manualmente sotto controllo il magazzino, avendo sempre un bilancio delle quantità.
Ma... immaginavate che nel vostro scontrino ci sono altri dati? Vedo già il "Pierino" che dice "ma no: sullo scontrino non c'è scritto altro". E' vero: non c'è scritto null'altro. Ciò non significa che non ci siano. Per trovarli, bisogna... andare a caccia. Non sono così evidenti, eppure ci sono. Un aiutino? Eccolo.
Tra i tanti articoli, avete acquistato i pannolini, perché i vostri figli li consumano e voi amate tenerli al pulito. Poi, avete acquistato una bottiglia di aperitivo, perché stasera avete ospiti a cena e volete trattarli bene. Di scontrini come il vostro, che contengono pannolini e aperitivo, ce ne sono stati molti altri. Chiedendo al computer del supermercato di farci vedere quanti, sapremo, per esempio, che nella giornata di oggi 70 clienti hanno incluso quei due articoli nella loro spesa.
E con ciò?, direte voi. Ancora nulla. Ma riflettiamo un attimo sulla vita: CHI E' quella persona che acquista contemporaneamente, tra gli altri, quei due articoli? Proviamo ad immaginarlo enunciandone le caratteristiche sociali: non è difficile. Si tratta di giovani, che hanno procreato da poco. Come tali, ancora amano molto fare vita sociale, però la prole impedisce loro di farla fuori casa. Allora, invitano spesso amici e, pertanto, si prospetta la necessità di portare in casa il piacere della vita sociale esterna, come l'offrire un aperitivo.
Mi direte: ma quale masturbazione mentale ti sei fatto per arrivare a questa, seppur corretta, conclusione? La risposta è facile: proprio nessuna. Ho mandato qualcun'altro a caccia di questa conclusione: il Data Mining. Infatti esso, largamente impiegato nei supermercati e in molti altri settori ed esercizi, conosce sia l'articolo venduto nel senso materiale del termine come il produttore, il costo, la scorta, eccetera. Ma associa anche all'articolo altri concetti, come la fascia d'età dell'acquirente, la possibile fascia sociale media, l'orientamento di pensiero, la quantità acquistata in relazione al costo e molte, molte altre cose. Per esempio, ci vuol poco ad associare ad un articolo la caratteristica di "articolo molto costoso di gran lusso", partendo dalla sua naturale collocazione di mercato. Se qualcuno compra 10 di questi articoli e questi in totale non rappresentano che il 5% del totale pagato alla cassa, abbiamo ottime probabilità di essere di fronte a un cliente molto facoltoso.
Potremmo prenderne nota, perché ove questo "super acquisto di gran lusso" disseminato in mezzo a molti altri soldi spesi si ripetesse, con grosso modo le stesse tipologie di articoli acquistati insieme ad esso, avremmo buone probabilità di trovarci di fronte allo stesso cliente.
In una parola, stacchiamoci per un attimo dal concetto rigido di "archvio" elettronico, che contiene solo dati statici o, tanto per usare un termine più accademico, strutturati e pensiamo, invece, a concetti di carattere sociale strettamente correlati alla tipologia degli articoli acquistati. Cominciate a capire quale tipo di informazioni stiamo chiedendo?
Infatti, per offrire al marketing uno strumento assai più goloso di quanto non possano esserlo delle rigide statistiche di vendita, si prospetta molto interessante l'opportunità di favorire la vendita di questo o quel bene dislocandoli, ad esempio, artatamente in relazione a come l'articolo in esame viene acquistato. Mentre sembra ovvio che, accanto alle casse, siano stati disposti dei frigoriferi congelatori sponsorizzati dalle case produttrici di gelato che, guarda caso, sono a... portata di vista di bambino (sono cioè bassi quanto basta affinché il bambino, in attesa con i genitori alla cassa, possa essere invogliato a chiedere un gelato perché lo vede e, probabilmente, è anche capace di afferrarlo perché a portata di mano), non altrettanto ovvie sono le collocazioni di molti altri generi.
Dovrebbe cominciare ad esser chiaro che, in realtà, assolutamente nessuna disposizione dei beni è casuale, anzi, in una mente ordinata la disposizione adottata sembra spessissimo sconclusionata: tuttavia non lo è per niente, perché è stata decisa e pianificata in base alle analisi degli scontrini di vendita effettuate con il Data Mining. Capite ora perché l'acqua minerale, nel 99% dei casi, è raggiungibile solo dopo aver attraversato un percorso minimo predefinito tra gli scaffali, che obbliga il cliente a prendere contatto visivo con una ben precisa lista di beni di prima necessità?
Questo è il DATA MINING, ovvero l'estrazione di DATI CHE "NON SO DI SAPERE". Nella prossima lezione introdurremo la "tabellina della verità" che definisce le tipologie di dati ed il grado di consapevolezza della loro esistenza. Se quanto avete letto sinora non vi è chiaro, non andate avanti; capireste ancora meno; piuttosto, rileggete attentamente e, in caso di ulteriori dubbi, scrivetemi. |
| Flash |
| Attualità |
| Tecnocronaca |
| Didattica |
| Didattica 2 |
| Hobby |
| Download |
| RSS |
| Ricerca avanzata nel sito |
Immagini tra i volti:
Immagini nelle news: