studio avantaggiato - consulenza direzionale
studio avantaggiato
la scelta giusta per il vostro business.
Sei in Home \ Data Mining

Data Mining

Il Data Mining rappresenta l'evoluzione ultima del processo di selezione, esplorazione e modellazione dei dati aziendali.
L'obiettivo finale di tale attività di tipo analitico è l'individuazione o scoperta di relazioni o regolarità non note a priori che possono portare ad un vantaggio competitivo sostenibile. Ciò che caratterizza il Data Mining e lo rende differente rispetto alla mera applicazione di metodologie statistico econometriche nel quadro di una analisi desk, è l'implementazione degli algoritmi, dei modelli e delle procedure in seno all'organizzazione aziendale come realtà sistemica. E' solo attraverso una precisa collocazione di tale infrastruttura analitica nel tessuto organizzativo che è difatti possibile estrarre in modo efficace dal dato, l'informazione economica rilevante. Fare Data Mining significa, in sostanza, scavare profondamente nel Data Warehouse al fine di far emergere la conoscenza, sottoporre tale conoscenza ad un approfondito processo analitico utilizzando gli strumenti della analisi statistica multivariata o altri metodi statistici e computazionali e generare così un valido supporto alle decisioni strategico operative.
Tipiche applicazioni analitiche rientranti nella sfera del Data Mining sono gli studi per la valutazione degli effetti delle campagne promozionali, il credit scoring e la valutazione della solvibilità del Cliente, la Market Basket Analisys a supporto delle strategie promozionali o di assortimento nelle imprese commerciali, il web mining ossia la valutazione e analisi dei flussi di visita dei siti web, la Competitive Intelligence che ha come obiettivo la previsione di modelli comportamentali per i concorrenti diretti ed indiretti più significativi e per le aree di sviluppo del business.

Approccio

Nello sviluppo di un tipico progetto di Data Mining sono generalmente previste le seguenti fasi:

  • 1) Organizzazione dei dati
    - nel caso di dati raccolti attraverso un processo di ricerca di marketing l'attività di organizzazione viene espletata a monte, nelle fasi di controllo e pre-trattamento (durante il processo di ricerca) ma un supplemento di valutazione è sempre auspicabile e realizzato (soprattutto su dati mancanti o errati);
    - nel caso di dati interni al Data Warehouse aziendale si rende necessario un processo di "pulitura" dei dati e di estrapolazione dal Data warehouse di singoli Data Mart di ricerca(database specialistici) che contengano solo le informazioni (campi e record) necessari per l'analisi.
    Il processo di organizzazione è estremamente importante poichè può pregiudicare la qualità dei risultati della analisi; è pertanto da svolgere in modo approfondito con l'ausilio di strumenti idonei alla gestione dei dati mancanti (Missing Value di SPSS).
  • 2) Analisi Esplorativa
    E' questa una prima forma di valutazione della rilevanza dei dati raccolti; essa può suggerire inoltre l'esistenza di dati anomali, la cui influenza deve essere opportunamente considerata al fine di non pregiudicare l'analisi. L'Analisi esplorativa si sostanzia nella costruzione delle distribuzioni di frequenza e delle tavole di contingenza, nel calcolo delle principali misure di posizione (media, moda, mediana, ecc.)e di dispersione (varianza, scarto quadratico medio, ecc.) e nella analisi della varianza e covarianza (per la valutazione della variabilità congiunta in un'ottica multidimensionale).
  • 3) Scelta dei metodi di analisi statistica multivariata ed elaborazione dei dati
    L'universo di tali metodologie è vario e complesso (uno o più metodi sono tipicamente adatti a uno o più problemi di marketing) e comprende le varie tecniche di regressione (multipla, logistica, log-lineare, ecc.), i metodi di classificazione (Multidimensional Scaling, Analisi delle Componenti principali, Analisi delle Corrispondenze, ecc.), i metodi di raggruppamento (Cluster Analisys, ecc.), i metodi di segmentazione, eccetera. Al fine di garantire la qualità di tale fase estremamente delicata lo Studio Avantaggiato utilizza software per il data mining che costituiscono uno standard di riferimento nel settore; inoltre nella nostra organizzazione è presente e sottoposta a costante aggiornamento (sulla base di benchmarks di riferimento ed in relazione alla partecipazione a corsi specialistici di aggiornamento professionale cui ci sottoponiamo) una banca dei modelli statistici. infine cerchiamo, per ogni progetto, di sviluppare analisi parallele utilizzazndo almeno due metodologie differenti e confrontandoli sulla base di almeno due test per la verifica della bontà dei risultati.
  • 4) Scelta ed implementazione del modello ottimale
  • 5) Preparazione dei report e presentazione dei risultati

Casi

Newsletter

Nome e Cognome
E-Mail
privacy policy