I termini di data mining e data warehousing sono spesso confuse da entrambe le imprese e staff tecnico. L'intero settore della gestione dei dati ha registrato una crescita fenomenale, con l'attuazione di programmi software di raccolta dati e il costo è diminuito di memoria del computer. Lo scopo primario sia dietro a queste funzioni è quello di fornire gli strumenti e le metodologie per esplorare i modelli e il significato in grande quantità di dati.
La differenza principale tra il data mining e data warehousing sono i disegni del sistema, la metodologia utilizzata, e lo scopo. Il data mining è l'uso della logica pattern recognition alle tendenze di identità all'interno di un set di dati di esempio e di estrapolare queste informazioni contro la piscina più grande di dati. Data warehousing è il processo di estrazione e la memorizzazione dei dati per consentire più facilmente di segnalazione. Data mining è un termine generico usato per descrivere una serie di processi di business che derivano da modelli di dati. Tipicamente, un pacchetto software di analisi statistica viene utilizzata per identificare i modelli specifici, sulla base dei dati e di query generata da parte dell'utente finale. Un tipico utilizzo di data mining è quello di creare programmi di marketing mirate, individuare le frodi finanziarie, e di bandiera schemi insoliti nel comportamento come parte di una revisione della sicurezza. Un ottimo esempio di data mining è il processo utilizzato dalle compagnie telefoniche a commercializzare prodotti a clienti esistenti. La compagnia telefonica utilizza i dati del software di data mining per l'accesso al suo database di informazioni sui clienti. Una query è scritta per identificare i clienti che hanno sottoscritto il pacchetto base telefono cellulare e il servizio Internet in un determinato tempo. Una volta che questo insieme di dati è stato selezionato, un'altra query è scritta per stabilire quanti di questi clienti ha approfittato della libera funzioni del telefono cellulare nell'arco di un processo di promozione. I risultati di questo esercizio di data mining rivelare modelli di comportamento che possono guidare o perfezionare un piano di marketing per aumentare l'uso dei servizi telefonici supplementari. E 'importante notare che lo scopo primario di data mining è di individuare modelli nei dati. Le specifiche utilizzate per definire l'insieme del campione ha un impatto enorme sulla pertinenza dei risultati e la precisione delle analisi. Tornando all'esempio precedente, se l'insieme dei dati è limitato ai clienti all'interno di una determinata area geografica, i risultati ed i modelli si differenziano da un più ampio insieme di dati. Sebbene sia il data mining e data warehousing di lavoro con grandi volumi di informazioni, i processi utilizzati sono molto diversi.Un data warehouse è un prodotto software che viene utilizzato per archiviare grandi volumi di dati ed eseguire query specificamente progettati e relazioni. La business intelligence è un settore in crescita di studio che si concentra sulla data warehousing e funzionalità collegate. Questi strumenti sono stati progettati per estrarre i dati e conservarla in un metodo destinato a fornire migliori prestazioni al sistema. Gran parte della terminologia in data mining e data warehousing sono gli stessi, portando a più confusione.
