Keskeinen ero: Data Mining on itse asiassa tietojen analysointi. Tietokoneavusteinen prosessi kaivaa ja analysoi valtavia tietoryhmiä, jotka tietokone on koonnut tai jotka on syötetty tietokoneeseen. Tietojen varastointi on prosessi, jossa tiedot tai tiedot kootaan tietovarastoon. Tietovarasto on tietokanta, jota käytetään tietojen tallentamiseen.
Tietojenkäsittelyn, joka tunnetaan myös nimellä tiedon löytäminen, tarkoituksena on antaa yrityksille mahdollisuus tarkastella näitä käyttäytymismalleja, suuntauksia ja / tai suhteita ja pystyä ottamaan ne huomioon päätöksissään. Näin yritykset voivat tehdä ennakoivia, tietoon perustuvia päätöksiä.
Termi "tiedon louhinta" perustuu siihen, että tietojenkäsittelyprosessi eli tietojen välisten suhteiden etsiminen on samanlainen kuin kaivostoiminta ja arvokkaiden materiaalien etsiminen. Tietojen louhintatyökalut käyttävät keinotekoista älyä, koneen oppimista, tilastoja ja tietokantajärjestelmiä tietojen välisten korrelaatioiden löytämiseksi. Nämä työkalut voivat auttaa vastaamaan liiketoiminnan kysymyksiin, jotka perinteisesti olivat liian aikaa vieviä ratkaisemiseksi.
Data Mining sisältää useita vaiheita, mukaan lukien raaka-analyysivaihe, tietokannan ja tietohallinnon näkökohdat, datan esikäsittely, mallin ja päättelyn näkökohdat, mielenkiintoisuuden mittatiedot, monimutkaisuusnäkökohdat, löydettyjen rakenteiden jälkikäsittely, visualisointi ja online-päivitys.
Tietovaraston tarkoituksena on tarjota käyttäjälle joustava pääsy tietoihin. Tietojen varastointi tarkoittaa yleensä monien eri tietokantojen yhdistelmää koko yrityksessä.
Tärkein ero tietovarastoinnin ja datan louhinnan välillä on se, että tietovarastointi on datan kokoamis- ja järjestämisprosessi yhteen yhteiseen tietokantaan, kun taas datan louhinta on prosessi, jossa tietokannasta saadaan merkityksellisiä tietoja. Tietojen louhinta voidaan tehdä vasta, kun tietojen varastointi on valmis.