Joka päivä suuret organisaatiot päivittävät tekniikoita, jotka helpottavat ja sopivat parhaiten jokaiselle yritykselle, ja kohtaavat suuria haasteita, joiden avulla ne voivat löytää ja analysoida päivittäin käytettyjen työkalujen lisäksi. Heille on se luotu mikä tunnetaan nimellä Big Data tai espanjalaisena massiivisena datana, jotka ovat laajamittaisia tietojen tallennusjärjestelmiä.
Tämä tallennusilmiö on kehitetty uudessa tieto- ja viestintätekniikassa. Big Data on kaikki aktiviteetit, jotka liittyvät järjestelmiin, jotka tallentavat suuren joukon tietoja. Yksi pääpiirteistä on, että se manipuloi suurta määrää tietoa keräämällä, luokittelemalla ja sitten tallentamalla sitä. Tämän kokoelman tarkoituksena on luoda tilastollisia raportteja organisaatioiden käyttöön joko analysoituna muun muassa liiketoimintasuunnitelmina, mainonnana, vakoiluna.
Tallennusmarginaali on kasvanut vuosien varrella, vuodesta 2008 lähtien varastointitaso mitattiin petatavuista zettatavuihin dataa. Asiantuntijat etsivät säännöllisesti uusia tallennustoimia, koska joillakin alueilla on säilytettävä suuria määriä tietoja, eivätkä nykyiset ohjelmat ole kovin optimaalisia.
Suurten tietojen suorittamiseen ja hallintaan on tuhansia työkaluja, mutta kaikki eivät ole samoja, on olemassa kolmenlaisia tietoja, jotka ovat:
- Strukturoidut tiedot: ovat niitä, joissa tiedoilla on hyvin erityinen rakenne, kuten päivämäärät, numerot jne. Esimerkki niistä on laskentataulukoita.
- Rakentamattomat tiedot: yleensä ne ovat tietoja, joilla on erityinen muoto ja joita ei voida tallentaa taulukkolaskentaohjelmaan. Paljon vähemmän tietoja voidaan manipuloida, esimerkki PDF-dokumenteista.
- Puolirakenteinen data: Tämän tyyppisillä tiedoilla ei ole tiettyä muotoa, koska sillä on omat puolistrukturoidut metatiedot, esimerkkinä tästä ovat HTML-koodit.