Alla pratar om Big Data – Men vad är det egentligen?

Fyra egenskaper definierar Big Data - Vi ger dig koll.

Big Data

Har du koll på vad Big Data innebär och vad det kan användas till? Foto: Colourbox.

Big Data kan definieras på många sätt och de flesta har en åsikt om vad det är. I den här artikeln presenteras fyra riktlinjer som kan hjälpa dig att förstå vad Big Data är.

När mängden data gör det vanliga sättet att samla in och bearbeta data otillräckligt handlar det i regel om Big Data. Enligt Angelo Alonso, Machine Learning Engineer på Tradeshift, kan ett exempel på Big Data vara när värdena inte längre är numeriska eller antalet frågor överstiger en viss nivå.

Hur stort är Big Data?

När man pratar om Big Data pratar man också om bytes. Här har utvecklingen gjort ett stort avtryck för förståelsen av Big Data. För tio år sedan pratade man t.ex. om att en datamängd över en viss gigabyte storlek var mycket. Men nu är det inte ovanligt med datamängder på både petabyte och exabyte. Big Data har verkligen nått en storlek där det kan vara svårt att få överblick och förstå den verkliga omfattningen av data. Till exempel flyttade Microsoft 150 pentabytes när de flyttade alla befintliga data från Hotmail till Outlook. För att sätta denna siffran i ett sammanhang: petabyte 1015 byte = 1 000 000 000 000 000 bytes.

Fyra egenskaper som utmärker Big Data

Sammanfattningsvis kan man peka på fyra egenskaper som utmärker Big Data: High volume, High variety, High variability och High veracity.

•   High volume beskriver volymen av data som ska hanteras. Som termen Big Data antyder så innebär det mycket data, ofta så mycket att en vanlig dator inte har tillräckligt med datakraft för att behandla och arbeta med datamängden.

•   High variety betyder att det finns så många olika datatyper att det kan vara svårt att kategorisera samtliga. Dokument, videor, bilder m.m. ingår ofta i en Big Data-uppsättning. Alla datatyper innehåller användbar information, men varje datatyp kräver sin egen analys- och behandlingsmetod.

•   High variability förknippas ofta med variety som nämnts ovan, variability är mycket svår att få full förståelse för, men generellt sett innebär det att ändra betydelsen i takt med det sammanhang som den sätts in i.

•   High veracity innebär att mycket data samlas in på mycket kort tid. Detta ökar risken för felaktig datainsamling. Därför är det viktigt för verksamheter att skapa processer som samlar in och sorterar bort oanvändbara data.

Skillnaden mellan High variety och High variability kan illustreras som ett besök hos en bagare som säljer tio olika sorters bröd. Det är variety. Tänk dig att gå till samma bageri tre i rad och köpa samma bröd. Även om det är samma typ av bröd så kommer det att smaka och lukta lite annorlunda varje dag eftersom det blir små förändringar i din uppfattning om brödet och den situation som du äter det i. Det är variability.

Vad kan Big Data användas till?

 I teorin är de flesta överens om att förmågan att bearbeta stora mängder data ger oss enorma möjligheter. Big Data kan exempelvis användas till:

• Kreditvärdering

• Avslöjande av bedrägeri

• Målriktad marknadsföring

• Konkursprognoser

• Kreditkortsgodkännande

Flera internationella analyser har uppskattat den stora potentialen i Big Data och visar att Big Data-baserade verksamheter har bättre resultat än andra företag. Därför är det också viktigt för näringslivspolitiken att relatera till utvecklingen och att överväga vad som kan göras för att främja utbredningen av Big Data.

Vill du veta mer? Se en kort video om Big Data:

https://youtu.be/TzxmjbL-i4Y

Annons
Andra läser också
Annons