У дома звуков Дали големите данни са решение с един размер за всички?

Дали големите данни са решение с един размер за всички?

Anonim

Q:

Дали големите данни са решение с един размер за всички?

A:

В рамките на идеята за цялостна екосистема или индустрия с големи данни, приложенията на стратегии за големи данни са специфични за нуждите на конкретен бизнес или организация. Една от най-големите грешки, които ръководителите и други професионалисти допускат, е да предприемат общ подход към големите данни и да се опитват да вкарат системите в шаблон, използван преди.

Философията на големите данни е свързана с много целенасочено и микроконтролирано използване на големи масиви от информация. Например, компания, която има хиляди и хиляди клиенти, ще предприеме голям проект за данни, за да използва цялата информация, която има за тези клиенти - техните имена, къде живеят, какво са купили преди и т.н. Въпреки това, резултатите имат повече по отношение на създаването на конкретни структури за манипулиране на данни и отчитане, отколкото при простото събиране и "изпълнение" на тези масивни набори от данни.

Част от предизвикателството на големите данни е, че той изисква по-специализирани хардуерни процеси. Компаниите често използват системи с отворен код като Apache Hadoop и специфични свързани инструменти като MapReduce, за да получат големи решения за данни в игра. Това отнема допълнително техническо ноу-хау, освен просто да настроите таблица на Microsoft Access или да преследвате някаква друга по-проста технология за бази данни.

За да направят големите данни ефективни, компаниите трябва да гледат на внедряването и как да избегнат нарушаване на обичайната си бизнес дейност. За да бъдат най-ефективни, те трябва да разгледат точно кои набори от данни ще им бъдат най-полезни. Например, ако продавачите или други хора могат да направят това, което трябва да правят с обикновен отчет за само фамилни имена, щати и телефонни номера, няма смисъл да се опитвате да пускате по-обширни данни през системата и да се опитате да събирате и представяте други идентификатори или ключови данни.

Ефективността, лесното внедряване и разходите водят до появата на специфични за компанията решения за големи данни. Тези иновации определено зависят от конкретен бизнес модел и от проблемите, които трябва да бъдат решени.

Дали големите данни са решение с един размер за всички?