Съдържание:
- Включете всички бизнес секции в инициатива за големи данни
- Дайте оценка на всички инфраструктурни модели за внедряване на големи данни
- Имайте предвид традиционните източници на данни при планирането на големи данни
- Помислете за последователен набор от данни
- Разпространете данните
- Никога не разчитайте на един подход за анализ на големи данни
- Не стартирайте голяма инициатива за големи данни, преди да сте готови
- Не използвайте данни изолирано
- Не пренебрегвайте сигурността на данните
- Не пренебрегвайте частта за ефективност на анализа на големи данни
Големите данни носят много обещания за всички видове индустрии. Ако тези големи данни се използват ефективно и ефикасно, това може да окаже значително влияние при вземането на решения и анализа. Но ползата от големите данни може да бъде постигната само ако се управлява структурирано. Постепенно се установяват най-добрите практики на големите данни, но вече има някои ясни действия и не, когато става дума за внедряване.
Следващите насоки се основават на практически опит и знания, събрани от проекти в реалния живот. Ето моите топ големи данни и какво правите.
Включете всички бизнес секции в инициатива за големи данни
Инициативата за големи данни не е изолирана и независима дейност и участието на всички бизнес единици е задължително, за да се получи реална стойност и представа. Големите данни могат да помогнат на организациите да се възползват от големи обеми от данни и да получат представа за поведението на клиентите, събития, тенденции, прогнози и т.н. Това не е възможно с моментна снимка на данните, която улавя само част от целия обем от данни, обработени в големи данни. В резултат на това компаниите все повече се концентрират повече върху всички видове данни, идващи от всички възможни пътища / бизнес единици, за да разберат правилния модел.Дайте оценка на всички инфраструктурни модели за внедряване на големи данни
Обемът на данни и неговото управление е основен проблем за всяка инициатива за големи данни. Тъй като големите данни се занимават с петабайти данни, единственото решение за управлението им е чрез използване на центрове за данни. В същото време компонентът на разходите трябва да бъде разгледан преди избора и финализирането на всяко съоръжение за съхранение. Облачните услуги често са най-добрият избор, но услугите на различни облачни среди трябва да бъдат оценени, за да се определи подходящата. Тъй като съхранението е един от най-важните компоненти при всяко внедряване на големи данни, това е фактор, който трябва да бъде оценен много внимателно при всяка инициатива за големи данни. (Вземете друга гледна точка в днешните стъпки за големи данни за предизвикателство от разнообразие, а не обем или скорост.)Имайте предвид традиционните източници на данни при планирането на големи данни
Има различни източници на големи данни и броят на източниците също се увеличава с всеки изминал ден. Този огромен обем от данни се използва като принос към обработката на големи данни. В резултат на това някои компании смятат, че традиционните източници на данни не са от полза. Това не е вярно, тъй като тези традиционни данни са критичен компонент за успеха на всяка история с големи данни. Традиционните данни съдържат ценна информация, така че трябва да се използват заедно с други големи източници на данни. Реалната стойност на големите данни може да бъде получена само ако се вземат предвид всички източници на данни (традиционни и нетрадиционни). (Научете повече в Поемете това, големи данни! Защо малките данни могат да пакетират по-голям удар.)Помислете за последователен набор от данни
В среда с големи данни данните идват от различни източници. Форматът, структурата и типовете данни варират от един източник до друг. Най-важната част е, че данните не се изчистват, когато става въпрос за вашата голяма информация. Така че, преди да се доверите на входящите данни, трябва да проверите съгласуваността чрез повтарящи се наблюдения и анализи. След като последователността на данните бъде потвърдена, тя може да се третира като последователен набор от метаданни. Намирането на последователен набор от метаданни чрез внимателно наблюдение на модела е съществено упражнение при всяко планиране на големи данни.Разпространете данните
Обемът на данните е основен проблем, когато разгледаме среда за обработка. Поради огромния обем данни, с който се справят големите данни, обработката на един сървър не е възможна. Решението е среда Hadoop, която е разпределена изчислителна среда, която работи на стоков хардуер. Тя дава силата за по-бърза обработка на множество възли. (Научете повече в 7 неща, които трябва да знаете за Hadoop.)Никога не разчитайте на един подход за анализ на големи данни
На пазара има различни технологии за обработка на големи данни. Основата на всички технологии за големи данни са Apache Hadoop и MapReduce. Ето защо е важно да се оцени правилната технология за правилната цел. Някои от важните аналитични подходи са прогнозна анализа, предписателна анализа, текстова анализа, анализи на поточни данни и др. Изборът на подходящия метод / подход е важен за постигане на желаната цел. Най-добре е да избягвате да разчитате на един подход, но да проучите различни подходи и да изберете идеалното съответствие за вашето решение.Не стартирайте голяма инициатива за големи данни, преди да сте готови
Винаги се препоръчва да започнете с малки стъпки за всяка инициатива за големи данни. Така че, започнете с пилотни проекти, за да придобиете опит и след това преминете към реално изпълнение. Потенциалът на големите данни е много впечатляващ, но реалната стойност може да бъде постигната само след като намалим грешките си и спечелим повече опит.Не използвайте данни изолирано
Големите източници на данни са разпръснати около нас и те се увеличават с всеки изминал ден. Важно е да се интегрират всички тези данни, за да се получат правилни аналитични резултати. На пазара се предлагат различни инструменти за интегриране на данни, но те трябва да бъдат оценени правилно преди употреба. Интегрирането на големи данни е сложна задача, тъй като данните от различни източници са с различен формат, но е много необходимо да се получи добър анализ на резултатите.Не пренебрегвайте сигурността на данните
Сигурността на данните е основно значение при планирането на големи данни. Първоначално (преди да извършите каквато и да е обработка) данните са в петабайти, така че сигурността не се прилага стриктно. Но след известна обработка, ще получите подмножество от данни, което предоставя известна представа. На този етап сигурността на данните става съществена. Колкото повече се обработват и фино настройват данните, толкова по-ценни често стават за една организация. Тези фино настроени изходни данни са интелектуална собственост и трябва да бъдат защитени. Сигурността на данните трябва да бъде внедрена като част от жизнения цикъл на големите данни.Не пренебрегвайте частта за ефективност на анализа на големи данни
Резултатът от анализа на големи данни е полезен само когато дава добри резултати. Големите данни предлагат повече информация, базирана на обработката на огромно количество данни с по-бърза скорост. Ето защо е важно да го управлявате ефективно и ефикасно. Ако изпълнението на големи данни не се управлява внимателно, това ще доведе до проблеми и ще направи цялото усилие безсмислено.
В нашата дискусия се съсредоточихме върху действията и недостатъците на инициативите за големи данни. Големите данни са нова област и що се отнася до внедряването, много компании все още са във фаза на планиране. От съществено значение е да се разберат най-добрите практики за големи данни, за да се сведе до минимум рискът и грешките. Точките на дискусията са получени от опита на проекта на живо, така че ще дадат някои насоки за успешна стратегия за големи данни.