Съдържание:
- Определение - Какво означава паралелен анализ на данни?
- Techopedia обяснява паралелния анализ на данните
Определение - Какво означава паралелен анализ на данни?
Паралелният анализ на данни е метод за анализ на данни с помощта на паралелни процеси, които работят едновременно на множество компютри.
Процесът се използва при анализа на големи масиви от данни като големи записи на телефонни разговори, мрежови дневници и уеб хранилища за текстови документи, които могат да бъдат твърде големи, за да бъдат поставени в една релационна база данни. Методът често се използва в Big Data Analytics и общ анализ на данни.
Techopedia обяснява паралелния анализ на данните
Основната концепция зад паралелния анализ на данни е паралелизмът, дефиниран в изчисленията като едновременно изпълнение на процеси.
Това често се постига чрез използване на множество процесори или дори няколко компютъра и е често срещана практика при разпределените изчисления. При паралелен анализ на данни различните компютри, изпълняващи различни аспекти на анализа на данни, едновременно изпълняват тези процеси и след това консолидират резултатите в един голям доклад.
Причината за този паралелизъм е главно да се направи анализ по-бърз, но също така е, защото някои набори от данни може да са твърде динамични, прекалено големи или просто прекалено неудобни, за да бъдат поставени ефективно в една релационна база данни. Резултатът ще бъде, че тези набори от данни са разположени в различни бази данни, оптимизирани за този вид данни и в различни машини, така че линейният анализ просто няма да бъде ефективна опция.
