Съдържание:
- Определение - Какво означава анализ на големи данни с отворен код?
- Techopedia обяснява анализи за големи данни с отворен код
Определение - Какво означава анализ на големи данни с отворен код?
Анализът на големи данни с отворен код се отнася до използването на софтуер и инструменти с отворен код за анализиране на огромни количества данни, за да се събере подходяща и приложима информация, която една организация може да използва за постигане на своите бизнес цели. Най-големият играч в анализа на големи данни с отворен код е Hadoop на Apache - това е най-използваната софтуерна библиотека за обработка на огромни набори от данни в клъстер от компютри, използващи разпределен процес за паралелизъм.
Techopedia обяснява анализи за големи данни с отворен код
Анализът на големи данни с отворен код използва софтуер и инструменти с отворен код за изпълнение на анализи на големи данни чрез използване на цяла софтуерна платформа или различни инструменти с отворен код за различни задачи в процеса на анализиране на данни. Apache Hadoop е най-известната система за анализиране на големи данни, но са необходими други компоненти, преди да може да се събере реална аналитична система.
Hadoop е реализацията с отворен код на алгоритъма MapReduce, създаден от Google и Yahoo, така че той е основата на повечето аналитични системи днес. Много инструменти за анализиране на големи данни използват отворен код, включително стабилни системи от бази данни като отворен код MongoDB, сложна и мащабируема база данни NoSQL, много подходяща за приложения с големи данни, както и други.
Услугите за анализиране на големи данни с отворен код включват:
- Система за събиране на данни
- Център за контрол за администриране и наблюдение на клъстери
- Библиотека за машинно обучение и извличане на данни
- Услуга за координация на приложения
- Изчислете двигателя
- Рамка за изпълнение