Какво е apache kudu? - определение от техопедия

2026

Съдържание:

Определение - Какво означава Apache Kudu?
Техопедия обяснява Апаче Куду

Определение - Какво означава Apache Kudu?

Apache Kudu е член на екосистемата Apache Hadoop с отворен код. Това е механизъм за съхранение с отворен код, предназначен за структурирани данни, който поддържа произволен достъп с ниска латентност, заедно с ефективни аналитични модели за достъп. Той е проектиран и внедрен, за да преодолее разликата между широко използваната файлова система Hadoop Distributed File System (HDFS) и базата данни HBase NoSQL. Въпреки че тези системи все още могат да се окажат изгодни, Apache Kudu може да се погрижи за много общи натоварвания, тъй като може драстично да опрости архитектурата им.

Техопедия обяснява Апаче Куду

Apache Kudu е разработен предимно като проект в Cloudera. По-голямата част от вноските до този момент са направени от разработчици, наети от Cloudera. По време на неговото пускане в хранилищата на Cloudera бяха включени само удобни двоични файлове, но при приемането на инкубатора той прие процеса на освобождаване на източник на Apache Software Foundation (ASF). Той е специално разработен за случаи, които изискват бърза анализа на бързи данни. Той е проектиран да се възползва от хардуера от следващото поколение и обработката в паметта. Понижава значително латентността на заявките за Apache Impala и Apache Spark. Той разпространява данни чрез колонен двигател за съхранение или чрез хоризонтално разделяне, след което репликира всеки дял, използвайки Raft консенсус, като по този начин осигурява ниско средно време за възстановяване и ниски закъснения на опашката.

Въпреки че Kudu е продукт, създаден в контекста на екосистемата Apache Hadoop, той също така подкрепя интеграцията с други проекти за анализиране на данни както в ASF, така и извън него.

Apache Kudu се оказва ефикасен, тъй като може да обработва аналитични натоварвания в реално време през един слой за съхранение, като по този начин дава на архитектите гъвкавост за справяне с по-голямо разнообразие от случаи на използване без екзотични решения.

Какво е apache kudu? - определение от техопедия

Какво е влиянието на отворения код върху екосистемата apache hadoop?

Една от основните причини екосистемата Hadoop е толкова голям успех е, че тя е свободна и отворена рамка за софтуер за големи данни. Софтуерните разработчици могат да имат достъп и да променят неговия изходен код, за да създадат свои собствени продукти за големи данни или ...

Как тренировката apache улеснява анализа на данните за всички

Само чрез анализа на големи данни действителната стойност на големите данни става ясна. Но тези анализи изискват статистически и технически познания, за да се приложи всяко решение за големи данни. Така че предположението е, че ...

Kudu: Промяна на играта в hadoop екосистемата?

Kudu е нов проект с отворен код, който осигурява актуализирано съхранение. Той е допълнение към HDFS / HBase, което осигурява последователно съхранение и само за четене. Kudu е по-подходящ за бърз анализ на бързи данни, който е ...