Съдържание:
Определение - Какво означава Apache Kudu?
Apache Kudu е член на екосистемата Apache Hadoop с отворен код. Това е механизъм за съхранение с отворен код, предназначен за структурирани данни, който поддържа произволен достъп с ниска латентност, заедно с ефективни аналитични модели за достъп. Той е проектиран и внедрен, за да преодолее разликата между широко използваната файлова система Hadoop Distributed File System (HDFS) и базата данни HBase NoSQL. Въпреки че тези системи все още могат да се окажат изгодни, Apache Kudu може да се погрижи за много общи натоварвания, тъй като може драстично да опрости архитектурата им.
Техопедия обяснява Апаче Куду
Apache Kudu е разработен предимно като проект в Cloudera. По-голямата част от вноските до този момент са направени от разработчици, наети от Cloudera. По време на неговото пускане в хранилищата на Cloudera бяха включени само удобни двоични файлове, но при приемането на инкубатора той прие процеса на освобождаване на източник на Apache Software Foundation (ASF). Той е специално разработен за случаи, които изискват бърза анализа на бързи данни. Той е проектиран да се възползва от хардуера от следващото поколение и обработката в паметта. Понижава значително латентността на заявките за Apache Impala и Apache Spark. Той разпространява данни чрез колонен двигател за съхранение или чрез хоризонтално разделяне, след което репликира всеки дял, използвайки Raft консенсус, като по този начин осигурява ниско средно време за възстановяване и ниски закъснения на опашката.
Въпреки че Kudu е продукт, създаден в контекста на екосистемата Apache Hadoop, той също така подкрепя интеграцията с други проекти за анализиране на данни както в ASF, така и извън него.
Apache Kudu се оказва ефикасен, тъй като може да обработва аналитични натоварвания в реално време през един слой за съхранение, като по този начин дава на архитектите гъвкавост за справяне с по-голямо разнообразие от случаи на използване без екзотични решения.