Съдържание:
Определение - Какво означава Apache Avro?
Apache Avro е рамка за сериализиране на данни и извикване на отдалечени процедури, която е разработена в рамките на проекта Apache Hadoop, където предоставя както сериализиращ формат за получаване на постоянни данни, така и теленен формат за осигуряване на комуникация между възлите Hadoop, както и свързване на клиентски програми с Hadoop услуги.
Avro използва JSON формат за дефиниране на протоколи и типове данни, както и сериализира данните в компактен двоичен формат.
Техопедия обяснява Апаче Авро
Apache Avro е рамка за сериализация на големи данни, която произвежда данни в компактен двоичен формат, който не изисква генериране на код или прокси обекти.
Той се използва като компонент за сериализиране на данни за Apache Hadoop. Avro работи върху концепцията на схемите. Когато се четат данни на Avro, схемата, използвана по време на писането на тези конкретни данни, винаги присъства.
Това позволява всеки набор от данни без режийни разходи, което прави сериализацията както бърза, така и сравнително малка по размер. И тъй като данните и тяхната схема са напълно самоописани, това го прави лесен за използване с динамични езици за скриптове.
Когато данните на Avro се съхраняват в конкретен файл, схемата също се съхранява заедно с тях, за да бъдат обработени по-късно от друга програма. Така че, ако програма, която чете данните, очаква друга схема, тогава това лесно може да бъде разрешено, тъй като и двете схеми са налични.
Avro осигурява:
Компактен и бърз формат на двоични данни
Богати структури от данни
Файл контейнер за съхранение на постоянни данни
Обаждане от отдалечена процедура (RPC)
Интеграция с динамични езици
Генерирането на код не е изискване за четене или писане на файлове с данни или за използване или прилагане на протоколи RPC.
