Съдържание:
Определение - Какво означава Apache Kafka?
Apache Kafka е система за съобщения с отворен код за публикуване и абониране, създадена да осигурява бързо, мащабируемо и устойчиво на грешки обработка на емисии в реално време. За разлика от традиционния корпоративен софтуер за съобщения, Kafka е в състояние да обработва всички данни, преминаващи през компания, и да го прави в почти реално време.
Kafka е написана на Scala и първоначално е разработена от LinkedIn. От това време редица компании го използват за изграждане на платформи в реално време.
Техопедия обяснява Апаче Кафка
Kafka има много сходства с дневниците за транзакции и поддържа емисии от съобщения по теми. Производителите записват данни в теми, а потребителите четат от тези теми, които са разделени и репликирани в множество възли в разпределен системен формат. Kafka е уникална по това, че третира всеки дял на тема като лог и на всяко съобщение в дял е присвоено уникално изместване. Той запазва всички съобщения за определен период от време и потребителите са отговорни за проследяването на тяхното местоположение във всеки лог. Това се различава от предишните системи, където брокерите са отговорни за това проследяване, което силно ограничава способността на системата да мащабира, тъй като броят на потребителите се увеличава. Тази структура позволява на Kafka да поддържа много потребители и да запазва големи количества данни с много ниски разходи.
Kafka може да се използва:
- Като традиционен брокер на съобщения
- За проследяване на активността на уебсайта
- За обобщаване на дневника
- За обработка на голям поток от данни
Kafka може да се използва заедно с Apache Storm, Apache HBase и Apache Spark за анализ в реално време и предоставяне на поточни данни.
