Съдържание:
Определение - Какво означава SQL на Hadoop?
SQL on Hadoop е вид инструмент за аналитично приложение - реализацията на SQL на платформата Hadoop, която комбинира стандартно SQL-запитване на структурирани данни със структурата на данни Hadoop. Hadoop е сравнително нова платформа, както и самите големи данни и не много специалисти са експерти в нея, но SQL на Hadoop опростява достъпа до рамката на Hadoop и улеснява внедряването в настоящите корпоративни системи.
Techopedia обяснява SQL на Hadoop
SQL на Hadoop се отнася до различни реализации на SQL за платформата Hadoop. MapReduce, който е картограф на задачи на Hadoop и организатор на резултати, поддържа SQL като основен случай на използване, както и други методи за обработка. Затова има смисъл да се създават мощни инструменти за разрешаване на SQL, който е един от най-широко използваните езици за заявки и манипулиране на база данни. Тъй като Hadoop набира популярност за архитектурата на корпоративните данни, SQL е ключов за правилното приемане както на слабо структурирани данни, така и на структурирани данни, използвани в Hadoop.
SQL на ключовите драйвери на Hadoop включват:
- Използване на съществуващите SQL умения, присъстващи в повечето организации
- Използване на повторно натоварване на екстрактен трансформатор (ETL), бизнес разузнаване (BI) и анализи за инвестиции в инфраструктура в Hadoop
Някои SQL на Hadoop реализации включват:
- Apache Spark SQL
- Apache кошер
- Apache Tajo
- Apache бормашина
- HP Vertica на MapR
- ODBC драйвери
- престо
- акула
