Съдържание:
Определение - Какво означава Data Lake?
Езерото с данни е масивно, лесно достъпно, централизирано хранилище от големи обеми от структурирани и неструктурирани данни.Техопедия обяснява Data Lake
Архитектурата на езерото с данни е подход на всичко, което се съхранява на големи данни. Данните не са класифицирани, когато се съхраняват в хранилището, тъй като стойността на данните не е ясна в началото. В резултат на това се елиминира подготовката на данни. Следователно езерото с данни е по-малко структурирано в сравнение с конвенционален склад за данни. Когато има достъп до данните, само тогава те се класифицират, организират или анализират.
Hadoop, рамка с отворен код за обработка и анализ на големи данни, може да се използва за пресяване на данните в хранилището.
