Съдържание:
Определение - Какво означава извличане на данни?
Извличането на данни е мястото, където данните се анализират и обхождат, за да се извлече съответната информация от източници на данни (като база данни) по определен модел. Извършва се допълнителна обработка на данни, която включва добавяне на метаданни и интегриране на други данни; друг процес в работния процес на данни.
По-голямата част от извличането на данни идва от неструктурирани източници на данни и различни формати на данни. Тези неструктурирани данни могат да бъдат под всякаква форма, като таблици, индекси и анализи.
Techopedia обяснява извличането на данни
Данните в даден склад могат да идват от различни източници, за складиране на данни са необходими три различни метода, за да се използват входящите данни. Тези процеси са известни като извличане, трансформация и зареждане (ETL).
Процесът на извличане на данни включва извличане на данни от разрошени източници на данни. След това извлеченията от данни се зареждат в зоната на стадиране на релационната база данни. Тук се използва логиката на извличане и изходната система се запитва за данни, използвайки интерфейси за програмиране на приложения. След този процес данните вече са готови да преминат през фазата на трансформация на процеса ETL.