Съдържание:
- Определение - Какво означава Extract Transform Load (ETL)?
- Techopedia обяснява натоварване на екстрактен трансформатор (ETL)
Определение - Какво означава Extract Transform Load (ETL)?
Зареждането с екстрактен трансформатор (ETL) е процес на извличане, преобразуване и зареждане по време на използване на базата данни, но по-специално по време на използването на съхранение на данни. Тя включва следните подпроцеси:
- Извличане на данни от външни източници за съхранение или предаване на данни
- Преобразуване на данни в разбираем формат, където обикновено се съхраняват данни заедно с код за откриване и корекция на грешки, за да се отговори на оперативните нужди
- Предаване и зареждане на данни до приемащия край
Techopedia обяснява натоварване на екстрактен трансформатор (ETL)
Първата фаза на ETL процес се фокусира върху извличането на данните от източника на съхранение. Повечето проекти за съхранение на данни интегрират данни, получени от различни източници. Всяка отделна система може да използва отделна организация или формат на данни. Общите структури на източници на данни са релационни бази данни и чисти файлове с данни. Те могат също така да включват нерелационни модели на база данни като системи за управление на информация или други структури от данни като метод за виртуален достъп (VSAM) или индексиран метод на последователен достъп (ISAM). Източниците на данни могат да включват дори външни източници, като например данни, идващи от Интернет или чрез сканираща система.
Фазата на преобразуване използва серия от правила или операции за извличане на чисти данни от източника, за да достави данните в окончателния им вид за манипулиране в приемащия край. Някои източници на данни се нуждаят от много малко или дори никаква обработка на данни. Понякога една или повече трансформации могат да бъдат от решаващо значение за съответствие на бизнес и техническите изисквания на целевата база данни.
Етапът на натоварване или предаване има за цел изпращането на данни до приемащия край, което вероятно ще бъде съхранение на данни. Според нуждите на приложението, този процес може да е много прост или много сложен. Някои методи за съхранение на данни могат да заменят стари данни с натрупани данни. Актуализирането на извлечените данни обикновено се извършва периодично.
