Съдържание:
Определение - Какво означава Data Wrangling?
Подреждането на данни е специфичен тип управление на данни, който е възникнал от новите софтуерни възможности, въвеждащи големи, разхвърлени и разнообразни набори от данни, които трябва да влязат в архитектура, ориентирана към услуги (SOA) за целите на анализа и използването. Подреждането на данни обикновено включва много различни сложни техники за работа с нередовни или разнообразни данни и манипулиране с тях за случаи на бизнес използване.
Техопедия обяснява сключването на данни
Това може да звучи като неформален термин, но борбата с данни всъщност заема определено пространство в управлението на данни. Един полезен начин за разбиране на разминаването на данни е да го сравним с често по-официалната методология за извличане, преобразуване и зареждане (ETL). Подреждането на данни има различни аспекти и случаи на използване от ETL. Често се прави от квалифицирани учени с данни или други, близки до тръбопровода. По някакъв начин разделянето на данни може да се нарече вид „отворен код“ ETL, тъй като тези инженери, които се занимават с данните, могат да бъдат по-„практически“ или да използват повече ръчни методи за извличане.
За тези, които наистина разбират усъвършенстваните процеси, чрез които разнообразните данни се събират, сортират и подават в корпоративните архитектури, разминаването на данни всъщност е много важна тема. ИТ специалистите разглеждат огромен набор от инструменти, ресурси и техники, за да донесат стойност от разхвърляни, сурови или неструктурирани данни.