Съдържание:
- Определение - Какво означава предварителна обработка на данни?
- Techopedia обяснява предварителна обработка на данните
Определение - Какво означава предварителна обработка на данни?
Предварителната обработка на данни е техника за извличане на данни, която включва преобразуване на сурови данни в разбираем формат. Данните от реалния свят често са непълни, непоследователни и / или липсват в определени поведения или тенденции и вероятно съдържат много грешки. Предварителната обработка на данни е доказан метод за решаване на подобни проблеми. Предварителната обработка на данни подготвя сурови данни за по-нататъшна обработка.
Предварителната обработка на данни се използва задвижвани от бази данни приложения като управление на взаимоотношенията с клиенти и приложения, базирани на правила (като невронни мрежи).
Techopedia обяснява предварителна обработка на данните
Данните преминават през серия от стъпки по време на предварителната обработка:
- Почистване на данни: Данните се изчистват чрез процеси като попълване на липсващи стойности, изглаждане на шумните данни или разрешаване на несъответствията в данните.
- Интеграция на данни: Данните с различни представи са събрани и конфликтите в тях се разрешават.
- Преобразуване на данни: Данните са нормализирани, обобщени и обобщени.
- Намаляване на данните: Тази стъпка има за цел да представи намалено представяне на данните в хранилището на данни.
- Дискретизация на данните: включва намаляване на редица стойности на непрекъснат атрибут чрез разделяне на обхвата на интервалите на атрибутите.
