Съдържание:
- Определение - Какво означава откриване на знания в бази данни (KDD)?
- Techopedia обяснява откриването на знания в базите данни (KDD)
Определение - Какво означава откриване на знания в бази данни (KDD)?
Откриването на знания в базите данни (KDD) е процесът на откриване на полезни знания от колекция от данни. Тази широко използвана техника за извличане на данни е процес, който включва подготовка и подбор на данни, изчистване на данни, включване на предварителни знания за наборите от данни и интерпретация на точни решения от наблюдаваните резултати.
Основните области на приложение на KDD включват маркетинг, откриване на измами, телекомуникации и производство.
Techopedia обяснява откриването на знания в базите данни (KDD)
По традиция извличането на данни и откриването на знания се извършваше ръчно. С течение на времето количеството данни в много системи нарасна до по-голям от терабайт размер и вече не можеше да се поддържа ръчно. Освен това, за успешното съществуване на всеки бизнес, откриването на основните модели в данните се счита за изключително важно. В резултат на това бяха разработени няколко софтуерни инструмента, за да се открият скрити данни и да се правят предположения, които са част от изкуствения интелект.
Процесът на KDD достигна своя връх през последните 10 години. Сега той съдържа много различни подходи към откриването, който включва индуктивно обучение, байесова статистика, семантична заявка за оптимизация, придобиване на знания за експертни системи и теория на информацията. Крайната цел е да се извлекат знания на високо ниво от данни от ниско ниво.
KDD включва мултидисциплинарни дейности. Това обхваща съхранение и достъп на данни, алгоритми за мащабиране на масивни масиви данни и интерпретиране на резултати. Процесът на изчистване и достъп до данни, включен в съхранението на данни, улеснява KDD процеса. Изкуственият интелект също подкрепя KDD чрез откриване на емпирични закони от експерименти и наблюдения. Разпознатите в данните модели трябва да са валидни за нови данни и да притежават известна степен на сигурност. Тези модели се считат за нови знания. Стъпки, участващи в целия KDD процес са:
- Определете целта на KDD процеса от гледна точка на клиента.
- Разберете съответните области на приложението и необходимите знания
- Изберете целеви набор от данни или подмножество от извадки от данни, върху които се извършва откриването.
- Почистете и преработете данните, като решите стратегии за обработка на липсващи полета и променяйте данните според изискванията.
- Опростете наборите от данни, като премахнете нежеланите променливи. След това анализирайте полезни функции, които могат да бъдат използвани за представяне на данните, в зависимост от целта или задачата.
- Съпоставете целите на KDD с методите за извличане на данни, за да предложите скрити модели.
- Изберете алгоритми за извличане на данни, за да откриете скрити модели. Този процес включва вземане на решение кои модели и параметри могат да бъдат подходящи за цялостния KDD процес.
- Търсене на модели на интерес в определена форма на представяне, които включват правила за класификация или дървета, регресия и групиране.
- Интерпретирайте основните знания от добитите модели.
- Използвайте знанието и го включете в друга система за по-нататъшни действия.
- Документирайте го и направете доклади за заинтересованите страни.