Съдържание:
Определение - Какво означава уеб майнинг?
Извличането на уеб е процесът на използване на техники и алгоритми за извличане на данни за извличане на информация директно от мрежата чрез извличането й от уеб документи и услуги, уеб съдържание, хипервръзки и сървъри. Целта на уеб майнинга е да търси модели в уеб данните, като събира и анализира информация, за да добие представа за тенденциите, индустрията и потребителите като цяло.Techopedia обяснява Web Mining
Уеб майнингът е клон за извличане на данни, съсредоточен върху World Wide Web като основен източник на данни, включващ всички негови компоненти от уеб съдържание, сървърни логове към всичко между тях. Съдържанието на данни, извлечени от мрежата, може да представлява съвкупност от факти, които уеб страниците трябва да съдържат и могат да се състоят от текст, структурирани данни като списъци и таблици и дори изображения, видео и аудио.
Категории на уеб майнинг:
- Извличане на уеб съдържание - Това е процесът на извличане на полезна информация от съдържанието на уеб страници и уеб документи, които са предимно текст, изображения и аудио / видео файлове. Техниките, използвани в тази дисциплина, са силно извлечени от обработката на естествен език (НЛП) и извличането на информация.
- Извличане на уеб структура - Това е процесът на анализ на възлите и структурата на връзката на уебсайта чрез използването на графична теория. От това могат да се получат две неща: структурата на уебсайт по отношение на това как е свързана с други сайтове и структурата на документа на самия уебсайт по отношение на това как е свързана всяка страница.
- Извличане на използване на мрежата - Това е процесът на извличане на модели и информация от сървърните дневници, за да получите представа за потребителската активност, включително откъде са потребителите, колко са кликнали върху какъв елемент в сайта и видовете дейности, които се извършват в сайта.