У дома То-Бизнес Какво е неструктуриран извличане на данни? - определение от техопедия

Какво е неструктуриран извличане на данни? - определение от техопедия

Съдържание:

Anonim

Определение - Какво означава неструктуриран анализ на данни?

Неструктурираното извличане на данни е практиката да разглеждаме сравнително неструктурирани данни и да се опитваме да извлечем от тях по-прецизни набори от данни. Често се състои в извличане на данни от източници, които традиционно не се използват за дейности по извличане на данни.


Техопедия обяснява неструктуриран анализ на данни

По принцип извличането на данни е практиката да се комбинират чрез набори от данни и да се опитват да вкарат само най-ценните битове информация в определен формат. Обикновено това е по-трудно при сравнително неструктурирани данни. ИТ специалистите определят неструктурираните данни като данни, които не са в конкретен формат, данни, които са "тежки в текст" или данни, които са "скрити" в неточни документи, които официално не са наредени да предоставят техническа информация.


Пример за неструктуриран документ е писмо или кореспонденция между две или повече страни. При неструктуриран извличане на данни технологиите биха разделили това писмо, търсейки специфични идентификатори и битове информация, като имената на свързаните лица, датите, на които са изпратени писмата, имената на участващите фирми, сумите на валутата или други количествени данни битове данни или кодовете, присвоени на определени продукти, услуги или сделки. Тези видове данни се извличат и след това се поставят във формат, който предприятията или други страни могат да използват за бърза справка или за разработени приложения за бизнес разузнаване.

Какво е неструктуриран извличане на данни? - определение от техопедия