Q:
Каква е разликата между големи данни и извличане на данни?
A:Големите данни и извличането на данни са две различни неща. И двете се отнасят до използването на големи набори от данни за обработка на събирането или отчитането на данни, които обслужват бизнеса или други получатели. Двата термина обаче се използват за два различни елемента от този вид операция.
Големите данни са термин за голям набор от данни. Големите набори от данни са тези, които превъзхождат простия вид архитектура на бази данни и обработка на данни, които са били използвани в по-ранни времена, когато големите данни са били по-скъпи и по-малко изпълними. Например, набори от данни, които са твърде големи, за да бъдат лесно обработвани в електронната таблица на Microsoft Excel, могат да бъдат посочени като големи масиви от данни.
Извличането на данни се отнася до активността на преминаване през големи масиви данни за търсене на подходяща или уместна информация. Този вид дейност е наистина добър пример за старата аксиома „търсене на игла в сено“. Идеята е бизнесът да събира масивни масиви от данни, които могат да бъдат еднородни или автоматично събрани. Лицата, които вземат решения, се нуждаят от достъп до по-малки, по-специфични части от тези големи масиви. Те използват извличането на данни, за да разкрият информацията, която ще информира лидерството и ще помогне да се начертае курса за бизнес.
Извличането на данни може да включва използването на различни видове софтуерни пакети като инструменти за анализи. Тя може да бъде автоматизирана или може да бъде в голяма степен трудоемка, когато отделните работници изпращат конкретни запитвания за информация в архив или база данни. По принцип извличането на данни се отнася до операции, които включват сравнително сложни операции за търсене, които връщат насочени и конкретни резултати. Например инструментът за извличане на данни може да прегледа десетки години счетоводна информация, за да намери конкретна колона от разходи или вземания за конкретна операционна година.
Накратко, големите данни са актив, а извличането на данни е "манипулаторът", който се използва за осигуряване на полезни резултати.