В миналото, когато се мисли за цифрови данни, имаше смисъл да се разделят данни между транзакционните данни, данните, заснети в бизнес приложенията, съхранявани в таблици на базата данни и представени от BI инструменти, и всички други данни: имейли, уеб страници, изображения, видео и така нататък. В днешно време ние сме склонни да наричаме такива „други данни“ като неструктурирани данни.
Независимо от това беше анализирано и софтуерът за извличане на стойност от такива данни е преминал през пропастта. Именно аналитичният императив повече от всичко друго породи първоначалната концепция за езеро от данни, хранилище за двата вида данни и освен това за данни, събрани от множество източници, различни от бизнеса, някои от които неизбежно бяха неструктурирани.
В този документ ще разгледаме как новата екосистема, създадена от езерото с данни, вече няма да се състои изцяло от транзакциите (или събитията) на бизнеса. В него ще бъдат включени и данни от други източници, които бизнесът използва за извършване на анализи и информиране на потребителите си за важна информация, на която могат да се основават решенията. Системата на запис ще бъде, както винаги беше, златното копие на корпоративните данни и одитната следа на ИТ дейностите на бизнеса.