Q:
Кои са някои от основните проблеми, които трябва да се вземат предвид при стратегията за съхранение на големи данни?
A:Един от най-големите проблеми, който се игнорира при съхранение на големи данни, е достъпността за екипи, които се нуждаят от него. Данните се съхраняват редовно без документация, на места, където е трудно достъпен или където съответните екипи не се съобразяват с факта, че изобщо съществуват. В крайна сметка голямото съхранение на данни трябва да вземе отворена първа стратегия, при която екипите са осведомени за неговото съществуване, от какво се състоят данните и как да получат достъп до тях, така че екипите да могат да ги използват в софтуера, ако имат нужда от тях.
Друг критичен проблем, който намирам, е качеството на данните, които се съхраняват. Данните трябва да се съхраняват в най-висококачествената форма, в която могат да съществуват, на крайното си място за съхранение. Съхраняването на данни с ниско качество в езерото с данни обикновено е добре, но тъй като продължава надолу по тръбопровода за данни, всеки етап трябва да повиши качеството на данните, така че да се съхраняват в най-висококачествената форма в система като база данни или аналитична база данни. Това ще повиши качеството на системите, които консумират мястото за почивка на данните.