Както е, казва изпълнителният директор на Cloudera Майк Олсън, платформата за анализ Hadoop има някои значителни ограничения, включващи скорост и сложност. Въпреки това, ръководителите на индустрията - включително тези в неговата фирма - работят за това да променят, уверени, че този инструмент за изследвания ще се развие по фундаментални начини през следващите години.
На миналогодишната конференция на Стратегията Олсън помоли публиката да си представи как ако бъде създаден днес, Hadoop ще бъде проектиран по различен начин, заявявайки, че някои специфични промени могат да отворят нови врати за научни изследвания в области като образование, енергетика и селско стопанство. Позовавайки се на космолога и научния автор Карл Сагън, Олсън подчерта важността на разбиването на данните от високо ниво за по-голяма аудитория.
„Мисля, че сме готови на ръба на големите открития, които имат значение за бизнеса и за обществото“, каза Олсън.
Един пример, отбеляза той, е научното откритие, станало възможно благодарение на работата на научни специалисти на Големия адронен колайдер в Швейцария. Според Олсън, ежедневната оценка на 37 терабайта данни е довела до ключов напредък като водоразбора на Хигс-Босон откритие, което разкри ключови аспекти на материята и енергията. Олсън добави, че Hadoop помага за подпомагане на тези основни изследователски проекти, като улавя огромно количество данни в едно хранилище, но че е трудно да се взаимодейства с тези данни в реално време.
Обяснявайки начините, по които Hadoop и подобни технологии могат да помогнат на учените в ключови области, като здравеопазването, Олсън също обяви проекта Impala, нещо, над което неговата компания работи от две години, с две четвърти бета-тестове в координация с големи клиенти. Проектът Impala, каза Олсън, е „100% отворен код“ технология с лицензиране на Apache, която работи с Hadoop като „двигател за заявки в реално време“. Това, каза Олсън, позволява това, което той нарича „бързина на мисловни запитвания“, където потребителите могат да зададат въпрос, да получат отговор и да формулират нов въпрос за ефективно използване на големи клъстери от данни.
"Това ви дава нов начин да се запознаете с вашите данни", каза Олсън, очертавайки как този вид напредък може да отвори допълнителни възможности за решаване на големи проблеми в САЩ и в чужбина.