У дома То-Бизнес Как да подхранваме учен с данни

Как да подхранваме учен с данни

Anonim

Сред технологичните стартирания, ученът на данни е все по-често срещан термин, използван за обозначаване на данни, които могат да преодолеят традиционно отделни функционални области на разузнаване на данни. Учен с данни е човек, който удобно изпълнява няколко (ако не всички) аспекти на проектите за разузнаване на данни:

  1. Придобиване на данни: Това може да доведе до писане на персонализирани анализатори и уеб сканери или скриптове, насочени към конкретни уеб услуги или API за нетрадиционни източници на данни.
  2. Управление на данни: ETL, манипулиране, запитване и поддържане на данни в бази данни, магазини с ключова стойност или Hadoop.
  3. Информационна визуализация: Разкриване на модели чрез използване на статични инструменти за визуализация и / или интерактивни платформи, базирани на Flash, JavaScript или обработка.
  4. Анализ: Това може да варира от прости до сложни техники в многовариантна статистика, машинно обучение и НЛП.
  5. Insight: Извличане, обобщаване и представяне на ключови констатации пред широката аудитория.

Има много инструменти, умения и технически подробности и човек може да прекара години, усвоявайки всеки от изброените по-горе елементи. Докато ученият с данни може да не притежава истински експертни познания в никоя от областите, той или тя е удобно да прескача напред-назад и да изпълнява основни задачи във всички тях. Резултатът е изходен с информация, достатъчно бърз за разследване на проект за данни и генериране на отговори на (високо) ниво въпроси от ръководството. (за данните учени в Data Scientist: Новите рок звезди на света на технологиите.)

За да подхранват учени с данни, компаниите трябва да се съсредоточат повече върху културата и организационната структура. Много служители на данни имат достатъчно умения и обучение, за да станат бързо продуктивни в много области на информационната информация. Проблемът е, че повечето не работят в среда, която ги насърчава да станат учени по данни. Те са заседнали в силози и са ограничени до една или две области на разузнаване на данни. Често те са ограничени да използват инструменти, „одобрени“ от техните мениджъри.

Как да подхранваме учен с данни