У дома звуков Анализ на ръба: най-после йот икономиката

Анализ на ръба: най-после йот икономиката

Anonim

От персонала на Техопедия, 22 септември 2016 г.

Отнемане: Домакинът Ребека Йозвяк обсъжда анализа на ръба с д-р Робин Блур, Дез Бланчфийлд и Шон Роджърс на Dell Statistica.

В момента не сте влезли. Моля, влезте или се регистрирайте, за да видите видеото.

Rebecca Jozwiak: Дами и господа, здравей, и добре дошли в горещите технологии на 2016 г. Днес имаме „Edge Analytics: Икономиката на IoT най-сетне.“ Името ми е Ребека Джозвяк. Аз ще бъда ваш модератор за днешното излъчване в мрежата. Правим чуруликане с хештег от # HOTTECH16, ако искате да се присъедините към разговора в Twitter.

Така че IoT, определено гореща тема тази година и интернет на нещата, наистина става въпрос за машинните данни, сензорните данни, данните от дневника, данните на устройството. Нито едно от тях не е ново, ние сме имали такъв тип данни завинаги, но това е, че всъщност не сме успели да го използваме и сега виждаме само един куп нови начини да използваме тези данни. Особено в медицинската индустрия, финансовите пазари, с нефт и газ, стоки, това е просто богатство от информация, която преди не е използвана. И не много хора наистина са разбрали добре как да постигнат това добре. Говорим за много малко данни, но това е много данни и, знаете, има проблеми с мрежата, има включен хардуер или трябва да се обработва и как да направите това, без да запушвате системата си? Е, за това ще научим днес.

Ето нашата гама от експерти. Имаме д-р Робин Блур, наш главен анализатор от The Bloor Group. Имаме и Дез Бланчфийлд, наш учен по данни от The Bloor Group. И сме щастливи, че имаме Шон Роджърс, директор на глобалния маркетинг и канали от Dell Statistica. И с това ще предам топката на Робин.

Д-р Робин Блур: Добре, добре ви благодаря за това. Ще натисна бутон и ще хвърля слайд. Нямам идея защо създадох тази апокалиптична картина за интернет на нещата. Възможно, защото смятам, че в крайна сметка ще стане хаотично. Ще продължа направо. Това е номинално за курса във всяка IoT презентация. По един или друг начин трябва да кажете нещо възмутително за това къде върви. И всъщност повечето от това вероятно е вярно. Ако всъщност погледнете начина, по който тези криви постепенно се разширяват. Знаете ли, че личните компютри, смартфони и таблети вероятно ще продължат да нарастват. Умните телевизори вероятно ще се повишат. Носими, те вероятно експлодират в момента, в сравнение с това, което бяха преди няколко години. Свързани автомобили, неизбежно е почти всички коли да бъдат свързани широко и цялостно да предават данни през цялото време. И всичко останало. И тази конкретна графика на BI Intelligence показва, че всичко останало ще надвиши очевидните неща много, много бързо.

И така, какво да кажа за IoT? Първото нещо е просто архитектурна точка. Знаеш ли, че когато имаш данни и обработваш по един или друг начин, ще трябва да събереш двете. И с данни за обемите, които са сега, и събирането на различни места, двете вече естествено не са заедно. Те бяха в старите дни на мейнфрейм, предполагам. Така че можете да мислите от гледна точка на това, че има обработващ слой, транспортен слой и слой данни. И по един или друг начин транспортният слой в днешно време ще премести обработката или да премести данните в различните мрежи. Така че тук са изборите: Можете да преместите данните в обработката, можете да преместите обработката в данните, можете да преместите обработката и данните в удобна точка за изпълнение или можете да разделяте обработката и да разделяте данните. А що се отнася до интернет на нещата, данните по принцип са вече осечени при раждането и вероятността е много голяма част от обработката да бъде осечена, за да могат да се изпълняват приложенията, които трябва да стартират.

Значи съм нарисувал картина. Интересното за мен за IoT, в тази диаграма говоря за агрегиращ домейн и посочвам, че има поддомейни. Така че можете да си представите, че IoT домейн 1 тук е някакъв автомобил, а домейн 2 и домейн 3 и домейн 4 са автомобили от някакъв вид и ще обединявате данни на местно ниво, ще стартирате локални приложения на тези данни и ще поставите различни неща в действие. Но за да имате анализи за всички автомобили, ще трябва да прехвърляте данни в центъра, а не непременно всички данни, но ще трябва да агрегирате в центъра. И ако мислите за това, тогава може да искате да имате много, много различни домейни за агрегиране към един и същ набор от неща в IoT. И самите домейни могат допълнително да се агрегират. Така че бихте могли да имате тази повтаряща се йерархия. И всъщност това, което имаме там, е невероятно сложна мрежа. Далеч по-сложен от всичко, което трябваше да имаме преди.

Имам бележка отдолу тук. Всички мрежови възли, включително възлите на листата, могат да бъдат създатели на данни, хранилища на данни и точки за обработка. И това ви дава възможност за разпространение, подобно на което не сме виждали досега. Dez ще поговори малко повече за това, така че ще продължа към тази конкретна точка. След като сме в интернет на нещата и всички данни всъщност са се превърнали в събития, смисълът на този слайд е само да посочи, че ще трябва да се стандартизираме за събития. Най-малкото ще трябва да имаме това. Ще имаме времето на събитието, географското местоположение, на което се е случило, виртуалното или логическото местоположение на процеса, който го е създал, устройството източник, което го е създало, идентификатора на устройството, така че да знаете точно кое устройство на източника го е създало, собственост от данните и участниците, онези хора, които имат право да използват данните по някакъв или друг начин, ще трябва да носят разрешенията си със себе си, което значи наистина, ще трябва да носят сигурност със себе си, и тогава има самите данни. И когато погледнете това, осъзнавате, че, дори да имате сензор, който не прави нищо повече от отчитане на температурата на нещо на всяка секунда или нещо, всъщност има доста данни, за да идентифицирате точно къде са данните произхожда и какво всъщност е. Между другото, това не е изчерпателен списък.

Така че, що се отнася до бъдещия IT пейзаж, начинът, по който аз го виждам, е следният: че това не е само интернет на нещата, има и фактът, че ще бъдем в свят на дейности, управлявани от събития, и следователно ние ще трябва да имат архитектури, управлявани от събития, и тези архитектури ще трябва да обхващат големи мрежи. И другото е всичко в реално време, не е задължително да бъдем в реално време, но има нещо, което наричам работно време, което е времето, в което данните всъщност трябва да бъдат предадени и готови да се обработва. Това може да не е милисекунда след създаването му. Но винаги има такова време за всяка част от данните и след като имате архитектура, управлявана от събития, започва да става по-разумно да мислите по отношение на подхода в реално време към начина, по който работи светът.

Така че го сваряваме, защото това, за което всъщност говорим, е анализа на IoT. Въпреки всичко това все още е време за прозрение и не само е време за прозрение, прозрението трябва да бъде последвано от действия. И така, времето за прозрение и времето за действие е това, към което бих го спуснал. След като каза това, ще предам топката обратно на Дез.

Дез Бланчфийлд: Благодаря ти, Робин. Проницателен както винаги. Обичам факта, че е тежък акт, който трябва да спазвам на всяка инстанция, но ще направя всичко възможно.

Едно от нещата, които виждам и често се забавлявам от това, за да бъда честен, и то не в непоколебима и отрицателна наклонена форма, но има много притеснения и паника за интернет от нещата, които превземат света и ще ни сложите и ще започнете да губите данните си, така че искам да погледна малко някои неща, които сме правили преди през последните две-три десетилетия, които бяха близък факс към интернет на нещата, но може би не съвсем в същия мащаб. И просто да си покажем, че всъщност сме били тук и решихме някои от проблемите, не на това ниво на мащаб и не с тази скорост. Защото това означава, че всъщност можем да разрешим проблема и да знаем какви са някои от отговорите; току-що трябва да претърпим и да приложим отново някои от наученията, които имахме преди. И знам, че това е целият разговор, който предстои да проведем, и имам цял набор от забавни неща, за да разговарям в секцията „Въпроси и отговори“.

Но когато мислим за интернет на нещата от кръга, в момента има голяма степен на централизация на дизайнерско ниво, написана в най-ранните дни. Например, устройствата с Fitbit, обикновено, отиват на едно централно място и вероятно някъде са хоствани в облачна платформа и всички тези данни от всички тези устройства попадат в един и същ, да кажем, челен край на стека, включително уеб и услуги и базирани на данни услуги. Но с течение на времето този мащаб ще изисква реинженеринг, за да се справи с количеството данни, които идват при тях, и те ще реинженират, така че да има множество предни краища и множество копия на стека в множество места и региони. И ние виждаме това и има редица примери, които ще ви дам, които можем да обсъдим.

Ключовият момент в това е, че въпреки че видяхме някои от тези решения, които предстои да покрия, мащабът и обемът на данните и мрежовият трафик, който интернет на нещата ще генерира, изискват спешно изместване от централния според мен, и ние знаем това, но не е задължително да разберем какво е решението. Когато мислим за концепцията за това какво представлява интернет на нещата, това е мащабен мрежов модел. Много и много неща вдигат шум. Неща, които доскоро не вдигаха шум. И всъщност мисля, че беше вчера, на шега говорих за стека, но отидох да си купя нов тостер и той дойде с опция, която може да ми каже различни неща, включително когато има нужда от почистване. И нова микровълнова печка с много подобна функция и дори всъщност може да пинг приложение на телефона ми, за да кажа, че нещото, което аз подгрявам, вече е направено. И много съм на мнение, че ако има няколко неща, които не искам да ми говорят, това е моят хладилник, микровълнова печка и тостери. Доста ми е приятно с това, че са тъпи устройства. Но наскоро имам нов автомобил, малко Audi, и той говори с мен и съм доста доволен от това, защото нещата, за които говори, са интересни неща. Като актуализиране на карти в реално време, за да ми кажете къде има по-добър маршрут да стигнете от точка А до точка Б, тъй като се открива трафик чрез различни механизми с данни, които се изпращат.

Имам този слайд. Вече видяхме, че мрежовите модели с голям обем изискват преминаване от централно към разпределено захващане и доставка на модели за обработка на данни и анализи. Видяхме как нещата се движат от трите малки графични диаграми там от дясния ръб, където имаме, тази отляво от трите, има централизиран модел с всички малки устройства, които идват до централното място и събират данни и мащабът не е толкова голям, те се справят отлично там. В средата имаме малко по-децентрализиран модел и хъб и говорим, което според мен ще ни трябва с интернет на нещата от следващото поколение. И тогава от дясната страна имаме тази напълно разпределена и мрежеста мрежа, която е мястото, където интернет на нещата и машината на машината ще влезе в много кратък срок в бъдеще, но не сме съвсем там по редица причини. И най-вече защото досега използваме интернет платформи за повечето комуникации и всъщност не сме изградили втора мрежа, която да носи много от тези данни.

Има втори мрежи, които вече съществуват като Batelco мрежа. Много хора не мислят за факта, че мрежите на телекомите не са интернет. Интернет е много отделно нещо в много отношения. Те пренасочват данни от смартфони през телефонните мрежи, а след това през телефонните мрежи и в интернет като цяло, където всъщност ги разпределят в две мрежи. Но е напълно възможно и вероятно интернет на нещата да се нуждае от друга мрежа. Ние говорим за индустриалния интернет като тема като цяло, която сега няма да навлизаме в подробности, но по същество говорим за друга мрежа, която е специално разработена за видовете превоз за данни или интернет на неща и машина-машина комуникация.

Но някои от примерите, които исках да споделя, където сме виждали мрежи с голям обем и разпределени данни работят много добре, са неща като интернет. Интернет беше специално проектиран и проектиран от първия ден, за да може да оцелее в ядрена война. Ако части от САЩ са взривени, интернет е проектиран така, че данните да могат да се движат по интернет без загуба на пакети поради причини, които все още сме свързани. И това съществува и до днес в глобален мащаб. Интернет има множество възможности около пакети за излишък и маршрутизация. И всъщност интернет се контролира от нещо, наречено BGP, Border Gateway Protocol и Border Gateway Protocol, BGP, специално проектирано да се справи с маршрутизатор или превключвател или сървър, който е надолу. Когато изпращате или получавате имейл, ако изпращате три имейла подред, няма гаранция, че всеки от тези имейли ще следва същия маршрут до същата крайна цел. Те могат да се движат през различни части на интернет по различни причини. Може да има прекъсване, може да има прозорци за поддръжка, където нещата са офлайн, за да бъдат модернизирани, може просто да има задръствания в мрежата и виждаме, че с неща като мрежи за движение с автомобили и градски транспорт и кораби и самолети. Ние получаваме съдържание на нашите устройства като нашите лаптопи и таблети и компютри чрез браузъри и така нататък всеки ден чрез мрежи за доставка на съдържание. Мрежите за доставяне на съдържание се отнасят за вземане на копия на съдържание от вашата основна платформа за обслужване, като уеб сървъра и преместване на копия на това и кеш малки количества до ръба на мрежата и доставяне само на вас от най-близката част на ръба.

Анти-спам и киберсигурност - ако спам събитие се проведе в Канада и Microsoft го открие и види, че има много копия от един и същ имейл, изпращани на група случайни хора, контролните суми се вземат на това, подпис за това съобщение е създаден и пуснат в мрежа и разпространен веднага. И така че този имейл никога не постъпва във входящата ми поща, или ако има, веднага се маркира като спам, защото е открит някъде другаде в края на мрежата. И така на други части от ръба на мрежата се казва за този подпис на спам съобщение и то се поставя в индекса на базата данни и ако тези съобщения започнат да се появяват от другата страна на планетата, ние ги откриваме и знаем, че са спам. И същото важи за киберсигурността. Хак, който се случва от едната страна на планетата, се открива и регистрира и картографира и изведнъж в другата част на мрежата можем да се борим с нея и да попълним правилата и политиките и да променим, за да видим дали можем да я блокираме. Особено с новото въздействие на неща като отказ на услуга или разпространено отказване на услуга, където хиляди машини се използват за атака на централен уебсайт.

Биткойнът и блокчейнът по подразбиране са по своя характер разпределена книга, блокчейн и се справят с всякакви прекъсвания или счупвания в мрежата. Откриване и предотвратяване на измами, електроснабдяване и водоснабдяване - виждаме, знаете ли електрическата мрежа, ако една част от мрежата получи дърво върху нея и извади стълб и жица, моята къща все още получава захранване. Дори не знам за това, често дори не го виждам в новините. И всички сме свикнали с транспортните мрежи, където първоначално е имало централизиран модел, „Всички пътища водеха към Рим“, както се казва, и в крайна сметка трябваше да преминем към децентрализирания модел с главини и спици, след което отидохме до мрежеста мрежа, където можете да стигнете от едната страна на града до другата чрез различни мрежести маршрути и различни кръстовища. И така, това, което виждаме тук, е, че този централизиран модел на това, което правим сега с интернет на нещата, ще трябва да избута до ръба на мрежата. И това се отнася за аналитиката повече от всякога и това е, че трябва да изтласкаме аналитиката навън в мрежата. И за целта, според мен е необходим напълно нов подход в начина на достъп и обработка на тези данни и потоците от данни. Вече говорим за сценарий, при който смятам, че виждаме ограничена интелигентност, изтласкана до ръба на мрежата на свързани с интернет устройства, но скоро ще видим тези устройства да се увеличават в интелигентността и да увеличават нивото на аналитичност, което искат да направя. И в резултат на това ние ще трябва да изтласкаме тези умници все повече и повече през мрежата.

Например, интелигентни приложения и социални медии - ако мислим за социалните медии и някои от умните приложения, те все още са много централни. Знаете ли, има само два или три центъра за данни за харесванията на Facebook. Google са станали доста по-децентрализирани, но все още има ограничен брой центрове за данни по целия свят. Тогава, когато мислим за персонализация на съдържанието, трябва да помислите на много местно ниво. Голяма част от това се прави във вашия браузър или на местен слой за доставка на съдържание. И ние мислим за здравето и фитнес тракерите - голяма част от данните, които се събират от тях, се анализират локално и така новите версии на устройствата Garmin и Fitbit, които поставяте на китката си, стават все по-умни и по-интелигентни в устройството, Те сега не изпращат всички данни за сърдечната си честота обратно на централизиран сървър, за да се опита да свърши анализата; те вграждат тази интелигентност директно в устройството. В навигацията в колата, преди беше, че колата непрекъснато ще получава актуализации и карти от централно място, сега разумът е в колата и колата сама взема решения и в крайна сметка колите ще се откачат. Автомобилите ще си говорят помежду си чрез безжични мрежи под някаква форма, които може да са над 3G или 4G безжична мрежа в следващото поколение, но в крайна сметка това ще бъде устройство за устройство. И единственият начин да се справим с обема на това е като направим устройствата по-умни.

Вече имаме системи за предупреждение за аварийни ситуации, които ще събират информация на местно ниво и ще я изпращат централно или в мрежова мрежа и ще вземат решения за случващото се на местно ниво. Например в Япония има приложения, които хората работят на смартфоните си с акселерометри в смартфона. Акселерометрите в смартфона ще откриват вибрации и движение и могат да определят разликата между просто нормалното ежедневно движение и треперенията и ударите на земетресение. И този телефон ще започне да ви предупреждава незабавно, локално. Действителното приложение знае, че открива земетресения. Но също така споделя тези данни чрез мрежа в разпределен център на хъб и говори, така че хората в близост до вас да бъдат предупредени веднага или възможно най-скоро, тъй като данните преминават през мрежата. И тогава в крайна сметка, когато стигне до централно местоположение или разпространено копие на централното място, то го изтласква обратно към хората, които не са в непосредствена близост, не са открили движението на планетата, но трябва да бъдат предупредени за това, защото може би идва цунами.

И интелигентната градска инфраструктура - концепцията за интелигентната инфраструктура, ние вече изграждаме интелекта в интелигентни сгради и интелигентна инфраструктура. Всъщност вчера паркирах колата си в града в нов район, където част от града се ремонтира и преустройва. И те са направили отново всички улици и има сензори по улиците, а реалният метър за паркиране знае, че когато съм влязъл с кола, той знае, че когато отида да се освежа за двучасовия лимит, колата не се е помръднала и всъщност нямаше да ме остави да стоя и да остана още два часа. Трябваше да вляза в колата, да се измъкна от пространството и след това да се изтегля, за да го излъжа, за да ми позволя да остана там още два часа. Но интересното е, че в крайна сметка ще стигнем до момента, в който не просто засичаме колата, която влиза в зоната като локализиран сензор, а неща като оптични характеристики, при които разпознаването ще бъде приложено с камери, които гледат моята регистрационна табела, и тя ще знае че всъщност просто се измъкнах и дръпнах обратно и го излъгах и просто няма да ми позволи да се подновя и ще продължа напред. И тогава той ще разпространява тези данни и ще се увери, че не мога да го правя никъде другаде и да излъгвам мрежата на текуща основа. Защото по природа трябва да стане по-умен, в противен случай всички ще продължим да го заблуждаваме.

Има пример за това, че всъщност лично съм живял там, където в технологията на защитната стена, в края на 80-те и началото на 90-те, продукт, наречен Check Point FireWall-1. Много проста технология на защитната стена, която използвахме, за да създаваме правила и да изграждаме правила и правила около определени неща, за да кажем, че видове трафик през определени портове и IP адреси и мрежи, за да стигнете до и един от друг, уеб трафика от едно място на друго, преминавайки от края на браузъра и клиента до нашия сървър. Решихме този проблем, като всъщност извадихме логиката от самите защитни стени и всъщност я преместихме в ASIC, специфичната за приложението интегрална схема. Контролираше портовете в Ethernet комутатори. Открихме, че сървърните компютри, компютрите, които всъщност използвахме като сървъри за взимане на решения като защитни стени, не бяха достатъчно мощни, за да се справят с обема на трафика, преминаващ през тях за всяка малка проверка на пакети. Решихме проблема, като преместихме логиката, необходима за извършване на проверка на пакети и откриване на интернет в мрежовите комутатори, които бяха разпространени и способни да обработват обема данни, преминаващи през мрежовото ниво. Не се притеснявахме за това на централизирано ниво със защитни стени, премествахме го към превключвателите.

И така, ние имахме производителите да изградим способността да прокараме пътища и правила и политики в Ethernet превключвателя, така че на действителното ниво на Ethernet порт и може би много хора в басейна не са запознати с това, защото ние сме всички живеят в безжичен свят сега, но навремето всичко трябваше да се включи чрез Ethernet. Сега на ниво Ethernet порт правехме проверка на пакетите, за да видим дали на пакетите е позволено дори да се преместят в комутатора и в мрежата. Част от това е, което решаваме сега около това предизвикателство да заснемем данни в мрежата, по-специално от IRT устройствата, и да я инспектираме и да правим анализ на нея и вероятно да анализираме в реално време, за да вземаме решения по нея. И част от него е да добиете представа за бизнес разузнаването и информация за това как хората взимат по-добри решения и други анализи и производителност за неща от машината до машина, където устройствата разговарят с устройства и вземат решения.

И това ще бъде тенденция, която трябва да разгледаме в близко бъдеще, защото ако не го направим, ние просто ще приключим с този шум от шум. И видяхме в света на големите данни, видяхме неща като езера с данни да се превърнат в блатове от данни, които просто завършваме с шум, за който не сме измислили как да разрешим анализата за обработка в централизиран мода. Ако не решим този проблем, според мен, с IoT веднага и ще получим решение за платформата много бързо, ще се окажем на много, много лошо място.

И като се има предвид това, ще завърша с моята точка, която е, че вярвам, че една от най-големите промени, които се случват в пространството за големи данни и анализи, се ръководи от непосредствената нужда да се реагира на въздействието на интернет на нещата с анализи в голям обем и в реално време, тъй като ние трябва да преместим анализите в мрежата и след това в крайна сметка до ръба на мрежата, само за да се справим с чистия обем на нея, само за да я обработим. И тогава в крайна сметка, да се надяваме, ние поставихме интелигентността в мрежата и ръба на мрежата в център и говорим модел, че всъщност можем да го управляваме и да добием представа в реално време и да получим стойност от него. И с това ще премина към нашия гост и ще видя къде ни отвежда този разговор.

Шон Роджърс: Благодаря ви много. Това е Шон Роджърс от Dell Statistica, и момче, само за начало съм напълно съгласен с всички основни теми, които са засегнати тук. И Ребека, започнахте с една около идеята за, знаете ли, тези данни не са нови и за мен е забележително колко време и енергия се изразходват за обсъждане на данните, данните, данните на IoT. И със сигурност е уместно, нали знаеш, Робин направи добра точка, дори и да правиш нещо наистина просто и да пипаш в термостат веднъж на секунда, знаеш, правиш това 24 часа на ден и всъщност имаш, знаете, някои интересни предизвикателства с данни. Но, знаете, в крайна сметка - и мисля, че много хора в бранша говорят за данните по този начин - че всъщност не е всичко толкова интересно и, за Ребека, това е около, много дълго време, но в миналото не сме успели да го използваме много. И мисля, че напредналата аналитична индустрия и BI индустрията като цяло започват наистина да обърнат глава към IoT. И Дез, до вашата крайна точка, това е част от или една от предизвикателните точки на пейзажа с големи данни, според мен е много вярно. Мисля, че всички са много развълнувани от това, което можем да направим с този тип данни, но в същото време, ако не можем да разберем как да приложим прозрение, да предприемем действия и, разбирате ли, вземете анализи къде са данните, според мен предстоят ни предизвикателства, които хората не виждат наистина да си идват на пътя.

С това казано, че в пространството за напреднали аналитици ние сме големи почитатели на това, което според нас може да се случи с IoT данни, особено ако прилагаме аналитични данни към него. И има много информация на този слайд и ще позволя на всеки просто да ловува и кълва, но ако погледнете различни сектори, като търговията на дребно в крайната дясна част, виждате възможността им да възникне около възможността да бъдат по-иновативни или да имат някои спестяване на разходи или оптимизация или подобрения на процеса е много важно и те виждат много случаи на използване за това. Ако погледнете, знаете, отляво надясно през слайда, ще видите как всяка от тези отделни индустрии изисква нови възможности и нови възможности за разграничаване за себе си, когато прилагат анализи към IoT. И мисля, че долната линия е, че ако ще се стремите да тръгнете по този път, трябва не само да се притеснявате за данните, както ние обсъждахме, и архитектурата, но също така трябва да погледнете как най-добре да приложете аналитика към него и там, където аналитиката трябва да се проведе.

На много от нас по време на днешното обаждане, знаете, Робин и аз се познаваме много отдавна и имахме безброй разговори за традиционните архитектури в миналото, онези около централизирани бази данни или корпоративни складове с данни и така нататък, и както ние ' намерихме през последното десетилетие или по този начин ние вършим доста добра работа за разтягане на ограниченията на тези инфраструктури. И те не са толкова стабилни или толкова силни, колкото бихме искали да бъдат днес, за да подкрепят всички страхотни анализи, които прилагаме към информацията и, разбира се, информацията нарушава и архитектурата, нали знаете, бързината на данните, обемът на данните и така нататък определено разтягат ограниченията на някои от нашите по-традиционни подходи и стратегии към този тип работа. И така мисля, че някак започва да налага необходимостта компаниите да приемат по-гъвкава и може би по-гъвкава гледна точка на това и това е частта, предполагам, бих искал да поговоря за малко около IoT.

Преди да го направя, ще отделя малко време, само да пусна всички на повикване, да ви дам малко информация за това какво е Statistica и какво правим. Както можете да видите на заглавието на този слайд, Statistica е прогнозна анализа, големи данни и визуализация за IoT платформата. Самият продукт е на малко над 30 години и ние се конкурираме с другите лидери на пазара, с които вероятно сте запознати в съответствие с това, че можете да прилагате прогнозна анализа, напреднала анализация към данните. Видяхме възможност да разширим обхвата си на това, където поставяхме анализите си и започнахме да работим по някои технологии назад, които ни позиционираха доста добре, за да се възползваме от това, за което и днес говориха Дез и Робин, което е този нов подход и къде ще поставите анализите и как ще я смесите с данните. Покрай тази страна има и други неща, с които трябва да можете да се справите с платформата и както споменах, Statistica е на пазара доста дълго време. Ние сме много добри в съчетаването на данни от нещата и мисля, че знаете, не сме говорили твърде много за достъпа до данните днес, но да можем да достигнем до тези разнообразни мрежи и да получите вашите ръце на правилните данни в подходящото време става все по-интересно и важно за крайните потребители.

И накрая, ще коментирам още едно парче тук, защото Dez направи добра точка относно самите мрежи, като имаше някакво ниво на контрол и сигурност над аналитичните модели в цялата ви среда и как те се привързват към данните стават много важни. Когато влязох в тази индустрия преди няколко години - почти 20 мисля, че в този момент - когато говорихме за напреднала анализа, това беше по много кураторски начин. Само няколко души в организацията имаха ръце по нея, те я разгърнаха и те дадоха отговора на хората, както се изисква или предоставиха прозрения според нуждите. Това наистина се променя и това, което виждаме, е много хора, които работеха с един или повече разнообразни и по-гъвкав начин да достигнат до данните, прилагайки сигурност и управление на данните и след това да могат да си сътрудничат върху тях. Това са някои от важните неща, които Dell Statistica разглежда.

Но искам да се потопя в темата, която е малко по-близка до днешното заглавие, което е, как трябва да се справим с данните, които идват от интернет на нещата и какво може да искате да търсите, когато търсите различни решения. Слайдът, който вдигнах пред вас в момента, е нещо като традиционната гледка и Дез и Робин докоснаха това, разбирате ли, тази идея за разговор със сензор, независимо дали е автомобил или тостер или вятърна турбина или какво имате, и след това премествате тези данни от източника на данни към вашата мрежа обратно към централизирана конфигурация, както Дез спомена. И тя работи доста добре и много компании влизат в пространството на IoT първоначално започват да го правят с този модел.

Другото нещо, което се появи, ако погледнете към дъното на слайда, е тази идея да вземете други традиционни източници на данни, да увеличите вашите IoT данни и след това в този вид ядро, независимо дали вашето ядро ​​е център за данни или него може да е в облака, всъщност няма значение, бихте взели продукт като Statistica и след това приложите анализи към него в този момент и след това предоставете тези прозрения на потребителите вдясно. И мисля, че това са залози на маса в този момент. Това е нещо, което трябва да можете да направите и трябва да имате достатъчно отворена архитектура за усъвършенствана платформа за анализи и да говорите с всички тези, разнородни източници на данни, с всички тези сензори и с всички тези различни дестинации, където имате данните. И аз мисля, че това е нещо, което трябва да можете да направите и мисля, че ще установите, че е много вярно, че много лидери на пазара са в състояние да правят този тип неща. Тук в Statistica някак си говорим за това като основна анализа. Отидете да вземете данните, върнете данните в сърцевината, обработете ги, добавете повече данни, ако е необходимо или ако е изгодно, и направете своя анализ и след това споделете тази информация за действие или за поглед.

И така мисля, че това със сигурност е от функционална гледна точка, вероятно всички бихме се съгласили, че, знаете, това е голата необходимост и всеки трябва да се занимава с това. Там, където започва да става нещо интересно, е мястото, където имате огромно количество данни, знаете, идващи от различни източници на данни, като IoT сензори, както споменах, независимо дали става въпрос за кола или охранителна камера или производствен процес, там започва да става предимство е да можеш да правиш аналитика, където данните действително се произвеждат. И предимството пред повечето хора, мисля, че когато започнем да преместваме аналитика от ядрото към ръба, е тази способност да разпространяваме някои от предизвикателствата за данни, които се случват, и Dez и Робин вероятно ще коментират това в края днес, но мисля, че трябва да можете да наблюдавате и да предприемате действия по данни на ръба, така че не винаги е необходимо да премествате всички тези данни в мрежата си. Робин говори за това в своята, своеобразна, архитектурна картина, която е съставил, където имате всички тези различни източници, но обикновено има някаква точка на обобщаване. Точката на агрегиране, която виждаме доста често, е или на ниво сензор, но още по-често на ниво шлюз. И тези шлюзи съществуват като нещо като посредник в потока от данни от източниците на данни, преди да се върнете към ядрото.

Една от възможностите, от които се възползва Dell Statistica, е, че нашата способност да експортираме модел от нашата централизирана платформа за напреднали аналитики, за да можем да вземем модел и след това да го изпълним на ръба на различна платформа, като шлюз или вътре на база данни или какво имате. И мисля, че гъвкавостта, която ни дава, е това, което наистина е интересното в днешния разговор, имаш ли това в своята инфраструктура днес? Способни ли сте да преместите аналитик до мястото, където данните живеят, спрямо просто винаги преместването на данните до мястото, където живеят вашите анализи? И това е нещо, върху което Statistica се фокусира от доста време и като погледнете по-отблизо слайдовете, ще видите, че там има някаква друга технология от нашата сестринска компания, Dell Boomi. Dell Boomi е платформа за интегриране на данни и интеграция на приложения в облака и ние всъщност използваме Dell Boomi като устройство за трафик, за да преместваме моделите си от Dell Statistica, през Boomi и извън крайните устройства. И ние смятаме, че това е гъвкав подход, към който компаниите ще бъдат взискателни, толкова, колкото им харесва версията, която ви показах преди минута, която е нещо като основна идея за преместване на данни от сензорите, чак обратно към център, в същото време компаниите ще искат да могат да го направят по начина, по който тук някак си ги очертавам. И предимствата за това е в някои от моментите, които Робин и Дез направиха, което е, можете ли да вземете решение и да предприемете действия с бързината на вашия бизнес? Можете ли да преместите аналитика от едно място на друго и да можете да си спестите време, пари и енергия и сложност за непрекъснато преместване на тези крайни данни обратно към ядрото.

Сега съм първият, който казва, че някои от крайните данни винаги ще имат достатъчно висока заслуга, където би имало смисъл да съхранявате тези данни и да ги съхранявате и връщате обратно в мрежата си, но каква анализа на ръбовете ще ви позволи да прави ли способността да взимаш решения с бързината, до която данните всъщност идват, нали? Че можете да приложите прозрението и действието със скорост, където е най-високата възможна стойност. И мисля, че това е нещо, което всички ние ще търсим, когато става въпрос за използване на съвременни аналитични и IoT данни, е тази възможност да се движите със скоростта на бизнеса или със скоростта, която клиентът изисква. Мисля, че нашата позиция е, че мисля, че трябва да можете да направите и двете. И мисля, че доста скоро и много бързо, тъй като все повече компании разглеждат по-разнообразни набори от данни, особено тези от IoT страна, те ще започнат да разглеждат пространството на доставчиците и да изискват какво е способна на Statistica. Което е да разгърнем модел в основата, както правим традиционно в продължение на много години, или да го разгърнем на платформи, които са може би нетрадиционни, като IoT шлюз, и всъщност да можем да оценяваме и прилагаме аналитични данни към данните в края, тъй като данните са произведени. И мисля, че там идва вълнуващата част от този разговор. Защото, когато можем да приложим аналитик в края, когато данните излизат от датчик, ни позволява да предприемем действия толкова бързо, колкото е необходимо, но също така ни позволява да решим, трябва ли тези данни незабавно да върнат обратно към ядрото? Можем ли да го прехвърлим тук и след това да го изпратим обратно на парчета и части и да направим допълнителен анализ по-късно? И това е, което виждаме много от водещите ни клиенти.

Начинът, по който Dell Statistica прави това, е, че имаме възможност да използваме, така че например да изградите невронна мрежа вътре в Statistica и сте искали да поставите невронната мрежа някъде другаде в пейзажа на вашите данни. Имаме възможност да извеждаме онези модели и всички езици, които сте забелязали в десния ъгъл там - Java, PPML, C и SQL и т.н., ние също включваме Python и можем да експортираме и нашите скриптове - и докато преместите тази от нашата централизирана платформа, можете след това да разгърнете този модел или алгоритъм, където и да ви е необходим. И както споменах по-рано, използваме Dell Boomi, за да го поставим и паркираме там, където трябва да го стартираме, и тогава можем да върнем резултатите обратно, или можем да помогнем да върнем данните, или да оценим данните и да предприемем действие, използвайки нашия механизъм за правила, Всички тези неща стават някак важни, когато започнем да разглеждаме този тип данни и мислим отново.

Това е нещо, което повечето от вас по телефона ще трябва да направят, защото ще стане много скъпо и ще облагате данъци върху вашата мрежа, както Дез спомена, за да премествате данни отляво на тези диаграми отдясно на тези диаграми време. Не звучи много, но сме виждали производствени клиенти с десет хиляди сензора във фабриките си. И ако имате десет хиляди сензора във фабриката си, дори и ако просто правите тези един втори вид тестове или сигнали, вие говорите за осемдесет и четири хиляди реда данни от всеки от тези индивидуални сензори на ден. И така данните определено се трупат и Робин споменава това. Предварително споменах няколко индустрии, в които виждаме хората да правят някои доста интересни неща, направени с помощта на нашия софтуер и IoT данни: автоматизация на сгради, енергия, комунални услуги е наистина важно пространство. Виждаме, че се работи много по оптимизацията на системата, дори обслужването на клиентите и разбира се цялостните операции и поддръжка, в енергийните съоръжения и в сградата за автоматизация. И това са някои случаи на употреба, които виждаме, че са доста мощни.

Правихме предишни анализи преди, предполагам, че терминът беше въведен. Както споменах, ние имаме дълбоки корени в Statistica. Компанията е основана преди близо 30 години, така че ние имаме клиенти, които се връщат доста дълго време, които интегрират IoT данни със своите анализи и са от известно време. А Allian Energy е един от нашите случаи на използване или референтни клиенти. И можете да си представите проблема, който има енергийната компания с физически завод. Мащабирането отвъд тухлените стени на физическото предприятие е трудно и затова енергийните компании като Allian търсят начини да оптимизират енергийната си продукция, основно подобрявайки техния производствен процес и оптимизирайки го до най-високо ниво. И използват Statistica за управление на пещите в техните заводи. И за всички нас, които се връщаме в ранните си дни в часовете по наука, всички знаем, че пещите правят топлина, топлината прави пара, турбините се въртят, получаваме електричество. Проблемът за компании като Allian всъщност е оптимизирането на това как нещата се нагряват и изгарят в тези големи циклонови пещи. И оптимизиране на продукцията, за да се избегнат допълнителните разходи за замърсяване, изместване на въглерода и т.н. И така трябва да можете да наблюдавате вътрешността на една от тези циклонови пещи с всички тези устройства, сензори и след това да вземате всички тези данни на сензора и да извършвате непрекъснато промени в енергийния процес. И точно това Statistica прави за Allian от около 2007 г., преди дори терминът IoT да е супер популярен.

За Ребека по-рано, данните със сигурност не са нови. Способността да го обработваме и използваме правилно е наистина там, където се случват вълнуващите неща. Разговаряхме малко за здравеопазването в предварителния разговор днес и виждаме всякакви приложения за хора да правят неща като по-добра грижа за пациентите, превантивна поддръжка, управление на веригата за доставки и оперативна ефективност в здравеопазването. И това е доста продължаващо и има много различни случаи на употреба. Един, с който сме много горди тук в Statistica, е с нашия клиент Shire Biopharmaceuticals. И Shire прави специализирани лекарства за наистина трудно лечими заболявания. И когато създават партида от лекарството си за своите клиенти, това е изключително скъп процес и този изключително скъп процес също отнема време. Когато мислите за производствен процес, тъй като виждате, предизвикателствата са обединяването на всички данни, да бъдете достатъчно гъвкави при различните начини за въвеждане на данни в системата, валидиране на информацията и след това да можете да прогнозирате как помагаме на този клиент. И процесите, които дърпаха по-голямата част от информацията от нашите производствени системи и разбира се устройствата и сензорите, които задвижват тези производствени системи. И това е чудесен случай за това как компаниите избягват загубите и оптимизират производствените си процеси, използвайки комбинация от сензорни данни, IoT данни и редовни данни от техните процеси.

Знаете ли, добър пример за това, където производството и особено високотехнологичното производство се възползват от здравната индустрия около този вид работа и данни. Мисля, че имам само няколко други точки, които бих искал да направя, преди да го увия и да го върна на Дез и Робин. Но знаете ли, мисля, че тази идея да бъдете в състояние да натиснете аналитика навсякъде във вашата среда е нещо, което ще стане изключително важно за повечето компании. Привързването към традиционния формат на ETL-ите данни от източници до централни места винаги ще има място във вашата стратегия, но не трябва да бъде единствената ви стратегия. Днес трябва да предприемете много по-гъвкав подход. За да приложите споменатата от мен сигурност, избягвайте данъчното облагане на вашата мрежа, за да можете да управлявате и филтрирате данните, тъй като идват от ръба, и да определите кои данни си струва да съхранявате дългосрочно, какви данни си струва да преместите към нашата мрежа или какви данни просто трябва да бъдат анализирани в момента, в който са създадени, за да вземем най-добрите възможни решения. Този навсякъде и навсякъде аналитичен подход е нещо, което ние приемаме присърце в Statistica и е нещо, в което сме много опитни. И се връща към един от онези слайдове, за които споменах по-рано, възможността да експортирате вашите модели на различни езици, така че те да могат да съвпадат и да се подравнят с платформите, където се създават данните. И след това, разбира се, да разполагаме с разпределително устройство за тези модели, което също е нещо, което представяме на масата и от което сме много развълнувани. Мисля, че разговорът днес е, ако наистина ще се заемем сериозно с тези данни, които са в нашите системи от доста време и бихме искали да намерим конкурентно предимство и иновативен ъгъл, за да ги използваме, трябва да приложите някаква технология към него, която ви позволява да се измъкнете от някои от онези рестриктивни модели, които сме използвали в миналото.

Отново, моят въпрос е, че ако ще правите IoT, мисля, че трябва да можете да го направите в основата си и да внесете данните и да ги съпоставите с други данни и да направите своя анализ. Освен това, също толкова важно или може би дори по-важно, трябва да имате тази гъвкавост, за да поставите аналитика с данните и да преместите аналитика от централната страна на вашата архитектура до ръба за предимствата, които споменах преди. Това е малко за това кои сме и какво правим на пазара. И ние сме много развълнувани от IoT, смятаме, че той определено е на възраст и има големи възможности всички тук да повлияят на своите анализи и критични процеси с този тип данни.

Ребека Йозвяк: Шон, много благодаря, че беше наистина фантастично представяне. И знам, че Дез вероятно умира да ви задам няколко въпроса, така че Дез, ще ви пусна първи.

Дез Бланчфийлд: Имам милион въпроса, но ще се сдържа, защото знам, че и Робин ще има. Едно от нещата, които виждам далеч и широко, е въпрос, който се появява и аз наистина искам да вникна в опита си в това, като се има предвид, че сте в основата на нещата. Организациите се борят с предизвикателството и изглежда, че някои от тях току-що са прочели харесванията на „Четвъртата индустриална революция” на Клаус Шваб и след това са имали паническа атака. А тези, които не са запознати с тази книга, това е по същество прозрение от джентълмени, от Клаус Шваб, който според мен е професор, който е основател и изпълнителен председател на Световния икономически форум от паметта, а книгата по същество е за целия този повсеместен интернет на нещата на експлозия и част от въздействието върху света като цяло. Организациите, с които говоря, не са сигурни дали трябва да преработят настоящата среда или да инвестират всичко в изграждането на нова среда, инфраструктура и платформи. И в Dell Statistica виждате ли хора да преоборудват текущата среда и да разгърнете вашата платформа в съществуваща инфраструктура или виждате как те прехвърлят фокуса си върху изграждането на цялата нова инфраструктура и се подготвят за този потоп?

Шон Роджърс: Знаеш ли, ние имахме възможността да обслужваме и двата типа клиенти и да сме на пазара, стига да имаме, вие получавате тези възможности да се разширят. Имаме клиенти, които създадоха чисто нови фабрики през последните няколко години и ги снабдиха със сензорни данни, IoT, анализи от края, от край до края на целия процес. Но трябва да кажа, че повечето от нашите клиенти са хора, които извършват този тип работа от известно време, но са принудени да игнорират тези данни. Знаеш ли, Ребека направи точката отпред отпред - това не са нови данни, този тип информация е била доста достъпна в много различни формати от много дълго време, но където проблемът беше свързан с нея, да го преместите, да го пренесете някъде, където можете да направите нещо умно с него.

И така бих казал, че повечето от нашите клиенти гледат на това, което имат днес, и Дез, ти си направил това преди, че това е част от тази революция на големи данни и мисля, че всъщност става въпрос за това, дали е за всички революция на данните, нали? Не е нужно вече да пренебрегваме определени системни данни или производствени данни или данни за автоматизация на сгради, сега имаме правилните играчки и инструменти, за да ги вземем и след това да правим умни неща с тях. И мисля, че в това пространство има много драйвери, които правят това и някои от тях са технологични. Знаете, решенията за инфраструктура с големи данни като Hadoop и други направиха малко по-евтино и малко по-лесно за някои от нас да мислят за създаването на езеро с данни от този тип информация. И сега оглеждаме предприятието, за да продължим: „Ей, ние имаме аналитичност в нашия производствен процес, но дали те ще бъдат подобрени, ако можем да добавим малко поглед от тези процеси?“ И това е, мисля, какво повечето от нашите клиенти правят. Това не е толкова създаване от самото начало, а увеличаване и оптимизиране на анализите, които вече имат с нови данни за тях.

Дез Бланчфийлд: Да, има някои вълнуващи неща, които се случват в някои от най-големите индустрии, които сме виждали, а вие споменахте, енергията и комуналните услуги. Авиацията просто преминава през този бум, където едно от най-любимите ми устройства за всички времена, за което говоря редовно, Boeing 787 Dreamliner и със сигурност еквивалентът на Airbus, A330 тръгна по същия маршрут. Имаше като шест хиляди сензора през 787, когато беше пуснат за първи път, и мисля, че сега говорят за петнадесет хиляди сензора в новата версия на него. Любопитното при разговорите с някои от хората, които са в онзи свят, беше, че идеята да се сложат сензори в крилата и така нататък, и невероятното нещо за 787 в дизайнерска платформа е, че, знаете, те са изобретили всичко в Самолетът. Подобно на крилата, например, когато самолетът излита, крилата се огъват до дванадесет и половина метра. Но в крайности крилата могат да се огъват на върха до 25 метра. Това нещо прилича на птица. Но това, което те нямаха време да се поправят, беше инженерингът на анализа на всички тези данни, така че те имат сензори, които карат светодиодите да мигат зелено и червено, ако се случи нещо лошо, но всъщност не завършват с дълбока представа за реално време. И те също не решиха проблема с това как да преместват обема данни, защото във вътрешното въздушно пространство в САЩ ежедневно има 87 400 полета. Когато всеки самолет навакса своите изкупувания от 787 Dreamliner, това е 43 петабайта на ден, тъй като в момента тези самолети създават около половин терабайт данни. А когато умножите 87 400 полета на ден в страната по точка пет или половина терабайт, в крайна сметка получавате 43, 5 петабайта данни. Ние физически не можем да го движим. Така че по дизайн трябва да изтласкаме анализите в устройството.

Но едно от нещата, което е интересно, когато гледам цялата тази архитектура - и имам желание да видя какво мислите за това - дали сме се насочили към главното управление на данните, нещо като първи принципи за управление на данните, дърпане всичко на централно място. Имаме данни за емисии и след това създаваме малко езерца от данни, ако желаете, извлечения от това, на което правим анализи, но чрез разпространение до ръба, едно от нещата, което продължава да се появява, особено от хората от базата данни и мениджърите на данни или хората в бизнеса с управление на информация, какво се случва, когато имам много разпространени малки миниатюрни езера? Какви неща са приложени към това мислене по отношение на анализа на ръба във вашето решение, тъй като традиционно всичко би идвало централно с езерото с данни, сега приключваме с тези малки локви данни навсякъде и въпреки че можем извършвайте анализи върху тях, за да получите някаква локална представа, какви са някои от предизвикателствата, пред които сте се сблъскали и как сте решили това, като разполагате с този разпределен набор от данни и по-специално, когато получавате микрокосмите от езера на данни и разпределени области?

Шон Роджърс: Ами мисля, че това е едно от предизвикателствата, нали? Тъй като ние се отдалечаваме от, знаете, прехвърляйки всички данни обратно до централното местоположение или основния аналитичен пример, който дадох и след това правим разпределената версия е, че в крайна сметка ще получите всички тези малки силози, нали? Точно както сте изобразили, нали? Правят малко работа, вървят някои анализи, но как да ги върнете заедно? И мисля, че ключът ще бъде оркестрацията през всичко това и мисля, че вие ​​ще се съгласите с мен, но аз съм щастлив, ако не го направите, мисля, че наблюдаваме тази еволюция от доста време някой път.

Да се ​​върнем към дните на нашите приятели г-н Inmon и г-н Kimball, които помогнаха на всички с архитектурата на техните ранни инвестиции в склад за данни, като въпросът беше, че отдавна сме се отклонили от този централизиран модел. Възприехме тази нова идея да позволим на данните да демонстрират гравитацията си там, където най-добре трябва да се намира във вашата екосистема и да подравните данните с най-добрата възможна платформа за най-добър възможен резултат. И започнахме да харчим, струва ми се, по-организиран подход към нашата екосистема като всеобхватен вид на правене на нещата, тъй като ние се опитваме да подравним всички тези парчета наведнъж. Какъв тип аналитичен или работа ще правя с данните, какъв тип данни са, това ще ви помогне да диктувате къде трябва да живеят. Къде се произвежда и какъв вид гравитация имат данните?

Знаете, виждаме много от тези примери за големи данни, където хората говорят за 10- и 15-петабайтни езера. Е, ако имате езеро с данни, което е толкова голямо, за вас е много непрактично да го премествате и затова трябва да можете да внесете анализи в него. Но когато го направите, в основата на вашия въпрос, мисля, че той поражда много нови предизвикателства пред всички да организират околната среда и да прилагат управление и сигурност и да разберат какво трябва да се направи с тези данни, за да се лекува и да извлечете най-високата стойност от него. И за да бъда честен с вас - бих се радвал да чуя вашето мнение тук - мисля, че там сме в ранни дни и мисля, че предстои много добра работа. Мисля, че програми като Statistica се фокусират върху предоставянето на достъп на повече хора до данни. Определено сме фокусирани върху тези нови персони като учен с данни за гражданите, които искат да насочат аналитичната анализа към места в организацията, които може би не са били преди. И мисля, че това са някои от ранните дни около това, но мисля, че дъгата на зрелостта ще трябва да демонстрира високо ниво или оркестрация и привеждане в съответствие между тези платформи, както и разбиране за това какво има в тях и защо. И това е веков проблем за всички ни хора с данни.

Дез Бланчфийлд: Наистина е така и напълно съм съгласен с вас по този въпрос и мисля, че страхотното нещо, което чуваме тук днес, е поне предния край на проблема с действителното заснемане на данните на, предполагам, ниво на шлюза в края на мрежата и възможността да се правят анализи в този момент по същество е решен сега. И сега ни освобождава всъщност да започнем да мислим за следващото предизвикателство, което е разпределени данни с езера. Благодаря ви много за това, беше фантастично представяне. Наистина оценявам възможността да разговарям с вас за това.

Сега ще премина към Робин, защото знам, че той има, и тогава Ребека също получи дълъг списък от страхотни въпроси от публиката след Робин. Робин?

Д-р Робин Блур: Добре. Шон, бих искал да кажеш още малко и не се опитвам да ти дам шанс да го рекламираш, но всъщност е много важно. Интересно ми е да знам в кой момент Statistica всъщност генерира възможностите за износ на модел. Но също така, бих искал да кажете нещо за Boomi, защото всичко, което досега казахте за Boomi, е, че това е ETL и всъщност е ETL. Но всъщност е доста способен ETL и за времето, за което говорим, и някои от ситуациите, за които обсъждаме тук, това е много важно нещо. Бихте ли могли да говорите с тези две неща за мен?

Шон Роджърс: Разбира се, да, абсолютно мога. Знаете, нашето движение в тази посока със сигурност беше итеративно и беше нещо като стъпка по стъпка процес. Току-що се подготвяме тази следваща седмица за стартиране на версия 13.2 на Statistica. И той има най-новите актуализации на всички възможности, за които говорим днес. Но връщайки се към Версия 13, преди година октомври, ние обявихме способността си да експортираме модели от нашата платформа и навремето я нарекохме NDAA. Съкращението означаваше Native Distributed Analytics Architecture. Това, което направихме, е, че вложихме много време, енергия и се съсредоточихме върху отварянето на нашата платформа с възможност да я използваме като централен команден център за вашата разширена анализа, но и да разгърнем оттам. И първите места, Робин, които разгърнахме направихме наистина, наистина страхотно допълнение към платформата около машинното обучение. И така имахме възможността да внедрим от Statistica към Azure Cloud на Microsoft, за да използваме силата на Azure за енергийно машинно обучение, както знаете, е много интензивно и е чудесен начин да използваме облачните технологии. И така това беше първият бит.

Сега тук експортирахме нашите модели в Azure и използвахме Azure, за да ги стартираме и след това изпращаме данните или резултатите обратно към платформата Statistica. И след това преминахме към други езици, от които искахме да можем да експортираме, и разбира се, един от тях е Java отваря вратата за нас, за да започнем да експортираме нашите модели навън на други места като Hadoop, така че тогава тя даде и ние играем там.

И накрая, ние се съсредоточихме върху възможността да извеждаме нашите модели с това издание в бази данни. И така това беше първото повторение и за да бъда честен с вас, крайната игра беше IoT, но все още не бяхме съвсем там с Версия 13 миналия октомври. Оттогава стигнахме до там и това е свързано със способността да правим всички неща, които споменах току-що, но след това да има някакво транспортно устройство. И да се върнем към въпроса на Дез, знаете ли какво е предизвикателството и как да направим това, когато всички тези анализи вървят наоколо? Ние използваме Boomi като вид разпределителен център и така, защото е в облака и защото е толкова мощен, както споменах преди, платформа за интегриране на данни, но също така е платформа за интегриране на приложения и използва JVM, за да ни позволи да паркирате и да вършите работа навсякъде, където можете да приземите виртуална машина на Java. Ето какво наистина отвори вратата за всички тези шлюзове и крайни изчислителни платформи и крайни сървъри, защото всички те имат изчислението и платформата, която е достъпна за стартиране на JVM. И тъй като можем да стартираме JVM навсякъде, Boomi се обърна да бъде прекрасно разпространение и, използвайки думата ми от по-рано, устройство за оркестрация.

И това става наистина важно, защото всички сме, знаете, мисля, че сценарият със самолета преди минута беше страхотен и споменах, знаете, производители като Shire, които имат десет хиляди сензора в една от фабриките си, вие трябва да започнат да се занимават с някакъв централен подход към усъвършенствания анализ в някакъв момент. Да бъдеш ad hoc за това всъщност вече не работи. Преди беше, когато обемът на моделите и алгоритмите, които работехме, беше минимален, но сега е на максимум. Има хиляди от тях в организация. Така че ние имаме, част от нашата платформа е базирана на сървър и когато имате нашия корпоративен софтуер, вие също имате възможност да настройвате и оценявате и управлявате вашите модели в цялата среда. И това също е част от онова нещо с оркестрацията. Трябваше да имаме слой, Робин, на мястото, което не само ти позволи да се сдобиеш с модел там на първо място, но и ти даде проводник за настройване на моделите и замяна на тях постоянно, колкото е необходимо, защото това не е нещо, което можете да направите ръчно. Не можете да обикаляте рафинерия с устройство за палеца, опитвайки се да качите модели на шлюзове. Трябва да имате система за транспорт и управление между тях и така комбинацията от Statistica и Boomi дава това на нашите клиенти.

Д-р Робин Блур: Да. Е, ще бъда много кратък, но, знаете, това твърдение, което беше направено преди за езерото с данни и идеята за натрупване на петабайти на което и да е място и факта, че има гравитация. Знаеш ли, че когато започнахте да говорите за оркестрация, то просто започна да ме замисля за много простия факт, който, знаете ли, поставянето на езеро с данни, което е много голямо на едно място, вероятно означава, че всъщност трябва да го архивирате и това вероятно означава, че трябва така или иначе да преместите много данни. Знаеш ли, истинската архитектура на данните е много повече, според мен така или иначе, много повече в посоката, за която говориш. Което е да го разпределите на разумни места, вероятно е нещото, което бих казал. И изглежда, че имате много добра способност да направите това. Искам да кажа, че съм запознат добре с Boomi, така че по някакъв или друг начин е почти несправедливо, че мога да го видя и може би публиката не може. Но според мен Boomi е толкова важно по отношение на това, което правите, защото има възможности за приложение. И също така, защото истината на въпроса е, че не правите тези аналитични изчисления, без да искате да предприемете нещо някъде по някаква или друга причина. И Буми играе роля в това, нали?

Шон Роджърс: Да, абсолютно. И така, както знаете от предишни разговори, Statistica има пълен двигател за бизнес правила в него. И мисля, че това е наистина важно, когато стигнем до това защо правим това. Знаеш ли, аз се пошегувах отпред, че наистина няма причина изобщо да правим IoT, освен ако не анализираш, използваш данните, за да вземеш по-добри решения или да предприемеш действия. И така, върху което се съсредоточихме не беше просто да можем да поставим модела там, а да можем да маркираме заедно с него, набор от правила. И тъй като Boomi е толкова здрав в своите възможности да движи нещата от едно място на друго, в рамките на Boomi атом можем също да вградим способността да се задейства, да сигнализира и да предприеме действия.

И така започваме да получаваме подобен изтънчен изглед на IoT данни, където казваме: „Добре, тези данни си заслужават да се слушат.“ Но наистина, знаете, като знаете, че „светлината е включена, светлината е включена, светлината е включена, светлината е включена ”не е толкова интересно, колкото когато светлината угасне или когато детекторът за дим угасне или когато всичко, което се случи с нашия производствен процес, изчезне от спецификацията. Когато това се случи, ние искаме да можем да предприемем незабавни действия. И в този момент данните стават почти второстепенни. Тъй като не е толкова важно, че спасихме всички тези, „добре е, добре е, добре е“ сигналите, важното е, че забелязваме „Ей, лошо е“ и незабавно предприехме действия. Независимо дали става въпрос за изпращане на имейл до някого или можем да включим експертиза в областта на домейна или дали сме започнали поредица от други процеси за незабавни действия, независимо дали това е коригиращо или в отговор на информацията. И мисля, че затова трябва да имате този оркестриран поглед върху него. Не можете просто да се съсредоточите върху работата си с алгоритмите навсякъде. Трябва да можете да ги координирате и оркестрирате. Трябва да можете да видите как се представят. И наистина, най-важното, искам да кажа, защо по дяволите бихте направили това, ако не можете да добавите възможност да предприемете незабавни действия срещу данните?

Д-р Робин Блур: Добре, Ребека, вярвам, че имате въпроси от публиката?

Ребека Йозвяк: Да. Имам много въпроси за публиката. Шон, знам, че не си искал да се мотаеш твърде дълго зад върха на часа. Какво мислиш?

Шон Роджърс: Щастлив съм. Продължавай. Мога да отговоря на няколко.

Ребека Йозвяк: Да видим. Знам, че едно от нещата, които споменахте, беше, че IoT е в ранни дни и има степен на зрялост, която ще трябва да се проведе, и това нещо говори на този въпрос, един от присъстващите го попита. Ако рамката на IPv6 ще бъде достатъчно здрава, за да побере растежа на IoT през следващите пет или десет години?

Шон Роджърс: О, ще оставя Дез да отговори на отговора ми, защото смятам, че е по-близо до този тип информация, която съм аз. Но винаги съм бил на мисълта, че сме на много бърз път, за да огънем и да разрушим повечето рамки, които имаме на мястото си. И макар да мисля, че добавянето на този нов вид спецификация или посоката, в която вървим с IPv6 рамки, е важно и това отваря вратата за нас да имаме много повече устройства и да можем да дадем всичко, което ние искам да дам адрес. Мисля, че всичко, което чета и виждам с клиентите си, както и броят на необходимите адреси, мисля, че в един момент ще предизвика друга промяна в този пейзаж. Но всъщност не съм експерт по мрежи, така че не мога да кажа на сто процента, че в даден момент ще го прекъснем. Но моят опит ми казва, че в даден момент ще нарушим този модел.

Ребека Йозвяк: Не бих се изненадала. Смятам, че рамките са вид разбиване под тежестта на всякакви неща. И това е просто логично, нали? Искам да кажа, че не можете да изпратите имейл с пишеща машина. Друг участник пита: „Можете ли да използвате рамка на Hadoop?“, Но предполагам, че бих могъл да го променя, за да кажа, как бихте използвали рамката на Hadoop за разпределена анализа?

Шон Роджърс: Е, Робин ми направи услугата да ми зададе исторически въпрос и така след като версия 13 преди около година за Statistica, ние имахме възможността да изгоним модели от нашата система и в Hadoop. И ние работим много тясно с всички големи аромати на Hadoop. Имаме наистина страхотни истории за успех около възможността да работим с Cloudera като една от основните дистрибуции на Hadoop, с която работим. Но тъй като можем да извеждаме в Java, това ни дава тази способност да бъдем отворени и да поставяме анализа си навсякъде. Поставянето им в Hadoop клъстер е нещо, което правим нормално и редовно и ежедневно за много от нашите клиенти. Краткият отговор е да, абсолютно.

Ребека Йозвяк: Отлично. И аз просто ще ви изхвърля още един и ще ви оставя да продължите с ваканцията си. Друг участник пита, с IoT analytics плюс машинно обучение, смятате ли, че всички данни трябва да се съхраняват за исторически цели и как това ще повлияе на архитектурата на решението?

Шон Роджърс: Е, не мисля, че всички данни трябва да се съхраняват. Но мисля, че е много интересно да имаме възможност да се забавляваме, да слушаме всеки източник на данни, който искаме в нашата организация, откъдето и да идва. И аз мисля, че промените, които видяхме на пазара през последните няколко години, ни позволиха да възприемем този подход на всички данни към нещата и изглежда наистина е полезно. Но това ще бъде различно за всяка компания и всеки случай на употреба. Знаете, когато разглеждаме здравните данни, сега има много регулаторни проблеми, много проблеми с спазването, които трябва да бъдат загрижени, и това ни кара да запазваме данни, които другите компании може да не разберат защо трябва да бъдат запазени, нали? ? В производствените процеси, за голяма част от нашите производствени клиенти, има истински напред, за да можете исторически да проучите вашите процеси и да можете да погледнете назад към големи количества от тези данни, за да се научите от него и да изградите по-добри модели от него.

Считам, че много от данните ще трябва да бъдат запазени и мисля, че днес имаме решения, които правят това по-икономично и мащабируемо. Но в същото време мисля, че всяка компания ще намери стойност в данните, които не трябва да поддържат на атомно ниво, но ще искат да анализират в реално време и да вземат решения за това, за да стимулират иновациите в тяхната компания.

Ребека Йозвяк: Добре, добре. Не, публика, днес не стигнах до въпросите на всеки, но ще ги препратя заедно с Шон, за да може той да се свърже директно с вас и да отговори на тези въпроси. Но благодаря на всички за присъствието. Благодаря много на Шон Роджърс от Dell Statistica и на всички наши анализатори, Дез Бланчфийлд и д-р Робин Блур. Можете да намерите архива тук в insideanalysis.com, SlideShare, ние започнахме да поставяме нашите неща отново там, и ние обновяваме нашия YouTube, така че потърсете и там. Благодаря толкова много хора. И с това ще се сбогувам и ще се видим следващия път.

Анализ на ръба: най-после йот икономиката