От персонала на Техопедия, 11 май 2016 г.
Отнемане: Домакинът Ребека Йозвяк обсъжда напредъка в архитектурата и съхранението на бази данни с Дез Бланчфийлд, Робин Блур и Брайън Булковски.
В момента не сте влезли. Моля, влезте или се регистрирайте, за да видите видеото.
Ребека Йозвяк: Дами и господа, привет и добре дошли в горещите технологии на 2016 г. Днес ние сме „Излагане на диференциация: новата ера на мащабираната инфраструктура пристига.“ Днес участвам за Ерик Кавана. Аз съм Ребека Йозвяк, твоята скромен домакин от групата на борда, докато Ерик е в Ямайка. Браво на него.
И така, както е от десетилетия, и тази година е гореща, въпреки че спорно технологията се движи с темпове, които изпреварват закона на Мур и какво правят организациите, за да продължат? Те търсят всичко, което е бързо, и мащабът, бих твърдял, вероятно е едно от най-важните неща, когато мислим за базите данни. И разбира се, имаме опциите за обичайните релационни, сега имаме своя NoSQL, имаме нашия магазин за колони, имаме нашите графични бази данни, нашите бази данни RDF, но наистина това, което търсят бизнесите е мащаб, е паралелизъм и е бърз,
Сега традиционните архитектури бяха на базата на този релационен модел. Но ако погледнете повечето уеб бизнес, които възникват през последните три, пет, десет години, това не са моделите, които използват за своята инфраструктура. Те използват различна, паралелна архитектура, мащабират се и бързи и това е нещо, към което днес се обръщат много хора.
Нашият състав, ние имаме Дез Бланчфийлд, той е учен от групата Bloor. Имаме доктор Робин Блур, наш главен анализатор в Bloor Group, и имаме Брайън Булковски, CTO и основател на Aerospike. Така че, момчета с това, ще го предам на Dez.
Дез Бланчфийлд: Благодаря и благодаря, че ме приехте тук. Ще опитам да наглася сцената за това как ние много бързо стигнахме до мястото, където сме, и ще се потопим в много повече технически детайли, докато разглеждаме днешните теми. Просто ще получа контрол върху екрана тук.
Така по-големи, по-добри и по-бързи. Когато се замисля къде се намираме, образът, който продължава да ми идва наум лично, е точно този образ, който имам на слайда си от заглавието, което е разширяването на Вселената. Технологиите се развиват и развиват вече десетилетия, всъщност от края на петдесетте години, когато мейнфреймът се превърна в истинско нещо. Технологиите продължават да нарастват в много случаи при по-лоша или по-голяма от линейна крива, в зависимост от това на коя част от кривата се намирате, докъдето стига софтуерът или хардуерът.
Скалата става все по-голяма и по-бърза и по-бърза, доколкото се опитваме да доставим, и все по-малки и по-малки на ниво производство и полупроводници. И в средата има софтуер и приложенията и системите, които са в основата на този софтуер, и те са склонни да стават все по-малки и по-естествени и ние видяхме неща като контейнерни приложения и микро сървъри, това отново се превърна в нещо. Правихме това в миналото, десетилетия преди, но в резултат на това да ставаме все по-малки и по-малки там, ние ставаме все по-големи и по-големи в мащаба, от който сега можем да стартираме неща, като приложения и конкретни бази данни, и логиката на тези бази данни.
Имам това мнение, където сме мащабирали много хоризонтално, по същество по оста X; мащабирахме вертикално по оста Y. Сега сме в момента, в който трябва да отидем някъде по различен начин и според мен това е някак мислено предвидено като Z ос, а това е, че трябва да навлезем дълбоко в технологията и да разгледаме как можем да направим нещата различно от това, което сме правили досега, за да постигнем това допълнително парче скорост. Така че аз визуализирам цялото това разширение на Вселената, където имахме експлозия, и някои технологии съществуват, и това по-добър линеен растеж и търсене. Трябваше да намерим различни начини да постигнем този по-голям, по-добър, по-бърз резултат.
Просто за бързо покриване на вида, в който се намираме в няколко хардуерни среди. Виждахме как падащите разходи на гигабайт дисково пространство водят до няколко доста големи прехода и технологии и подходи към по-големия, по-добър и бърз мащаб. Това са две отделни графики, които покриват приблизително десетилетие на брой, малко повече от десетилетие всяка от падащата цена на един гигабайт пространство на твърдия диск.
Това е класическа J крива или хокейна пръчка, както често ги споменаваме, тъй като преди време можете да похарчите буквално стотици хиляди долари, за да купите гигабайт дисково пространство, не преди две десетилетия, докато днес това се превърна в долари и в крайна сметка съм сигурен, че ще свърши, това, което наречем надпреварата до нула, ще стане цента. Това доведе до интересна промяна във вида на нещата, които бизнесът може да направи. И аз наричам това като прекъсване чрез данни или по-специално големи данни, и под това имам предвид, че видяхме технологии, като как да се превърнем в нещо, при което можем да мащабираме много хоризонтално при съхранение и вида на изчисляването може да се прилага за това съхранение и как отваря интересна технология, защото ни позволява да правим много големи, излишни паралелни съхранения на най-бързо ниво и Hadoop части сами по себе си, като за първи път можем да копираме данни в запис веднъж прочетен многократно формат и просто мащабирайте нещата в почти линейна степен.
И всички компании като тази се сбъдват с прекъсване, използвайки големи данни. Имаме компании като Uber, които са най-голямата таксиметрова компания в света. Те всъщност не притежават никакви таксита и тук е дълъг списък. Airbnb е най-големият доставчик на квартира, всъщност няма недвижими имоти. Един от любимите ми е Facebook, например в този списък, където всъщност не създават съдържанието, ние го създаваме за тях, но всъщност те са най-големият собственик на медии на планетата. Имаме интересни такива като най-бързо развиващите се банки, всъщност нямат пари. Това са платформи и банки за партньорски кредити, а в Австралия има една, в частност все по-голяма слава, наречена SocietyOne. А някои от основните банки, които трябва да разполагат с пари, инвестират в тази конкретна банка. И минаваме през този списък дори до Netflix; те всъщност не притежават никакви кина, но въпреки това те са най-голямата кино къща на планетата.
Така стигнахме до мястото, където бяха, според мен, чрез прилагането на интелигентни технологии на ниво данни, защото бихме могли да направим по-голямо и по-широко съхранение на по-ниски разходи поради падналата цена на гигабайт пространство на твърдия диск и можехме приложете някои интелигентни изчисления и разпределете изчислителен модел над това. Тези компании имаха възможността да създадат конкурентно предимство и да се прекъснат в резултат на намаляващите разходи на дисковото пространство.
Видяхме подобно нещо да се случи в цената на паметта. Преди няколко десетилетия, ако лежахте около шест милиона долара, можете да си купите гигабайт RAM памет, а ние имаме много подобна J крива или хокейна пръчка, която да се състои в намаляването на разходите или падналата цена на RAM. И това доведе до някои интересни неща и според мен едно от най-големите смущения в това пространство е количеството памет, която може да бъде вградена в устройства, като мобилни устройства, като телефони и таблети и дори лаптопи. Компютрите в наши дни, количеството памет, което отива в среден лаптоп, е доста нелепо в някои случаи. В някои случаи сегашният ми лаптоп има повече памет от някои от сървърите, които използваха не толкова отдавна.
Това доведе до значителна промяна в себе си по подобен начин, както RAM има в съзнанието ми, позволи ни да мащабираме и мащабираме бързо. И сега имахме появата на технология, която наричаме флаш, и това е технология, която първоначално произтича от нещо, което се намира на хардуера под формата на EEPROM, малко чип, който е проектиран така, че да може да бъде наличен, и пишете на, и тогава, когато захранването се изключи, ще запази всичко, което сте написали на този чип, като постоянно хранилище. Беше бавно, тромаво и в онези дни, мисля, че беше около 1980-1981 г., нещо стана нещо. До 1984 г. Тошиба, който вярвам, че изобретява технологията, я превръща в търговско нещо, което можем да използваме.
Но преди много време хората разбраха, че всъщност могат да вземат комбинация от компонентите, които са били използвани за създаване на тази концепция за EEPROM, памет, само за четене, след като я изтриете и я напишете и всъщност могат да я напишат редовно и го използвайте малко повече като дисково пространство и малко повече като RAM. С течение на времето се разви. Сега тази технология за съхранение на флаш е сливане между традиционното дисково съхранение, независимо дали става въпрос за въртящ се диск или в някои случаи хибриден диск с памет и RAM памет. И ключовото нещо е системата между, защото можете да четете и пишете на нея, а след това да изключите захранването и тя ще запази това, което сте му написали. Така че дисково пространство, очевидно пишете на него, изключвате захранването, а въртящото се вретено и силно модифицираното, за да имате желание за по-добро описание, запазва нулите и тези, които сте му написали.
В пространството с произволен достъп пишете нещо в паметта в RAM паметта, изключвате компютъра и всичко се изтрива, защото няма повече електрони, които да го заредят и задържат информацията, която сте му написали. Плюс това е в средата и е изключително бърз, по-бърз от диска, по-бавен от RAM. Но можете да пишете на него и да четете от него и когато изключите захранването, той ще се запази. Това доведе до невероятни технологии и по-специално ние разработихме мобилни устройства и лаптопи, които са наистина, много бързи и способни да правят много неща, и сега тя се премества в инфраструктурното пространство около съхранение и изчисляване, и това доведе до значително промени в това, което можем да предоставим в мащаб. Това е видът, в който вярвам, че оста Z в съзнанието ми идва сега.
Почти точно навреме е по много начини, тъй като сега видяхме смущения в това, което аз наричам търсене, и това е, че потребителите имат, независимо от това какво се случва в инфраструктурата и технологичното пространство и способността да шофират по-бързо и по-бързо изчисляване и ефективност на ниво инфраструктура, потребителите изискват това прекъсване под формата на това, за което се говори сега, опитът на знаменитостите. Всички искат всяка система, всяко приложение, всеки уебсайт да знаят кои са и какво харесват, както и да могат да им дадат персонализирано преживяване едно на едно. Вече не е достатъчно, просто да отида на уебсайт, където купувам билети за кино. Искам да знам какво съм купувал преди, защо съм го купувал и потенциално това, което хората също като мен са купували и препоръчват нещата.
Неизменно виждаме това, което визирам, е страничен ред на социалното и това е, че искам опитът на знаменитостите, но аз също искам да социализирам тази идея, искам да я споделя с всичките си приятели и да им кажа какво правя и искам да знам какво правят моите приятели. И това е резултат от експлозивно търсене на допълнителни изчисления и съхранение и бърз обрат на нещата. Видяхме поколението на Fitbit, което аз наричам винаги проследяване. Всичко, което правя, се проследява и записва, и се залавя някъде. Видяхме всичко в реално време: банкиране, наддаване, препоръчителни двигатели, трябва да мога да се справя с нещата в реално време, които аз лично правя като потребител.
И тогава виждаме много голямо въздействие, като рисковете за сигурността около киберсигурността. Някога имахме отделни хакери, после имахме престъпни банди, които се прилагат към него, сега имаме цели нации, които воюват през интернет, което е истинско нещо и всъщност се случва. Обърнете внимание на това, седнете и разгледайте това, защото има реално въздействие за това, а някои от нашите предпремиерни планове бяха около обсъждането на риска от проникване на собствен компютър или поне вашата мрежа.
Виждахме тази концепция за добиване на образувания. Извличането на субекти е, когато трябва да намерим интересни неща в много големи масиви от данни и по-специално около измами, незаконна и хакерска дейност. Но по-често, отколкото не, ще видим, че извличането на субекти се превръща във фокус за добри неща и неща, които са ценни за нас, за разлика от търсенето на неща, които ни атакуват.
Виждали сме и експлозия, която се нарича геопространствени данни. Това са данни, които всъщност знаят откъде са произлезли или от къде са други данни като него. Можете да си представите, че стоите на улицата и искате да намерите най-близката гара за паркиране или най-близкия ресторант, приложения, които могат да прилагат геопространствени изчисления и данни, изчисляване на данни, които знаят къде е в космоса, е много важно, защото трябва да можете да знаете къде се намират други обекти и образувания и да го направите бързо.
Виждали сме постоянно свързан мобилен телефон. Дори когато лягаме да спим през нощта, нашите мобилни телефони все още текат, актуализираме имейлите си, проверяваме календарите си, разглеждаме какво е времето и проучваме какво ще бъде на разположение това, което бихме искали за закуска. Там се случва много шум и това създава огромно въздействие върху това, което трябва да правим в задния край и колко бързо го правим.
Като цяло, чистият мащаб и въздействието на това, което се нарича Интернет на нещата, или по-често, отколкото връзката между машината и машината, където устройствата разговарят с устройства и това стига чак до двигателите, приковани към устройството страна на самолетите, която казва на самия самолет или на системата за управление на самолета, че носенето на двигател номер четири изпитва прекомерно износване и топлина и трябва да бъде заменено, когато кацнем, а след това той комуникира с друга машина и затова трябва да постави поръчка и магически инженер се появява при полет на летището и е готов да го замени по време на зареждането с гориво.
И мащабът, който е толкова голям и толкова голям, че трябваше да влезем в това, към което се позовавам, чрез достъп, за да се справим с него. Защото нов свят и добре дошли в новия свят, нов свят на всичко, което използваме, е свързано; навремето беше сателити и мрежови устройства, сега това са мобилни устройства и нашите лаптопи и таблети и телефони и дори чисто новото ми Audi има вграден знак и отчита постоянно за собственото си здраве, но също така се обновява, и знае къде е и кои карти са приложими и дори ми казва кога да мина по различен маршрут, ако има трафик по пътя напред.
Всичко, което сега изграждаме, всичко, което говорим с вас сега, е проектирано да се свързва и да се свързва с други неща, не само от мен към системата, но и от система в система, и да можем да се справим с това ние трябва да прилагате много различно мислене в инфраструктурния слой, както в хардуера, така и в софтуера, и по-специално в слоевете на базата данни, които системите трябва да подкрепят това и в много отношения базата данни се е превърнала в двигател и приложенията наистина просто малки ботове, които правят неща.
Ще се завъртя бързо тук с тази леко хумористична гледка на вид къде отиваме с тези неща и това, което наричам „IoT с натискане на бутон“. Създадена е нова джаджа, наречена „ Amazon Dash Button, и това е малко приспособление с размер на палеца. Всъщност по много начини е същото като моето USB палец. Когато купувате това нещо, това е около 4, 99 долара в САЩ от Amazon, той ви се доставя, конфигурирате го с мобилния си телефон и буквално просто го прикачвате към едно от вашите устройства, като хладилник или пералня или каквото и да е друго. В примера на вашата пералня, ако в крайна сметка ви свърши прах за пране, можете да натиснете този бутон и той ще набере вкъщи и автоматично ще поръча повече за вас, а магически повече ще ви бъде доставен чрез нашите добри приятели в Amazon.
За мен това ме плаши, защото предстои експлозия на редица неща, които са свързани в мрежата и се опитват да създадат свързаност и да генерират търсене. Ако можете да си представите, едно или две от тези неща може би не са толкова страшни, но последния път, когато погледнах, имаше над 110 от тези неща, които се брандират, така че почти всяка марка на планетата ще се опита да получи свой собствен малък тласък - бутон IoT, че се прибирате вкъщи и натискате бутон и той казва: „Поръчайте ми пица.“ Натискате още един бутон и той поръчва предварително изграден обяд за децата ви за утре.
Това води до такова огромно търсене на трансформация в задния край, на ниво приложение, по-специално на ниво база данни, че мисля, че току-що видяхме върха на айсберга от типа трансформация на производителност, който трябва да видим, И с това ще го предам на доктор Робин Блур и ще разбера какъв е мястото, където сме и ние.
Ребека Джозвяк: Добре Робин, предадох ти топката.
Робин Блур: Това не е ли добре? Добре, ето, аз съм. Видях представянето на Дез преди да стигна до този, така че бих казал неща, които са безплатни, а не просто да повтарям някои от нещата, които Дез каза. Мислех, че ще говоря за развитието на базата данни по отношение на това, което всъщност се е случило с архитектурата, и така нататък и така нататък, на бази данни от историческа гледна точка.
Основният проблем, който има всеки доставчик на база данни, е поддържането на гъвкава архитектура, която мащабира и е в крак с развитието на хардуера. Ще говоря така, но когато всъщност погледнете назад и видите начина, по който са били изградени базите данни, и начина, по който са изградени сега, те всъщност се различават значително от това, което бих нарекъл ниво на архитектурен дизайн, Струва си само да прегледаме защо е така или поне аз мисля, че е така. Хардуерните фактори и Dez ни предоставиха особено добър пропуск на долните слоеве по отношение на паметта и диска. Това, което имаме сега, и това е бъдещето, Intel е следващият, CP, който ще има FPGA. Какво ще правят хората с това, нямам представа. AMD обединява процесори и графични процесори и каква разлика ще има това? Това са видовете промени, които всъщност ще се променят в базата данни и подозирам, че Aerospike между другото, тъй като Aerospike се управлява от производителността, вероятно вече се вглежда в това и работи там, където смята, че всъщност ще отиде с начина, по който продуктът работи.
Имаме система на чип, която все още не е излетяла. SSD дискове, за които знаем, но смисълът е да се отбележи, че те всъщност се увеличават в скорост, приблизително процент на закона на Мур, коефициент 10 на всеки шест години. Но Intel е на път да пусне 3D кръстосана точка, която твърди, че е в състояние да премине повече от сто пъти по-бързо от SSD дисковете, всъщност вид капки в сместа, тогава това ще промени скоростта, с която продукти като Aerospike всъщност могат отивам.
Тогава имаме паралелни хардуерни архитектури, с други думи начинът, по който сме конструирали хардуер в смисъл - първоначално това беше просто процесор, седнал над паметта, който седеше над диска, но става много по-сложно от това. Идеята на система на чип е, че всъщност можете да имате чип за паралелизъм, за да чип на чип и да направите всичко да върви с изключителна скорост, а ние нямаме идея точно кой от тези продукти всъщност ще доминира.
Това е само поглед към бъдещето, но на хардуерно ниво производителността се ускорява и разходите продължават да падат, нещо като чертата, която Дез описваше. Вашите процесори не е задължително да поевтиняват, а просто стават по-бързи и така нататък.
От гледна точка на бизнеса, в някои ситуации и това са пазарни ситуации, като първо място е бизнес стойността. Ако по-специално - ако сте абсолютно убедени, че определен състав ще падне, първият човек, който получи поръчката за продажба, получава най-добрата цена. Наистина е толкова просто. Следователно, има състезание по технологиите, което продължава към автоматизираната търговия в банките, за да се опитате да спечелите тези ситуации. Какво се случи след това? Какво се случва, след като банките са свършили работата си с всичко това? Изведнъж започвате да виждате други области, заразени от същия вид потребности от скорост.
Наистина това, което се случва, е ли хората да бъдат отстранени от уравнението и това се случи с интернет рекламата много бързо. Но нещото не е в конкретната транзакция, в изпълнението на методи, това е цял бизнес процес, факт е, че уебсайтът току-що е отхвърлен и трябва да се вземе решение, което може да е доста сложно решение, т.е. по отношение на това каква реклама всъщност да се сложи на тази уеб страница, като се изважда от това кой е потребителят на браузъра, коя би била най-подходящата реклама за поставяне на тази и така нататък и така нататък. Стана много сложно нещо и ще го спомена отново.
Но въпросът е, че представянето и мащабируемостта на бизнес процесите не е същият проблем като производителността и мащабируемостта на способността на заявките и това е нещо, което добре знам, защото наскоро проведена брифинг, която направихме с Aerospike, че те също сме наясно. Друго нещо, когато всъщност работите с тези скорости, свойствата на активите имат значение за транзакция, всяка обработка на събитията. Те наистина, наистина имат значение. Така че страшно много от това, което правят някои бази данни, което е загуба на писмо или две от актив, може да работи разумно в контекста - това ще работи добре в контекста, за който говорим. Честно казано не е приемливо.
От технологична гледна точка всъщност гледате - знам, че има два вида лостове, за да създадете вида на архитектурите, които всъщност са необходими за даване на скоростта, която може да направи, като Aerospike, може да направи милион транзакции за секунда. Всъщност трябва да сте много прецизни по отношение на разработката на софтуер. Не можете просто да хакнете. Трябва да се притеснявате за дължината на кодовия път. Трябва да използвате отлично в паметта и всъщност оптимизирате цели транзакции. Имате нужда от интелигентен паралелизъм и също така се нуждаете от безопасен паралелизъм. Трябва да увеличите мащаба, а не да го мащабите, защото веднага щом включите мрежата в каквото и да било, тя се превръща в най-вероятният показалец, който ще достигнете до закъснение и ще започне да прави транзакциите твърде бавно.
Трябва да стигнете до колкото е възможно повече на всяка известна информация за мрежа, преди да влезете в мащаб и наистина не искате да мащабирате бързо, наистина не искате много процеси. Искате мрежа, която не се използва от никой друг. И вие искате да имате невероятно бърза мрежа.
Ускореното SSD съхранение е нещо - всъщност мисля, че по-голямата част от това важи за това, което прави Aerospike. Едно от интересните неща е, че това е база данни на NoSQL. Някога се вярваше - не знам, преди няколко години - някога се смяташе, че релационната база данни е единствената база данни и тя доминира над всичко, и това беше само тази странна малка ниша ситуация, в която нямате нужда да отида релационно. Сега е нещо обърнато на главата си. Именно бързите бази данни са в тези бази данни SQL и една от причините за това, основната причина за това е, че те избягват присъединяването на данни, те съхраняват данни почти по обективен начин. Когато приключите с обект, просто го съхранявате и след това дърпате целия обект назад, той не свързва нещата заедно, за да ги обработите в действителност. Ето това е скоростта. Тези видове техники, които генерират скорост в контекста на базата данни.
Това е следата на сълзите, това е, което се случи с базата данни. Историята или разказът на релационните бази данни беше в края на база данни всъщност не беше вярна. Дори когато започнаха да доминират, все пак беше необходимо. Обектните бази данни извършиха предишните транзакции в онези дни, защото релационните бази данни всъщност не можеха да ги направят, а след това се оказа, че релационните бази данни, използващи редови магазини, също не могат да извършват бързи заявки, нужни са ви магазини на колони. И тогава открихме, че ако всъщност искате да правите графични запитвания по данни, нито магазинът с колони, нито релационната база данни няма да са полезни и всъщност трябва да имате изградена специално за вас графика база данни. След това влязоха RDF бази данни и веднага след като всъщност започнахте да обмисляте смисъла на семантиката и ние получихме базите данни NoSQL, много, много конкретно за скорост. Да ги наречем NoSQL е почти все едно маркираш всички тези бази данни, сякаш са еднакви, всъщност те са коренно различни в това, което се крие отдолу. Единствената причина, поради която носят името NoSQL, е, че те не са по дяволите за SQL, защото е твърде скъпо. Латентностите на транзакциите, от които се нуждаят.
IoT - който реших, че ще завърша в същия момент, в който го завърши Дез - не свърши, цялата тази ситуация по отношение на скоростта и изискванията за забавяне, не свърши, докато дебелата дама не започне да обезобразявайте тези данни и тя все още не е започнала. Много от тези данни ще искат да имат закъсненията, за които съм посочвал, така че мисля, че това е всичко, което имам да кажа. Нека да го предадем на Aerospike и Brian Bulkowski.
Брайън Булковски: Здравейте, благодаря много за присъединяването към групата Bloor и на мен за тази презентация днес. Размишлявайки за това, за което Dez и Робин току-що говореха, бих искал да ви разкажа малко за следите, които Aerospike предприе при предоставянето на нова технология за бази данни и технология за бази данни NoSQL в редица индустрии. Беше страхотен път. Започнахме Aerospike през 2008 г., като видяхме много от тенденциите, които Дез и Робин споменаха. По-специално за това, че базите данни в паметта могат да се възползват от светкавицата, както и вида облачни системи за мащабиране и видовете мащаб, необходими за персонализиране, анализиране на поведението и вид VIP опит, който се обсъжда.
Когато се обърнахме към проблема с база данни, която представляваше оперативна база данни от предния край, която можеше да предостави основите на приложения, които биха могли да бъдат написани за решаването им, започнахме с проблема как бихме могли да изградим по същество разпределена хеш-таблица, памет -разпределена хеш таблица, която беше удивително бърза и способна на неща като милиони транзакции в секунда, но на разумна цена. Когато завършихме нашия прототип, разбрахме, че тогава ще трябва да разберем кой може да се нуждае от този вид скорост. Бидейки компания от Силиконовата долина, бързо установихме, че наистина рекламната индустрия е способна да консумира този вид информация и се интересува от нея и затова бих искал да прекарам секунда в разговори за наддаване в реално време и как това пазарът работи.
Робин спомена как работи финансовата търговия, която е първата транзакция, често е печелившата транзакция и има по същество време за пазар на латентност и стойност на латентност. Рекламната индустрия е малко по-различна, по интересен начин, тъй като целта в рекламата е особена - това, което се нарича впечатление, способността за доставяне на реклама - е търг и този търг протича между десет милисекунди до петдесет милисекунди. Името на играта и често стотици компании, които сега наддават в реално време за всяка една реклама, която е поставена в интернет, е да получат максимално количество данни и да донесат най-добрите алгоритми, които да бъдат изпълнени в рамките на десет до петдесет милисекунди през най-голям обем данни.
Тази промяна и смяна се случваше в рекламната индустрия, във всяка една от тези малки милисекунди има ограничено във времето усложнение с най-добрите алгоритми за най-голямо количество данни и за да направите това, обединявате много малки парчета от данни. Скорошна информация за IP адрес, скорошна информация за определена категория устройства, последна информация за поведението на уебсайта, скорошни думи за търсене, всичко това ще влезе в тайния сос на алгоритмите на конкретна компания, за да се определи цена и оферта.
Това е увлекателен пазар, към който да се присъединим. Първо направихме първото си внедряване в Aerospike през 2010 г. с някои от първите компании, работещи сериозно в икономиката на офериране в реално време, а след това постигнахме, основно това е първоначалното съхраняване на данни за поведение, за повечето компании в това пространство. Това, което открихме оттогава и е конкретна архитектура, която ще опиша подробно през хода на тази презентация, е, че всичко това се случва през 2010, 2011, 2013 и продължава да се развива. Рекламата е много динамичен пазар.
Но такъв тип VIP изживяване, можете да мислите за поставяне на правилната реклама, не поставянето на реклама за продуктите на децата, тъй като аз нямам деца, така че няма да има ефективна реклама, ако е поставен върху това, но ако става въпрос за бързи автомобили, това е вид реклама, която да се постави на Брайън. Това е наистина видът VIP опит при сделки, дали да намалите или не, ако сте на сайт за търговия на дребно, дори и при разкриване на измами. Това ли е нормалният модел на конкретен човек или определена кредитна карта? Цялата тази технология на анализа в реално време, на поведенческото прогнозиране, на прогнозната аналитика, сега прозира извън рекламната индустрия, която се занимава с забавление и печалба сега от доста години и наистина навлиза в продажба на дребно и банково дело, разкриване на измами и т.н., чрез определена архитектура. Така че Aerospike е привилегирована да бъде част от редица от тези случаи.
Архитектурата, която виждаме как работи и е практична за това, е тази, в която вместо да създаваме набор от заявки от сървър на приложения, вместо да премествате повече от изчисленията си към самия сървър на приложения и след това да използвате база данни като по същество място за съхранение двигател за вида на предметите, за които Робин говореше. В този случай тези архитектури, първо, не бъркайте това с вашите реални анализи тук. От дясната страна на този слайд виждате, че тук все още има анализи за генериране на прозрения. Това са работни места, които често работят над петабайти, десетки петабайти данни, дори екзабайти в случаите на някои от нашите големи клиенти, използвайки различни технологии. Трябва да имате екип с големи данни, екип за анализи, количествен екип, който да разбере какво, да речем, има значение геопространствените координати, какви модели работят по отношение на намирането на тези взаимоотношения и създаването на VIP опит. Това е цял проблем за себе си, а не този, в който Aerospike е участвал пряко, и има куп страхотни технологии, когато се занимавате с такъв тип система.
Това, за което се вълнуваме и работим с индустрията, е, след като имате тези прозрения, как се ангажирате с вида транзакция машина-машина или бърза машина-човек, където вземате тези прозрения и правите те истински за всеки човек, момент по миг? Архитектурата, която видяхме, използвайки тази, е тази, в която има написан сървър на приложения, който прави цялата тази математика и преглежда моделите, които сте създали, и гледа на скорошното поведение и прави това по същество ключова парадигма или поне много полезна система от въпроси.
Когато имате работа с видовете типове данни, за които говорим, с вида на потоците, за които говорим, с милиони записи в секунда, милиони четения в секунда, милиони и стотици и хиляди решения на второ, изграждането на сложни индекси, многоизмерни индекси, просто не работи много добре, не е мащабируемо. Начинът за постигане на тази форма на мащаб е да се проведе много паралелизъм. Ще поговорим малко за това как го правим по-късно. Но част от това е сървър за приложения без гражданство, написан на вашия собствен език.
Това, което често виждаме, е конкретен проект, който предполага нова рамка за приложения, базирана на хората, които работят там, технологията, която използват, и проблема, към който се приближават. Виждали сме хора, които използват Python, много хора използват Java, ние все още виждаме програмисти на C, защото много от това все още е с висока производителност, може би дори използва неща като старите библиотеки на MATLAB. И те трябва да докоснат хиляди и хиляди точки от данни в секунда, за да вземат ефективно решение.
Един въпрос, който съм задавал понякога, е: „Е, Брайън, ако си способен на милиони транзакции в секунда, кой се нуждае от това?“ Ако погледнете например обработката на плащания в Северна Америка и Aerospike участва с решения, които правят откриване на измами в тази система и подкрепят писатели на приложения, които правят някои много иновативни неща в откриването на измами, има само няколко хиляди платежни транзакции в секунда, преминаващи през дори най-големите процесори за плащане. И все пак, когато първата компания дойде при нас и каза, че разглеждат използването на NoSQL и искат да видят как ще изглежда нашето решение в основата на тяхното приложение, те казаха, че искат да докоснат 5000 парчета данни в прозорец от 750 милисекунди. Е, сега изведнъж имате няколко стотин бизнес транзакции и няколко хиляди парчета данни, които трябва да вземете предвид при всяко изчисление, а сега сте в областта на нужда от милиони транзакции в секунда.
Случаят - като оставим настрана рекламата за секунда, случаят на измама е завладяващ, защото там, където има пари, има измама и предотвратяване на измама в реално време, за разлика от опитите да се подреди аналитично след измама, наистина е Въпросът е да предоставите онлайн възможно най-много данни и можете да мислите за това като отражение на това VIP преживяване. Дали този човек се държи по начин, по който обикновено не се държи? И така шансовете да бъде измамна система, а не всъщност този човек, нарастват. Обикновено този човек осъществява достъп чрез определено устройство или набор от устройства с определен набор от разделителни способности на екрана? Обикновено те проявяват определен модел на поведение при пазаруване? Може би можем да откажем измама в залата по време на самата транзакция. Това трябва много да ви напомня за нещата, които се случват в рамките на транзакция в рекламната система.
Видовете системи, които решаваме са тези, при които всеки отделен процесор за разплащане има голям екип от данни, те имат много исторически данни, създават нови модели, не споделят с нас в Aerospike всички модели, защото те наистина е таен сос. Ако сте абонат на Gartner и сте чули Gartner да говори за икономията на алгоритмите, това е един алгоритъм и една компания, която се бори с глава, за да намали измамите и да увеличи броя на успешните транзакции, защото вие също не правите ' не искате да блокирате транзакциите. Това е вид проекти, които търсим в Aerospike на тези нива на мащаб.
Друг случай, по който работим с компаниите за финансови услуги, е това, което се нарича Intraday System of Record. В този случай това, което се случва е, видът на по-богат опит, дори в системата за търговия на дребно, е този, при който искам да мога да разгледам конкретната си позиция и искам да го направя изключително точно. Не искам да имам улов пред моята DB2 система. Вместо това искам да разгледам точните данни и между мобилните, но и неща като преизчисления на риска, преизчисленията на риска сега трябва да се извършват всяка минута, искате да можете да преизчислите риска на всеки, както и глобалният риск, системен риск за цялата компания в рамките на няколко минути.
И пак това е същия проблем. Всеки отделен акаунт, който е определен, помислете за това като търсене на ключова стойност на определен обект, тогава това може да се направи паралелно и най-важното е, че тази парадигма ви позволява да пишете кода и алгоритмите си на език на високо ниво, което е по-лесно за отстраняване на грешки и по-бързо време за пазаруване. В тази икономия на алгоритмите трябва да мога да получа алгоритмите си онлайн. Това е много различен проблем при моделирането и бизнес отношенията, в което са отлични релационните системи. Когато имате таблица с части и тези части са свързани с поръчки и тези поръчки са свързани с хора, имате бизнес процес, който може да бъде строго моделиран и вероятно няма да се промени за целия живот на вашия бизнес. Новият алгоритъм за намиране на нов модел на измама трябва да бъде написан точно и бързо и да станат онлайн, като вземате бизнес решения в рамките на няколко дни, ако не и по-бързо. Решение NoSQL за този вид запис на записи е наистина невероятна система за тези момчета, защото им позволява да поглъщат данни много бързо, както и да изграждат нови алгоритми, така че не просто ново клиентско преживяване при адресиране на мобилни устройства, а наистина създаване на голямо разнообразие от нови приложения.
Това, което виждаме в Aerospike в дългосрочен план, е фактът, че всеки тип база данни, всяко физическо оформление на данните на диска има свои компоненти, а в Aerospike наистина сме фокусирани върху тази ключова стойност или ролева система, както Робин каза, с висока транзакционна последователност и наистина позволяват на хора като магазини за колони и езера с голям обем, както и твърди транзакционни системи, които също имат ограничения за отчитане. Виждаме, че всички те трябва да се въведат в най-различни двигатели за заявки. Виждаме някои от базирани в JSON двигатели за заявки. Виждаме неща като еластично търсене, виждаме Spark, всички се нуждаят от различни сортове в различни периоди от неща като магазини за колони, както и магазини за редици, в което Aerospike отличава.
Наистина виждаме, че тези различни видове и индустрията стигат до момент, когато избирането на най-доброто от породата на всеки един от тях ще бъде необходимост. За съжаление, поради реалността на дългосрочната аналитика и пакетирането на стихове за работа, анализите и оперативните ограничения, вероятно няма да стигнем дотам, че имаме един, един размер, който отговаря на всички, но ще стигнем до възможността за да изберете ясно между някои от основните оформления на данни.
Нека поговорим за минута за иновациите на флаш. Все още получавам въпроса, въпреки че, както беше коментирано по-рано, светкавицата вече е с нас. Когато стартирахме Aerospike през 2009 г., когато, вярвам, 2009 г., може би, да, 2009 г. беше, когато Intel излезе с X25, което наистина беше първата флаш устройство с SATA на масовия пазар, а преди това имаше редица флаш системи, но наистина това беше този, който избухна в съзнанието на много технологии. Fusion-io наистина донесе флаш на по-широкия пазар на предприятията след това.
Това, което се случва сега, е появата на система, наречена NVMe. NVMe е стандарт, подобен на SATA или SAS или дори SCSI, който позволява на различни производители на карти да си взаимодействат с драйвери в рамките на операционната система при високо ниво на ефективност. Така че това създава по-високо ниво на производителност, на първо място, защото NVMe се базира на PCIE като основен транспорт, който е много по-бърз от SATA, SAS или нещо друго, но също така позволява най-добрите драйвери на породата.
Например в Linux има този човек Jens, а Jens е ръководството за драйвери на NVMe, изложението Jens, и той върши по-добра работа, отколкото всеки отделен tn Intel или Fusion-io би могъл да свърши със своя отделен драйвер, с всичките си ресурси. Когато имате силата на самата операционна система да може да изгради най-добрия драйвер, виждаме някои наистина невероятни нива на производителност. Всичко това подкрепя идеята, че флашът наистина може да осигури много ниската латентност на RAM паметта.
Сега, Aerospike все още е страхотна база данни за RAM поради своя модел на клъстери, но откриваме, че след като правите мрежов хоп, който трябва да имате мащабируемо съхранение, вече харчите поне пет до 50 микросекунди, допълнителните 70 микросекунди от NAND обикновено не са пречка и можете също така да използвате светкавица, като се има предвид, че NAND светкавица, като се има предвид, че мрежата вече е включена в това. Тогава много хора се чудят как - всичко това звучи чудесно, ако купувате собствен хардуер, как се правят публичните облаци? Мисля, че ще намерите точно сега, без значение какъв обществен облак използвате, тези публични облаци имат много силни флаш предложения. Той се различава малко от облачния доставчик до облачния доставчик. Amazon има своите I2 екземпляри, които вече са изчезнали за една година, две години, които са наистина доста висококачествени флаш устройства, а Aerospike има модел на разполагане отгоре.
Бих искал да извикам Google Compute, Google Compute Engine, Google Cloud специално, тъй като в нашия опит те досега имат някои от най-ефективните устройства и някои от най-гъвкавите по отношение на моделите на внедряване. Но също така виждате нови модели на внедряване като Pivotal, което е нещо като публично / частно, така че можете да правите правилни Pivotal приложения както на места, които поддържат флаш и поддържат различни устройства за съхранение, така и Docker модели. Така че наистина, това е момент в историята, в който флаш е не само за закупуване и пускане във вашите центрове за данни, но наистина е потънал във всички доставчици на инфраструктура, защото това е наистина най-добрият начин да получите системи с високо IOPS на много разумна латентност.
Само един момент за Aerospike - Aerospike е база данни, разпределена в клъстери, което го прави много приличен както за внедряване в облачен стил, така и за центрове за данни. Откриваме, че гъвкавостта да можеш да добавяш повече данни и по-голяма производителност е абсолютно необходима при тези нови нетни приложения, защото стартираш проект, не знаеш дали имаш нужда от петдесет хиляди транзакции в секунда, сто хиляди, a милион, два милиона, така че искате да си осигурите място за добавяне на сървъри. И все пак, вие искате да увеличите мащаба, така че всеки сървър да може да бъде бърз сам. Всъщност не искате да свършите с петстотин или хиляда сървъри, които са бавни сървъри. Scale out не е единствената игра в града, мащабът й и мащабирането, както Dez казваше по-рано, има нова Z ос.
Надяваме се, че това ви дава нови идеи за това как скоростта и мащабите се справят с новите пазари и може би има проекти, върху които работите, където ще можете да помислите за наистина създаване на по-богати приложения и използване на рамка за приложения с по-ключ стойност или NoSQL база данни под нея. В Aerospike със сигурност видях много наши клиенти и много от нашите потребители с отворен код успяват с този модел и се радвам индустрията да го приеме в по-голяма степен.
Ребека Йозвяк: Благодаря много Брайън и съм сигурен, че Дез и Робин имат някои добри въпроси към вас. Робин?
Дез Бланчфийлд: Щастлив съм да вляза. Робин, имаш ли въпрос? Иначе имам бърз, който мога да започна.
Робин Блур: Съжалявам, бях в заглушаване. Аз се гмурнах, но никой не ме чу. Въпросът веднага ми дойде, защото това е много сложен набор от технологични възможности. Относно съществуващите клиенти, които имате, какъв е ескалацията или степента на транзакция, която срещате по отношение на някои от тези рекламни приложения? Продължава ли да се повишава процентът на транзакциите? И ако да, с каква ставка?
Брайън Булковски: Интересен въпрос, Робин. Всяка индустрия има своя крива във всяка компания. Да вземем рекламата в Северна Америка, да речем през 2012 г., рекламата в Северна Америка беше вероятно по-близка до 200 000 реклами в секунда, като нещо стандартно в рамките на деня, а не по мое време, и сега ескалира вероятно до около три до пет милиона реклами в секунда. Тогава обаче се случи интересно нещо. Рекламната индустрия започна да се занимава с някои проблеми, свързани с измами, а частите от индустрията, които са в състояние да блокират измамите, видяха, че ставките на транзакциите намаляват малко, около фактор два, в рамките на някои от по-сложните ни клиенти, които успяха да определят измамата. Разбира се, те трябваше да направят някои проучвания на базата данни, за да блокират измамите, така че в крайна сметка това беше нещо като същото.
Интересен случай на използване е в телекома, не споменах наистина, че телекомът наблюдаваше увеличаване на транзакциите поради таксуване въз основа на всеки един пакет, който преминава през мрежата на мобилния телефон. В старите времена имахме подробни записи за разговори и веднъж на минута, обаждане, какво знаете, малко пинг щеше да мине през мрежата и дали този човек все още има оставена минута? Сега трябва да изградим и равномерно маршрутиране въз основа на всеки пакет в интернет. Това е - съжалявам в рамките на мобилна мрежа, която изведнъж сега е милиони пакети в секунда и нещо, което се разраства отново и отново. Така че един случай е, че всяко приложение води един хубав малък вид 2X годишно. В рамките на някои клиенти виждаме: „Но изчакайте, имам ново приложение. Искам да добавя някои измами към моя риск. Искам да добавя малко по-задълбочено клиентско изживяване към моята измама и моя риск. ”Всяка една от тях създава ново натоварване на основната база данни.
Робин Блур: Да, искам да кажа, че мисля, че точно това намекнах в кратката презентация, която дадох, че това - ние смятахме, че транзакцията е, някой прави нещо и може би има каскада от събития и всичко се записва и сега много транзакции имат огромна сума за търсене и вие дадохте няколко примера в презентацията. И следователно всъщност вече не изпълнявате транзакция, вие всъщност изпълнявате един вид приложение, което може да има много, много елементи към него.
Другият въпрос, преди да го предам на Dez - тъй като очевидно маркираме екип по този въпрос - другият въпрос, на който бих искал да отговорите, ако имате разумен отговор, е и Dez, и очаквам интернет на Нещата или Интернет на всичко, както се нарича понякога, да създадат доста драматичен обем от транзакционен трафик. Можете ли да говорите с това? Това е вашето преживяване, имате ли клиенти, които идват при вас с този конкретен проблем и какво е вашето мнение за това в момента?
Брайън Булковски: Разбира се, мисля, че има малко объркване и, меко казано, по отношение на Интернет на нещата. Клиентите, които виждам досега, просто привеждат интернет към нещата, които имат. Помислете за тези бутони на Amazon - всичко това е Amazon - тези бутони, не можете да ги промените отново и да ги накарате да отидат до Walmart онлайн. Не е като браузър, с който можете да смесвате и съпоставяте всичко. От друга страна, машина-машина се случва и когато включите колата си Tesla, за да я зареждате, Tesla изпраща огромен обратен поток информация, всеки един сензор в колата, но тя постъпва в компютъра на Tesla за анализ и подобрена качество. Това, което виждам, е цялата тази машина-машина и всички сензори в отделна компания, създаващи нови изисквания.
Сега най-вече днес, това се влива в тези аналитични системи, и вземете случая на Tesla; Първата употреба на Tesla, според мен, беше да подобри живота на батерията, под „Какви са работните температури, какви са натоварванията? Нека да го разгледаме, нека да проектираме по-добра батерия. ”Но след това те започват да мислят и това е всичко чудесно, това е един вид завладяващ проблем с дълбока анализация, следващият въпрос е:„ Как да подобря преживяването всеки момент ? "
Сега нека приемем случая като Nest, където се опитвате да правите прогнозна анализа, за да променяте температурата на дома в момента. Такъв е случаят, когато започваме да виждаме в Aerospike, където има това огромно езеро с данни и има огромни аналитични процеси, но какво ще правя сега? Ще трябва да запазя, мислете за това като за парите, някаква част от последната седмица, последния месец, може би дори само информация за последния ден, вероятно на заден край, защото имаме работа с прост сензор устройства и в този момент ще правя набор от анализи, за да променя преживяванията. Този вид подобни на Nest преживявания, за които виждам случаи на използване на Aerospike.
Робин Блур: Добре, нещото, което очаквах с Интернет на нещата, беше, че ще започнете да получавате задействащи прагове и те ще започнат да създават каскади от събития. Виждали ли сте нещо подобно или това все още не сте виждали?
Брайън Булковски: Дез и аз бях - просто питах мнението на Дез за това, когато бяхме преди показването на чат. Това, което все още не съм виждал, е видът на каскада на данни на една компания, прескачащи се в друга компания, че хладилникът ми Samsung говори с пералнята ми LG, защото просто разбрах, че разлях цял куп шоколад по пода, така че такъв тип компания на компания устройство по устройство, мисля, че все още чакам това по отношение на Интернет на нещата. Мисля, че има някои проблеми в бизнеса и сигурността, които са предимно нетехнически, на които трябва да се отговори, за да се види това.
Робин Блур: Добре, Дез?
Дез Бланчфийлд: Всъщност имам много силни възгледи за тази конкретна последна точка, която само накратко ще вкарам в разговора. Мисля, че често бизнесът и технологиите мислят, че всъщност карат откъде идва търсенето, но когато погледнем какво се е случило, когато iPhone се превърна в нещо и според мен това беше нещо като първото мобилно устройство, ако помилвате каламбурът, но устройство, което може да се носи наоколо, което всъщност може да пуска много малки приложения в джоба ви и това доведе до значителна трансформация върху това, за което сме мислили, че е компютър. Много хора мислят за телефони iPhone или смартфони или Android телефони като телефони, но не са, те всъщност са само малък компютър, който управлява приложения, а едно от приложенията, които стартира, извършва обаждания, а те не са обаждания, за които се сещаме повече, те не са аналогов разговор от точка до точка, както подчерта Брайън, те са малки пакети, които се насочват наоколо.
Но по-често от това, което видяхме, е това въстание на смартфони, които всъщност не се използват за извършване на разговори, които често, вероятност 98% от това, което правя на моя смартфон, не правят разговори. Това е всичко освен разговори, това са приложения. Мисля, че този каскаден ефект - и аз държа да поставя това бързо на въпрос - но каскадният ефект всъщност се предизвиква от потребителите и всъщност имам този един лайнер, който изхвърлям доста често, за да се сдобия с куп CXO сядам в стаята и обръщам внимание, ако мисля, че заспивам с представянето, което правя, което не се случва твърде често, надявам се.
Някак си го казах при това прекъсване, което виждате във вашия бизнес, всъщност не се управлява изключително от технологията, по-често е, отколкото да не бъдете задвижвани от вашите клиенти. И те някак си седят и всъщност се чудят, какво има предвид той? Така че, като се замисля за използването на технологията, искам да кажа, че видяхме USENET, видяхме всички тези забавни неща, които се случват в интернет, но не много хора прогнозираха социалното и въздействието от него. Всички, които искат да кажат на всички какво са закусили, и шумът, който създава, и технологията, която имаме, и след това, разбира се, рекламата се опитва да я запълни с неща.
Мисля, че ще видим каскаден ефект до момент, в който устройствата разговарят с устройства, потребителите просто наваксват какво всъщност означава това и какво може да направи това. Повдигнахте интересна точка защо бутона Amazon няма да говори с Walmart. Ще публикувам този въпрос, какво се случва, когато Walmart получи собствения си бутон, и какво да кажем, ако най-добрите двадесет Amazons и Walmarts и други големи мрежи за разпространение и търговия на дребно получат свои собствени бутони? Къде ни отвежда това? По-конкретно, въпросът ми с Брайън ще бъде: „Къде отиваме с цялата тази нова парадигма на изпълнението? Вие сте в края на кървенето и работите с компании, които го правят както на ниво физическа инфраструктура, така и на ниво прехвърляне на данни. Къде ни води това, когато идва следващата голяма вълна? Какъв вид прозрение можете да споделите около това с това, което се случва в задния план от вашия опит? “
Брайън Булковски: Разбира се, начинът, по който мисля за много от тези неща, е да се съсредоточа върху потребителското изживяване и точно това, което казахте, това е потребителите, които управляват, въпреки че като технолози и като бизнесмени можем да измислим един умна идея, която мислим, че потребителите харесват, и аз ще се върна към примера на Nest. Когато сестра ми инсталира Nest в къщата си, тя каза: „Къщата ми е по-тиха, мога да чуя неща. Не е дори само да плащам по-малко за мощност ", тя е, но сега не бихте могли да откъснете това гнездо от ръцете си, защото й харесва да е в по-спокойна къща, за разлика от тази, в която отоплението се вдига максимално и след това се изключва обратно.
Въпросът в крайна сметка е, какви са потребителските преживявания, които можем да дадем възможност? Това в крайна сметка е, това качество на живот, че ако имаме парите и сме на първия свят, ще плащаме много. Ще ви дам пример от собствената ми къща, моята приятелка обича студено мляко. Тя харесва наистина студеното мляко и затова често трябва да се опитваме да разберем къде в хладилника ще е достатъчно студено и да не прегряваме останалите неща. Ами това е чудесно - и казах на приятелката си: „Бихте ли плащали по 10 долара на месец за студено мляко и да нямате замразени разфасовки?“ Тя беше като „Абсолютно“. И получаване на 10 долара на месец от всеки потребител е трудно.
Мисля, че в тези преживявания наистина трябва да следим какво е това преживяване за крайния потребител, което наистина може да бъде насочено. Мисля, че това беше част от тайната на iPhone. Мисля, че е част от тайната на Tesla да изгради по-добър автомобил с всички данни, премахвайки идеята за продуктов цикъл и ежегодно издаване и непрекъснати подобрения във всяка част. Ще трябва да измислим няколко умни идеи как всъщност да използваме всички тези данни по начин, който е непреодолим момент за момент в живота на хората.
Дез Бланчфийлд: Да, това е страхотно прозрение. Водейки от това, от другия край на спектъра, той отговаря точно на какви ли не неща, които виждаме сега, с това, което потребителите искат, и всички ние имаме нещо в къщата, което е студено от това и топло от това. Тогава е другият край на спектъра и ние видяхме това в нещо като традиционния „свят на големи данни“, където присвояването на данни става все по-рядко от кокошките зъби, а тези, които са на пазара, се предлагат повече, отколкото печелят CIO. в някои случаи типовете компании, с които работите, и видовете разработки, които сте виждали, случаят ли е, че типовете програмисти и типът архитект на данни и специализираните мрежови специалисти стават все по-трудни и трудни за намиране ? Имаме ли нужда организациите да започнат да мислят сега за изпреварване на кривата на вида на уменията, от които се нуждаят в задния край за типа разработчици и архитектите на данни? Какво виждате на това ниво, що се отнася до ресурсите за умения, които те ще разберат как да използват тази технология в добра употреба сега изглежда?
Брайън Булковски: Да, мисля, че това е едно от предизвикателствата пред организациите, с които съм говорил. Независимо дали е - най-лошите проблеми, за които съм чувал всъщност са някакви по-големи предприятия, защото ако кажете: „Аз съм от тази голяма банка, аз съм от Чейс и бях архитект на данни“, тогава вие „ имаш твоята стрида в света и заплатата ти се увеличава, така че има този проблем с намирането на работа на едно от тези места, защото няма достатъчно хора и след това можеш просто да се преместиш от работа на работа. Не чувам нищо, освен този проблем и това всъщност е една от причините, поради които се съсредоточих върху Aerospike, използвайки инструменти, подходящи за конкретния екип на проекта.
Вместо да се опитвате да влезете в екип на проекта и да кажете: „Ей, трябва да използвате нашия език за запитвания.“ Вижте, ако тези момчета карат автобуса днес, момчета и момичета, и ако използват конкретен език за заявки и инструментариум, те ще се придържат към това и аз не мога да ги обсъждам с нищо друго. Моята цел е да мога да поставя вида на мощността на Aerospike като база данни зад каквото и да е инструмент, който използват и това е част от тази идея, слайдовете, които виждате за бъдещето на базата данни Poliglot. Трябва да подкрепя моделите на приложение и анализа между тези момчета, защото наистина е трудно да се опитат да намерят хора, които имат математическия произход, както и статистическите възможности да се ориентират в този свят.
Дез Бланчфийлд: Друго интересно нещо, което хората може да не са наясно, искам да кажа, че Aerospike е много силен играч в света с отворен код, имам желание да получа много бърз поглед върху вида на това, което означава, доколко бизнесът оперира и какво прави за вас. Споменахте, че сте работили директно с хора, които правят неща точно до нивото на ядрото, така че ядрото на Linux. Има някои големи играчи, които са в това пространство, и има някои известни марки, които няма да споменем, но организация като Aerospike, в по-модерната ви по-нова история, опит с отворен код, как това се вписва в голямата картина и какви конкурентни предимства сте виждали, които ви дават?
Брайън Булковски: Разбира се, когато преминахме към отворен код през 2014 г., ние го направихме, защото разбрахме, че основна инфраструктура, подобно на база данни, трябва да бъде налична, трябва да се вярва и естествен баланс между стария свят на затворения източник и след като инвестирате в определена база данни, тези момчета са ви на милост за технологичния цикъл след технологичния цикъл и трябва да има баланс. Трябва да можем да изведем версии, които правят нови неща и може би това е в корпоративна версия, трябва да имаме модел с двоен лиценз, който да има версия с отворен код за хора, които ритат гумите, които вършат нестопанска работа, както и корпоративна версия, която е лиценз за собственик и позволява неограничена работа.
И разбира се, ще имаме и най-високите нива на скорост и мащаб, като е корпоративна версия. Вярваме в модела за лиценз за дуел и това беше чудесно за нашия бизнес. Искаме хората да започнат работа с Aerospike, искаме малки проекти, които да пускат гумите, супер е лесно просто да отидете в Amazon, да стартирате скрипт за потвърждение и да създадете Aerospike клъстер да работи в рамките на пет минути. От друга страна, искаме да дадем повече на корпоративните клиенти.
Дез Бланчфийлд: Ние някак се приближаваме до върха на часа, така че ще се върна за миг към Ребека, но ако имаше само един лайнер, който бихте изхвърлили там, нещо като съвет бихте дали на хората, които търсят да влязат в пространството на технологията, която сте внесли на пазара и как ще я възприемат, какво бихте казали, че първата стъпка за тях е да сортират поне пръст и започнете да гледате как ще получат конкурентно предимство от вашата платформа?
Брайън Булковски: Разбира се, част от посланието тук е, че има нива на скорост и умения, които сега са лесни. Не ви трябва хиляда възел Касандра, за да постигнете милиони транзакции в секунда. Можете да го направите дори в първите фази на вашия проект. Така че нещата са много по-лесни, отколкото преди. Тогава второто съвети е, че ще трябва да излезете, точно както казвате, математически модели за ангажиране на клиенти с бизнес процеси, които използват всички тези данни, така че добрата новина е, че данните са налични, лоша новина е, че всъщност трябва да намерите някои модели и някои убедителни случаи на употреба.
Дез Бланчфийлд: Да, чудесен съвет, така че сега ще се върна на Ребека. Благодаря ви много за това, беше страхотен малък чат за технологията, оценявам го.
Ребека Йозвяк: Благодаря, Дез. Имам няколко добри въпроса от публиката. Нека да хвърля този слайд. Знам, че сте говорили за системата на записи и мейнфрейм неща, но колко често виждате абсолютно разтоварване или репликацията е съгласуване в края на ден, нещо като това, което виждате повече?
Брайън Булковски: Това, което виждаме в Aerospike, използва база данни NoSQL пред тази система за съгласуване в края на деня. Имате нужда от вътрешен ден, верния отговор. Не можете да получите грешен отговор и това е, което Робин каза за активите, е недооценено, но бизнес процесите около законовите изисквания за помирение могат да станат доста сложни и има десетилетия технология и десетилетия закон и правна практика около правенето на помирение. Това, което виждаме в Aerospike е, че ще правите алгоритмите си в по-гореща база данни с повече транзакции в секунда. Но поради правни причини, вие абсолютно се нуждаете от система за помирение, която е преминала през тези правни процеси. Виждаме и двете и виждаме, че това по същество е двустепенната ИТ практика, изложена до известна степен от хора като Anderson Consulting и Gartner. Ние виждаме много от това.
Ребека Йозвяк: Добре, добре. Някой друг прояви интерес към този конкретен слайд, той каза, че това е наистина интересно и се зачуди дали можете просто да влезете в малко повече сравняване на светкавица с памет.
Брайън Булковски: Разбира се, добре, нека да взема бърза странична лента, отново знам, че сме близо до края на времето. Ами флаш е паметта - това е чипове - склонен съм да мисля за RAM. Така че RAM има специфични характеристики, изисква много мощност, много е добър на случаен запис, както и на случайни четения. Където NAND е способен на бързи случайни четения и по-ниска мощност, но е много лошо в случайните записи. Има някои фини различия в работата на тези два чипа на ниво литография, които създават редица технически разлики.
В случай, че правите анализи и трябва да прескочите много данни или в случая на Aerospike, където имате индекси, индексите все още са много добри за използване в RAM поради паралелизъм и случаен достъп. Изисква се по-високо ниво на случаен достъп. В Aerospike обаче откриваме, че използваме тези индекси, за да намерим конкретен обект или парче данни, това е подходящото място да се свържете с NAND, защото става нещо като по-голям магазин под индексите. Това е една транзакция със устройство за съхранение, но все пак след като сте направили много възможности и филтри във вашата система за индексиране.
Ребека Йозвяк: Добре, добре. И тогава знам, че вече говорихме много за IoT и един коментар от присъстващите каза, че IoT е до голяма степен полезен, но дали компаниите, правителствените организации и разработчиците растат сигурно и осигуряват данни със същата скорост, мислите ли?
Брайън Булковски: Може би Дез, бихте ли искали да скочите?
Дез Бланчфийлд: Да, щастлив съм да скоча в този. Мисля, че отговорът е не. Всъщност, една от любимите ми линии за изхвърляне на тази тема много, много накратко е, че мисля, че експлозията от машина до машина и общият Интернет на нещата, комуникацията и сигурността, рискът около нея, ние сме на мястото, където сега правителствата не могат да бъдат в крак с темпа на промяна. И всъщност знаем, че много организации не могат да бъдат в крак с промените. Всъщност, ако го перифразирам, скоростта на промяната днес е толкова голяма, че организациите трябва да спринтират само за да продължат, но им се налага да спринтират в множество състезания. Не мисля, че законът и не мисля, че правителството като цяло, нито на щатско, нито на федерално ниво, е в състояние да поддържа темпото на промените.
Сега, моят общ съвет към хората е вид постъпка сега и искане за прошка по-късно. Имаше много примери за това в миналото. Те ще наваксат, но мисля, че сега наистина зависи от бизнеса и доставчиците на технологии да внесат иновации в това пространство и да гарантират, че сме запознати с рисковете за сигурността или рисковете за поверителност и трябва да се справим с тях. По-специално, както споменахте, банките, когато мислите какво банкова организация традиционно прави с неща като пране на пари и познавате вашия клиент, предизвикателството AML / KYC, беше, че на всеки три до пет години ще се опитваме и отговарят на спазването.
Сега мисля, че това трябва да бъде вградено във всяка една транзакция. Винаги сте били в състояние да направите това на ниво оферти с реклама, акции и търговия с облигации и акции, мисля, че сме в момента, в който представянето, което постигате с платформата Aerospike, ни позволява да мислим как да внесем поверителност, как да внесем сигурност в тази верига за незабавни решения в реално време? И така отговорът е "не", не мисля, че правителствата продължават. Мисля, че компаниите трябва да продължат и мисля, че трябва да действаме сега и да поискаме прошка по-късно.
Брайън Булковски: Нека да добавя и няколко точки. Момчетата, с които се занимавам, технологичните компании, с които се занимавам, са много наясно, че се уверяват, че са от дясната страна на закона, и доста голяма част от дискусията е това PII, мога ли да използвам това, как съм Използвам този конкретен парче данни? Какво беше нейното провидение и това защитено решение или опит ли е? Как да направя всичко това? Така че това е добрата новина. Чудя се понякога за нашата дискусия като общество около това, в което сме се насочили, и ако дори дискусията ни в обществото е на подходящо ниво по отношение на използването на новите възможности от IoT чак до машинно обучение, което е единственият начин да подредим обемите от данни, които имаме. Но добрата новина е, че момчетата, с които разговарях, наистина са от дясната страна да се опитват да направят правилно от правните решения, които сме взели.
Ребека Йозвяк: Това са някои наистина добри отговори и от двете, и аз съм напълно съгласен. Не мисля, че сигурността се движи с толкова бързи темпове, колкото развитието на технологиите, особено що се отнася до Интернет на нещата, но трябва да мисля, че хората правят всичко възможно и се надявам да стигнем до там. Винаги е малко трудно да останеш десет крачки пред киберкрадците и киберпрестъпниците, но ще стигнем до там.
Е, хора, минахме осем минути в началото на часа. Искам да благодаря на нашите гости Браян Булковски от Aerospike и Dez Blanchfield и Robin Bloor. Много благодаря. Винаги можете да намерите нашите архиви в insideanalysis.com, SlideShare, YouTube, имаме много добри уебкастове, които идват хора, мина месец натоварен. Следващият месец ще бъде натоварен, така че следете и се надяваме да се видим следващия път. Благодаря хора, чао.