Напред инерция: преместване на релацията извън традиционното

2026

От персонала на Техопедия, 8 юни 2016 г.

Отнемане: Домакинът Ерик Кавано обсъжда иновациите в технологията за бази данни с експерти Дез Бланчфийлд, Робин Блур и Берт Скалцо.

В момента не сте влезли. Моля, влезте или се регистрирайте, за да видите видеото.

Ерик Кавана: Дами и господа, сряда, в четири източно време. Аз съм в Ню Орлиънс, лятото идва, това означава, че е горещо! Време е за горещи технологии, да, наистина, да наистина. Казвам се Ерик Кавана, ще ви бъда домакин. Ще изритам топката тук за Hot Technologies. Темата днес е „Напред инерция: Преминаване на релационното отвъд традиционното“. Хората, днес имаме трима експерти по база данни, така че всякакви въпроси, които имате, изпратете им трудните, не се срамувайте. Днес ви подредихме куп добро съдържание. Има място за вашето наистина, достатъчно за мен. Разбира се, тази година е гореща. Ние говорим всичко за горещи технологии в това шоу, което е партньорство с нашите приятели от Techopedia. И днес стигаме изцяло до основата на управлението на информацията, което, разбира се, е базата данни. Ще говорим за това как стигнахме до тук, какво се случва днес и какво се случва напред. Много интересни неща се случват.

Очевидно имаме някои сериозни иновации в пространството на базата данни. Беше тихо известно време; ако говорите с някои от анализаторите в бизнеса, бих казал вероятно от годината като, 2005 г. до 2009 г. или '10 г., не изглежда, че има прекалено много неща по отношение на иновациите. И изведнъж просто избухна, като джейлбрейк или нещо подобно, а сега се случват всякакви интересни неща. Много от това е заради мащаба на мрежата и всички готини уеб свойства, които правят различни интересни неща. Оттам дойде концепцията NoSQL. А това означава две различни неща: това означава, че няма SQL, тъй като в него не поддържа SQL, това означава и не само SQL. Има термин „NewSQL“, който някои хора са използвали. Но очевидно SQL - езикът на структурирания заявка - наистина е основата, той е основата на заявките.

И е интересно, че всички тези NoSQL двигатели, какво се случи? Е, излязоха, имаше много вълнение по въпроса и след няколко години, какво започнахме да чуваме всички? О, SQL на Hadoop. Е, всички тези компании започнаха да плескат SQL интерфейси върху своите инструменти на NoSQL и всеки, който е в света на програмирането, знае, че това ще доведе до някои предизвикателства и някои трудности, а някои кръстосани проводници и т.н. Така че днес ще разберем за много от тези неща.

Има нашите три презентатори: имаме обаждане на Дез Бланчфийлд от Сидни, нашия собствен Робин Блуър, който е в Тексас, както и Берт Скалцо, той също е в Тексас. И така, първо ще чуем от Дез Бланчфийлд. Хората, ще туитваме в хештега на #HotTech, така че не се колебайте да изпращате вашите коментари или да изпращате вашите въпроси чрез Q&A компонента на конзолата за уебкаст или дори през прозореца за чат. И с това, Дез Бланчфийлд, отнеси го.

Дез Бланчфийлд: Благодаря ти, Ерик. Здравейте всички. Така че ще се опитам да настроя сцената на 30 000 фута гледна точка на вида на случилото се през последното десетилетие и на значителните промени, които сме виждали - или поне на десетилетие и половина така или иначе - на системи за управление на бази данни и някои от въздействията от търговска или техническа гледна точка, както и някои от тенденциите, които сме издържали до късно, и ни водят в разговора, който предстои да водим днес по темата.

Моето изображение на корицата тук е пясъчна дюна, а от върха й духа малки вятърни пясъци. И в резултат на това става това, че пясъчната дюна бавно се движи от едно пространство в друго. И това е невероятно явление, където тези масивни пясъчни планини с височина 40 и 50 фута, ефективно, те действително се движат. И се движат много бавно, но се движат със сигурност и докато се движат, променят пейзажа. И е доста нещо, което да гледате, ако изобщо прекарвате време в зона, където пясъчните дюни са нещо естествено. Защото можете да погледнете през прозореца един ден и да разберете, че тази масивна пясъчна планина, малки мънички зърна са се преместили сами по себе си, в действителност и че вятърът бавно я премества от едно място на друго.

И мисля, че в много отношения това е светът на системите от бази данни от доста време. До съвсем, съвсем наскоро, тази много малка смяна под формата на пясъчни зърна, движеща гигантска пясъчна планина под формата на пясъчна дюна. През годините в платформите на базата данни навлязоха малки промени и това беше доста стабилна и солидна среда около системите и платформите от бази данни, чрез мейнфрейм на ерата от средния диапазон. Но от късно имахме някои доста значими неща с нашите търговски нужди и нашите технически драйвери. Ще ни преведе през тези.

Имам мнение, че основната концепция на база данни, както я познавахме много, много години, и както може би сте чували в лентата за предварително шоу, нашите двама експерти, които са на разговор с мен днес, продължиха живота си в това пространство и те са напълно прави в споделянето на хвалебствени права да бъдат там, когато всичко започна в началото на 80-те. Но ние видяхме тази огромна промяна през последното десетилетие и малко и аз бързо ще ни преодолея, преди да го предам на д-р Робин Блур.

Преживяхме това, което аз наричам „по-голям, по-добър, по-бърз, по-евтин“ опит. Както казах, дефиницията на база данни се промени. Пейзажът, в който платформите на базата данни трябваше да отговорят на производителността, както и техническите и търговските изисквания, също се измести. Видяхме това увеличение на търсенето на решения за справяне или с по-сложни търговски, или с по-сложни технически изисквания. И така един наистина бърз поглед върху това, което всъщност означава, според мен, е, че трябва да подредим 90-те години и видяхме, че технологията на базата данни е повлияна от въвеждането на интернет, и нещо, което наричахме тогава тогава интернет мащаб. Не говорихме само за хора, седнали пред терминалите, първоначално харесваха телематичните терминали с вградени в тях физически принтери и 132 колони текст, излизащи на хартия. След това ранните терминали на зеления екран, пробиване с клавиатури.

Но знаете ли, нашият свят беше терминали и серийни кабели или мрежови кабели, които дълго време разговаряха с компютри. След това дойде интернет и този експлозивен растеж на свързаността, че вече не трябва да се включвате в компютъра. За да стигнете до система от база данни, просто се нуждаете от уеб браузър. Така че технологията на базата данни трябваше драстично да се промени, да се справи с мащаба на всичко - от основните технологии на търсачките, които бяха използвани за индексиране на света, и да съхранява индекс на информация, в примера на мащаба на формата на база данни. И хора като Google и други предоставиха платформа за това. И всички нови видове съхранение на база данни и заявки и индексиране бяха произведени. И тогава имахме музикални сайтове и идват сайтове за филми.

И тогава, през 2000-те, видяхме бумът на дот-ком и това доведе до още по-драматичен взрив в броя на хората, използващи системи, неизменно захранвани от база данни с някаква форма. На този етап, релационните бази данни все още се справят с по-голямата част от натоварването, просто ги поставяме на по-голяма тенекия и по някакъв начин отидохме до много, много, много големи средни системи, работещи с Unix платформи от хора като IBM и Sun и т.н., Бутът на dot-com просто направи нещата по-големи и по-бързи от гледна точка на хардуер, производителност и имаше някои значителни промени в двигателите на базата данни, но за по-добра част, все пак беше същото, което видяхме дълго време.

И тогава получихме тази ера на уеб 2.0, както го наричаме. И това беше чудовищна промяна, защото изведнъж се нуждаехме от много по-прости платформи за бази данни и трябваше да има мащаб в хоризонтална форма. И това беше толкова съществена промяна в начина, по който подходихме към идеята какво е база данни. Според мен все още наистина наваксваме. И сега ние се занимаваме с цялата тази тресавица и казвам, че с положително въртене, а не с отрицателна конотация, това трептене на това, което ние наричаме големи данни, и огромна експлозия, и имам предвид експлозия. Това възмутително изместване вертикално върху графиката на броя на опциите, които имаме, когато говорим за база данни и някаква форма на възможност за релационно запитване.

И интересното е, че лично аз съм на мнението, че смятам, че големите данни наистина са само върхът на айсберга. Ние сме склонни да се вълнуваме малко от въздействието на големите данни и типовете избори, които имаме на разположение сега. Имаме всичко от NoSQL двигатели, имаме графични двигатели, имаме всички тези различни видове платформи, на които можем да хвърляме данни и да правим неща с нея. Дори до момента, в който всъщност един от първите разговори, които проведох с Ерик Кавана, който днес е тук с нас, беше около разговор, свързан с нещо, наречено Apache Drill, което е проект с отворен код, който ви позволява да задавате заявки данни вътре в модела различни типове данни: всичко - от сурови CSE файлове, седящи на твърд диск, до HDFS файлови системи в petabyte мащаб. И знаете ли, тя ви позволява да извършвате тези SQL-стил заявки на структурирани и неструктурирани данни от всички видове вълнуващи растения.

Предстои да видим, че „интелигентната сграда“ се превръща в нещо и бихме искали да мислим, че имаме интелигентни сгради за сигурност и управление на топлината, но говоря за интелигентни сгради, които знаят много повече за това кой сте и къде сте, когато влизате и правите всякакви спретнати неща на това ниво, до интелигентни градове - цели екосистеми на ниво град, които знаят как да правят нещата разумно. И освен това, имаме това невероятно нещо, което не мисля, че никой в света е схванал напълно и това е формата на Интернет на нещата. Според мен всички тези различни промени през последното десетилетие и малко, може би две десетилетия приблизително, ако го закръгляме, това са просто повлияли на света на това, което считаме за бази данни, според мен.

Имаше няколко значими неща, които направиха това възможно дори. Цената на твърдите дискове спадна драстично и в много отношения именно това направи възможно задвижването на някои от референтните архитектури като модела Hadoop, тъй като ние вземаме много данни и ги разпространяваме на много твърди дискове, и правете умни неща с него. И всъщност това, което стана рязко, според мен на релационната база данни или традиционния модел DB единица. И RAM паметта се получи много, много евтино и това ни даде изцяло нова възможност да играем с различни референтни архитектури като в паметта и да правим неща като разделяне на много, много големи буци данни.

И така това ни даде тази малка картина, която разглеждаме сега, която е диаграма, която показва типовете платформи, които са налични, ако сте в пейзажа с големи данни. И това е много, много трудно за четене и причината за това има твърде много информация за това. Има толкова много опции за създаване, моделиране и производство на начини за поставяне на данни в системи от бази данни под каквато и да е форма и да ги запитвате, и да правите традиционното четене-запис. И не всички са съвместими, всъщност много малко от тях дори отговарят на всеки основен стандарт за стил, но все пак смятат себе си за база данни. И ще ви покажа няколко екрана за секунда, за да ви дам някакъв контекст около това, което имам предвид под смяната от 90-те години и мащаба на интернет, към уеб 2.0, а след това и целия растеж чрез големи данни. Ако смятаме, че тази пейзажна графика за технологии за големи данни е вълнуваща, защото има много опции за нея, нека просто да разгледаме една ключова вертикала.

Нека разгледаме маркетинговите технологии. Ето опциите за системи за управление на бази данни или за управление на данни в рамките само на технологичното пространство, така че технологията, свързана с маркетинга. Сега това беше през 2011 г., така че преди няколко години; преди пет години така изглеждаше пейзажът. Ако се върна накратко един слайд, това изглежда днешният пейзаж на данните в различните марки и предложения, които имаме в технологиите за бази данни. Ето как изглеждаше една вертикала преди пет години, точно в маркетинговите технологии.

Сега, ако отида на днешния изглед, ето как изглежда и е напълно непроницаемо. Точно тази стена от марки и опции и хиляди и хиляди комбинации от софтуер, които считат, че са в класа на базата данни, могат да улавят, създават или съхраняват и извличат данни под различни форми. И мисля, че навлизаме в много, много интересно и смело време, когато навремето можехте да познавате основните марки, бихте могли да познаете пет-шест различни платформи от Oracle и Informix, DB2 и т.н., и да бъдете почти експерт по всички марки, които се предлагаха преди около 20 години. Преди десет години стана малко по-лесно, защото някои от марките отпаднаха и не всички марки можеха да се справят с мащаба на бут-до-ком, а някои компании просто се счупиха.

Днес е абсолютно невъзможно да бъдем експерт по всички съществуващи технологии на базата данни, независимо дали става дума за релационни бази данни или стандартни платформи за управление на бази данни, с които се запознахме през последните няколко десетилетия. Или вероятно е така, по-модерните двигатели като Neo4j и тези типове. И така мисля, че навлизаме в един много смел свят, в който има много опции, а ние имаме платформи в мащаб на хоризонтална основа, или в паметта, или на диска сега. Но мисля, че това е предизвикателно време за лицата, работещи с технологии и бизнес решения, защото те трябва да вземат някои много големи решения относно технологичните пакети, които в някои случаи са съществували само в продължение на месеци. Осемнадесет месеца вече не е страшно число за някои от по-вълнуващите и нови платформи за бази данни с отворен код. И започват да обединяват платформи и стават още по-нови и вълнуващи.

Мисля, че днес ще проведем страхотен разговор за това как всичко това е повлияло на традиционните платформи за бази данни и как те реагират на него, както и видовете технологии, които се хвърлят при това. И като се има предвид това, сега ще предам на д-р Робин Блур и ще получа неговата информация. Робин, при теб.

Робин Блур: Добре, благодаря за това. Да, това е твърде голяма тема. Искам да кажа, че ако просто взехте плъзгане на някоя от илюстрациите, които Дез току-що ви показа, бихте могли да проведете дълъг разговор само за един от плъзгачите. Но знаете, можете да отидете в база данни - аз разглеждам бази данни, не знам, от 80-те години на миналия век, и можете да разглеждате база данни по различни начини. И едно от нещата, които реших, че ще направя, просто се хвърлих в разговора днес, беше да говоря за причината, която разрушителните неща са се случили на ниво хардуер. И трябва да имате предвид, че наистина много разрушителни неща се случиха и на ниво софтуер, така че това не е пълната картина на нищо, това е просто хардуерно нещо.

Аз също нямаше да говоря особено дълго, просто исках да ви дам хардуерната картина. База данни представляваше възможности за извличане на данни, обхващащи процесора, паметта и диска и това се променя драстично. И причината да го кажа, беше, че се научих да разбирам база данни от гледна точка на това, което всъщност си направил. Знаеш ли, има разлика в латентността между данните, действително на процесора, и данните, които се изтеглят в процесора от паметта, и данните, които се изтеглят от диска в паметта и през процесора. И старите архитектури на базата данни просто се опитваха да балансират това. Знаеш ли, те просто казваха: „Е, това става много бавно, ще кешираме данните на диска, така че да е в паметта. Ще се опитаме да направим това по наистина точен начин, така че наистина добра част от данните, които искаме, вече да е в паметта. И ние ще пренесем данните в процесора толкова бързо, колкото всъщност можем. “

И базите данни са били писани в старите времена, машините са писани за малки клъстери. И сега, за невежите на паралелизма. Защото, ако ще получите някакво представяне от клъстер, ще трябва да правите различни неща паралелно. Паралелизмът е част от играта, нищо подобно на сега. Просто ще разгледам случилото се.

На първо място, диск. Ами дискът свърши, наистина. Почти е почти по отношение на базите данни. Мисля, че има редица контексти за архивиране на данни и дори много големи лайкове с данни, работещи на Hadoop, най-лошият въртящ се диск вероятно е жизнеспособен в наши дни. Наистина проблемът с въртящия се диск беше, че скоростта на четене не се подобри особено. А когато процесорът вървеше нагоре, законите на Мур скорости, вид порядък, по-бързи на всеки шест години. И паметта някак си следеше, тогава тези двамата разумно вървяха едно с друго, не беше напълно гладко, но се получиха.

Но случайното четене на диск, където главата лети за диска, искам да кажа, освен всичко друго, това е физическо движение. И ако правите произволни четения от диск, това е невероятно бавно в сравнение с четенето от паметта, това е като 100 000 пъти по-бавно. И сравнително наскоро повечето архитектури на базата данни, които разгледах в каквато и да е дълбочина, всъщност просто серийно четат от дискове. Наистина искате по един или друг начин просто да кеширате колкото можете от диска и да го извадите от това бавно устройство и да го поставите на бързо устройство. И има много умни неща, които можете да направите с това, но това е нещо приключило.

А солидните дискове или флаш дисковете наистина са това, което са, много бързо заместват въртящия се диск. И това отново се променя напълно, защото начинът, по който данните се организират на диск, е организиран според начина, по който работи диска. Всъщност става въпрос за глава, която се движи по въртяща се повърхност, всъщност множество глави се движат по множество въртящи се повърхности и събират данните, докато отиват. Solid-state устройството е само блок от неща, които можете да четете. Искам да кажа, първото нещо е, че всички традиционни бази данни бяха проектирани за въртящи се дискове и сега те се реинженерират за SSD. Новите бази данни вероятно могат - всеки, който пише нова база данни в момента, вероятно може да игнорира въртящия се диск, а не да мисли за това изобщо. Но Samsung, основният производител на SSD дискове, ни казва, че всъщност SSD са на кривата на закона на Мур.

Те вече бяха, струва ми се, около три или четири пъти по-бързи от въртящия се диск, но сега те ще стават доста по-бързи на всеки 18 месеца. Удвоена скорост и 10 пъти по-бърза до около шест години. Ако обаче това беше само това, това не е, както ще ви кажа след малко. Развиващият се диск разбира се се превръща в архивиращо средство.

Относно паметта. Първи неща първо, RAM. Съотношението на процесора между RAM на процесор непрекъснато се увеличава. И това, разбира се, по някакъв начин осигурява ужасно много по-голяма скорост, защото декарите памет, които можете да имате сега, могат да съхраняват много повече. Това, което всъщност прави, е, че намалява налягането върху приложения от типа на MLTP или случайно четени приложения, защото е по-лесно да ги обслужвате, защото сега имате много памет и по този начин можете да кеширате всичко, което е вероятно ще бъде прочетена в паметта. Но се сблъсквате с проблеми с по-голяма грамада от данни, така че големите данни всъщност не са толкова прости, всъщност.

И тогава имаме Intel с 3D Xpoint, а IBM с това, което наричат PCM, което е фаза с промяна на паметта, доставят нещо, което според тях е - е, поне 10 пъти по-бързо от сегашните SSD дискове и те вярват, че ще се получи много близо до същата скорост като RAM. И разбира се е по-евтино. И преди това имахте тази структура на базата данни на процесора, паметта и диска, а сега се движим към структура, която има четири слоя. Има CPU, памет или RAM, а след това този тип по-бърза от SSD памет, която всъщност е нестабилна и след това SSD. И тези нови технологии са нестабилни.

И има метристор на HP, който все още не е, знаете, защото той беше обявен преди около седем години, но все още не се появи. Но слуховете, които чувам, са, че HP ще промени играта малко и с мемстир, така че имате просто нова ситуация с паметта. Това не е, че имаме по-бързи неща, това е все едно имаме нов слой. И тогава ние имаме факта, че SSD достъп, можете да го прочетете паралелно. Не можете да четете въртящ се диск паралелно, освен ако имате много различни въртящи се дискове. Но блок от SSD, всъщност можете да четете паралелно. И тъй като можете да прочетете това паралелно, той върви далеч по-бързо от неговите прости скорости на четене, ако всъщност настроите множество процеси в различните процеси в един процесор и просто разполагате с него със SSD.

Смята се, че можете да достигнете почти до скоростите на RAM, като направите това. И всичко, което това говори е, бъдещето на архитектурата на паметта не е ясно. Искам да кажа, реалността е, че различните доминиращи доставчици, които и да се окажат, вероятно ще определят посоката на хардуера. Но никой не знае къде отива в този момент. Разговарял съм с някои инженери на бази данни, които казват: „Не се страхувам от случващото се“, но те не знаят как да го оптимизират от първа стъпка. И ти винаги си го направил, така че това е интересно.

И тогава има процесор. Е, многоядрените процесори не бяха само многоядрени процесори. Имаме и значителни обеми от кеш на L1, L2 и L3, по-специално L3, което е до, не знам, десетки мегабайти. Можете да поставите много там, знаете. Ето защо можете да използвате чипа като средство за кеширане. Това промени играта. И със сигурност, векторната обработка и компресирането на данни, редица доставчици всъщност са направили това, влачат тези неща в процесора, за да вървят много по-бързо в процесора. Тогава получавате факта, че добре, процесорите с графични процесори наистина са добри в ускоряването на аналитиката. И наистина са много добри в определени видове заявки, просто зависи от това какво е вашето запитване.

Можете или да създавате дъски с процесори и графични процесори, или както AMD прави в момента, вие произвеждате нещо, наречено APU, което е вид брак на процесор и графичен процесор; има и два вида способности по него. Това е различен вид процесор. И тогава неотдавнашното съобщение на Intel, че ще поставят FPGA на чипа, това ми направи главата. Аз си мислех: „Как така, това ще стане?“ Защото, ако имате възможност за процесор, графичен процесор и имате възможност за процесор, FPGA - и между другото, ако наистина искате, на същата платка бихте могли да поставите процесор, и графичен процесор, и FPGA. Нямам идея как всъщност бихте управлявали каквото и да е по този начин, но знам за компании, които правят такива неща и получават много, много бързи отговори на заявки. Това не е нещо, което ще бъде пренебрегнато, това е нещо, което ще бъде използвано от утвърдените доставчици и може би от новите доставчици, които се появяват. СУБД винаги са били паралелни, но сега паралелните възможности току-що избухнаха, защото това ви позволява да паралелизирате това с това, с това, с това по различни начини.

И накрая, да мащабирам или мащабирам? Мащабирането е наистина най-доброто решение, но за едно. Получавате далеч по-добра производителност на възлите, ако можете просто да оптимизирате производителността на процесора и паметта на диска в един възел. И ще използвате по-малко възли, така че ще е по-евтино, нали? И ще бъде по-лесно да се управлява. За съжаление това е дизайн, зависим от хардуера, и с промяна на хардуера става все по-малко възможно да се направи това, освен ако вашите инженери няма да могат да работят толкова бързо, колкото хардуерът се променя. И вие получавате проблеми с натоварването, защото когато увеличавате мащаба си, правите различни предположения за това какво натоварване ще прави.

Ако мащабирате, тоест, ако вашата архитектура набляга на мащаба преди мащабирането нагоре - всъщност трябва да ги направите и двете, просто ще подчертаете едното. Тогава ще получите по-добра производителност на мрежата, защото архитектурата ще се справи с нея. В хардуерно отношение ще бъде по-скъпо, защото ще има повече възли, но ще има по-малко проблеми с натоварването и ще има по-гъвкав дизайн.

И аз просто мислех, че ще вкарам това, защото ако всъщност мислите за всички хардуерни промени, аз просто насочих пръста си към, а след това се замислихте, как ще мащабирате и мащабирате тези неща? Тогава осъзнавате, че инженерите на бази данни според мен са поне недостатъчно платени. Така че, ако просто обмисляте хардуерния слой, предизвикателствата пред базата данни са ясни. Сега предавам това на Берт, който ще ни накара всички да се чувстваме образовани.

Ерик Кавана: Това е! Бърт?

Берт Скалцо: Много ви благодаря. Нека просто вляза направо в тези слайдове. Имам много слайдове, през които да премина, така че на доста от тях може да отида доста бързо. Ще говорим за този „Напред инерция: Преместване на релационното отвъд традиционното.“ Вече не е база данни на баща ви. Нещата се промениха и както каза по-рано говорител, през последните шест до седем години пейзажът се промени коренно.

Аз самият се занимавам с бази данни от средата на 80-те. Писал съм книги за Oracle, SQL Server, сравнителен анализ и доста други неща. „Светът се променя много бързо. Големите вече няма да бият малки. Това ще бъде бързото побеждаване на бавния. ”Добавих„ за адаптиране ”. Това беше от Рупърт Мърдок. Наистина вярвам, че това ще бъде истина. Няма да можете да правите неща с база данни, както преди 10, 15, 20 години. Ще трябва да го направите по начина, по който бизнесът го иска сега.

Ще се опитам да остана малко общ в това, което представям, но повечето функции, за които говоря, ще намерите в Oracle, ще намерите в SQL Server, MySQL, MariaDB и някои от другите големи плейъри. Революцията на релационната база данни, аз отново съм съгласен с по-ранните говорители. Ако погледнете точно около 2010 г., преминахме от червената състезателна кола към жълтата състезателна кола. Имаше значителна промяна и ела 2020 г., вярвам, че ще видите друга радикална промяна. Намираме се в много интересно време.

Сега този слайд е ключов, затова поставих ключ горе. Там се случва цялата тази промяна и от лявата страна имам технологии, а от дясната страна имам бизнес. И въпросът е кой причинява кой и кой подкрепя кой? Ние имаме всички тези хардуерни промени: слизане на дискове, увеличаване на размера на дисковете, нови видове дискове, така че това беше обхванато от по-ранните говорители. Отпадането на цената на паметта, всички тези по-нови версии на бази данни. Но от дясната страна имаме защита и спазване на данните, съхранение на данни, бизнес разузнаване, анализи, задължително съхраняване на данни. И двете страни на уравнението са движещи се и двете страни на уравнението ще се възползват от всички тези нови функции.

На първо място, ние имаме нашия типичен въртящ се диск SAS, те вече са до 10 терабайта. Ако не сте виждали, Western Digital, HGST разполага с това, което наричат хелиевото си устройство, което достига до около 10 терабайта в момента. Разходите за предене на диск стават доста ниски. Както бе споменато по-рано, можете да получите твърдотелни дискове до около два терабайта, но Samsung има 20-терабайтно устройство, което идва скоро. Разходите стават разумни. Едно нещо, което ще говоря за другите, не е, концепцията за флаш дискове. PCIe, това е PCI Express, в сравнение с NVMe, може и да не сте чували за този неелатилен експрес в паметта. По принцип NVMe ще бъде заместител на SAS и SATA и наистина е по-скоро протокол за комуникация, отколкото всичко друго. Но тези дискове вече са до около три терабайта.

Може би сте виждали също така, че някои SAS дискове сега се предлагат с U.2 конектори, което е нещо като различен конектор от SAS или SATA, който поддържа NVMe със стандартен диск - дискът, разбира се, трябва да го поддържа. И след това SATA с M.2 конектори и тези започват да получават NVMe. Всъщност има продавачи на преносими компютри, които сега продават тетрадки, които имат в себе си NVMe флаш диск и тези неща ще крещят в сравнение с технологията, която сте използвали преди.

Много хора не знаят какви са всички тези различни проблясъци. Ако погледнете в долния десен ъгъл, това е пример за M.2. Може да кажете: „Ами, май, много прилича на mSATA устройството вляво от него.“ Но както виждате, има две пропуски в щифтовете, за разлика от едната и е малко по-голяма. И също така, M.2 може да се предлага в три различни размера.

И след това PCI Express светкавица и NVMe светкавица. Сега, NVMe светкавицата също е PCI Express, но PCI Express обикновено все още е алгоритъм на контролера от тип SAS или SATA, който е написан за въртящ се диск, а NVMe са алгоритмите или техниките, които са написани специално за флаш. И отново, вие ще видите всички тези.

NVMe предлага доста неща. Мисля, че двете най-големи подобрения са, горе в горния десен ъгъл, латентността е намалена с цели 70 процента. Всъщност съм виждал дори по-високо от това. Освен това, ако погледнете в долния десен ъгъл, когато операционната ви система говори с NVMe диска, тя преминава през много по-малко нива на софтуер. По принцип преминавате през драйвера на NVMe, който сега е включен в операционната система и той говори директно с медиите. Има много причини, поради които тази технология ще промени коренно света на базата данни.

И много пъти хората ще кажат: „Е, колко бърза е NVMe?“ Знаете, старите добри времена, през 2004 г. и преди, се вълнувахме, ако разполагахме с Ultra-320 SCSI, 300 мегабайта в секунда. Днешните скорости, голяма част от вас вероятно са на фибри или InfiniBand, а такива са най-добрите. NVMe там отдясно, започва там, където свършват сегашните технологии. Това, с което се захващам, е, че PCI Express 3.0 с осем-лентова връзка започва от почти 8000 и ще тръгне нагоре, тъй като получаваме по-нови версии на PCI Express, четири версии и така нататък. NVMe няма къде да отиде, освен нагоре.

Сега, какви са някои неща, които се променят в базата данни? Сега в горните десни ъгли на моите слайдове изложих бизнес причините, според които се появи технологията. В този случай, поради съхранение на данни и поради регулаторни причини за задължително запазване на данни, базите данни започват да предлагат компресия в тях. Сега някои бази данни предлагат компресия като добавка, други я предлагат като вградена в стандартната, да кажем корпоративно издание на тяхната база данни, и все пак някои бази данни, като например в Oracle, могат дори да имат още по-добра версия на компресия, която е в, да речем, тяхната платформа Exadata, така че всъщност са изградили хардуер, който може да поддържа много специализирана компресия и този в Exadata, например, получава 40x степен на компресия и затова е много значим. И мисля, че това е задължителното запазване на данни, хората просто искат данни по-дълго. Бизнесът, за да правят анализи и BI се нуждаят от последните 5, 10, 15 години данни.

Сега още една функция, която започна да се показва точно през този период 2008, 2009, беше разделянето. Отново ще намерите това в бази данни като Oracle, SQL Server и в двете, които трябва да платите за него. В Oracle трябва да закупите опцията за дял, а в SQL Server трябва да сте в изданието на центъра за данни. Това е вашата традиционна техника за разделяне и завладяване и това, което правите е, че имате концепцията за логическа голяма маса в горната част там и когато тя се пусне на диск, тя всъщност се разделя на кофи. И можете да видите, че тези кофи са организирани по някакви критерии за разделяне, обикновено се отнасят или се наричат вашата функция на дял и след това също можете да подразделяте в някои платформи на базата данни и можете да отидете още по-далеч.

Отново мисля, че както съхранението на данни, така и задължителното задържане на данни са изтласкали това и в някои от тези бази данни можете да имате до 64 000 дяла, а аз вярвам в някои други бази данни дори до 64 000 под-дяла. Това ви позволява да разбиете данните си на управляеми парчета. Вие също ще разделите индексите; това е опция, не е нужно, но можете да разделите и вашите индекси. Една от причините за това може да е, че имате плъзгащ се прозорец с данни. Искате да запазите данни от 10 години, но за да изпуснете индексите, за да стартирате тази вечер пакетно зареждане, не искате да изпускате индексите на всеки един ред, само на редовете, които са в текущата група. Разделянето всъщност е много добър административен инструмент, въпреки че повечето хора смятат, че голямата му полза е да се премахне елиминирането на дялове във вашите планове и следователно да ускорите вашите заявки. Това наистина е вид череша на тортата.

Вероятно сте чували за затягане и вероятно си мислите: „Е, защо поставихте този слайд тук?“ Това е една от тези NoSQL - това е една от тези среди от типа Hadoop. Oracle 12c пусна два, което все още не е G8, но което се показва или визуализира, всъщност има изостряне. Ще имате традиционна система от бази данни като Oracle и ще можете да разделяте, както при модела Hadoop, и така ще имате друга техника за разделяне и завладяване, която ще раздели вашата таблица по ред в групиране по възел и това ще бъде - точно като това, което виждате в някои от вашите бази данни NoSQL. И всъщност MySQL, всъщност можете да постигнете това почти с помощта на една от техните техники за клъстеринг, но той стига до традиционната база данни и предполагам, че Microsoft няма да иска да остане назад. Тези двама играят скачаща жаба помежду си през цялото време, така че бих очаквал да видя изостряне в може би следващата версия на SQL Server.

Управление на жизнения цикъл на данните, отново задължително запазване на данни, но също така и за бизнес разузнаване и анализи. Наистина това е техника за разделяне и завладяване и обикновено DBA правят това ръчно и това е: „Ще запазя данните за тази година на бързи дискове, миналогодишните данни за малко по-бавни дискове, може би ще продължа да запазя последните две години преди това на още по-бавни дискове и тогава ще имам някакъв архивен метод. ”Обикновено той вече не е записан на лента, обикновено е - имате някакво прикачено към мрежата място за съхранение или устройство, което има много на съхранение и е, знаете ли, е рентабилно, но все още върти диск.

И така сега можете всъщност - и в Oracle, и на SQL Server - можете да закупите опция, при която определяте правилата и това просто се случва автоматично на заден план. Не е нужно повече да пишете скриптове, не е нужно да правите нищо. И ако сте виждали SQL Server 2016, който току-що излезе първи юни, има нова функция, наречена „Stretch Databases“, която по принцип ви позволява да правите - в долния десен ъгъл там - можете да се местите от множество слоеве директно в облака и отново това е функция, която е вградена в базата данни, просто кажете нещо от рода на: „Ако данните са на повече от 365 дни, моля, преместете ги в облака и, знаете ли, направете го автоматично за мен.“

Това ще бъде наистина готина функция, всъщност аз мисля, че може би ще бъде това, което ще видим в бъдеще, което е, че ще имате хибридни бази данни, където ще запазите някои локални а някои в облака. Преди това хората си мислеха: „О, аз или ще направя на място, или ще направя в облака.“ Сега виждаме брака на двете технологии по този хибриден начин. Мисля, че това ще бъде доста голямо и Microsoft стигна първо там.

Реакция, това се дължи на защита и спазване на данните. Сега в старите добри времена може да сме казали: „Ей, разработчика на приложения, когато показвате това в отчета, когато показвате това на екрана, ето някои неща за сигурността, които трябва да проверите и, моля, знаете, да показвате само данните те трябва да виждат или маскират или редактират данните, които те не трябва да виждат. "Е, както обикновено, когато го изтласкате към приложението, това не се прави на едно място, така че става по различен начин или не На някои места няма да свърша. И така сега всъщност имате тази възможност във вашите системи от бази данни.

Сега в SQL Server 2016 тази функция е вградена, така че все още не е задължителна позиция за разходите, която да бъде добавена в центъра за данни; и в Oracle 12 трябва да закупите тяхната добавка за управление на жизнения цикъл, но това е нещо ново и отново се ръководи от бизнеса. И най-вече защото съхранявате толкова много данни сега и правите извличане на данни, така че BI и анализите, трябва да знаете кой има достъп до какви данни и да се уверите, че те могат да виждат само какво имат право да виждат

По същия начин, погледнете отново това, защитата на данните и спазването. Ще откриете, че много от системите за бази данни сега изграждат компресия или съжалявам, криптиране директно в базата данни и какво е важно за това криптиране, ако погледнете стрелката надолу и стрелката нагоре на диаграмата, в която я пише надолу до криптиран диск и след това той го чете обратно в паметта и го дешифрира. Това всъщност е един модел, има друг модел, който бихте знаете, че всъщност го правите само когато съобщава тези данни в мрежата на действителното клиентско приложение.

В този случай дори на сървъра на базата данни в паметта може да бъде криптиран и дешифриран само когато бъде изпратен към клиентското приложение. Тук има два различни модела и ще ги намерите в базите данни, а всъщност една от базите данни, която току-що добави това беше MariaDB в тяхната версия 10.X; Вярвам, че сега са на 10.1 или 10.2. И всъщност направих някои сравнителни показатели за това криптиране и за да получа това криптиране, аз само изпитах около 8 процента намаление на пропускателната способност или скоростта. При тест за сравнителен анализ криптирането не предизвика толкова много и затова е много полезна функция.

Сега споменахме по-рано за флаш паметта и SSD дискове и подобни неща. Една от функциите, които имате в Oracle и SQL Server, които много хора не осъзнават, е, че можете да вземете флаш или SSD, който е на вашия сървър на базата данни, и можете да кажете на базата данни: „Използвайте това, сякаш са памет. Отнасяйте се към оперативната памет като преференциална, но се преструвайте, че това е бавна памет и я използвайте като разширен кеш. ”Сега в SQL Server 2014 това излезе и беше наречено“ Buffer Pool Extension ”- безплатно е. В Oracle той излезе в 11g R2 и беше наречен „Database Flash Cache“ и там също беше безплатен.

Моят съвет обаче е да тествате внимателно тази функция. Всеки път, когато увеличите кеша, когато отидете да направите търсене, това отнема повече време. Ако сложите три терабайт флаш карта и кажете на базата данни „Добавете това към паметта си“, всъщност може да откриете, че нещо се е забавило поради времето, в което да погледнете и да видите дали е на светкавица, мръсно ли е или чиста? Има точка на намаляваща възвръщаемост. Моят съвет е отново тест драйв това, вижте какво работи за вас, но отново, той е във вашата база данни и в случай на Oracle, както в SQL Server, така и в Oracle, той е там от няколко години.

И тогава това ни отвежда до дядото, който беше базите данни в паметта и това е, защото цените на базата данни паднаха. Другата причина, поради която вероятно бихте си помислили, че това е станало, е голяма част от анализите, които изискват данните да са много бързо достъпни и затова тя трябва да бъде в паметта. Имайте предвид, че алгоритмите, които базите данни използват за достъп до тези данни, за компресиране, за криптиране, за съхраняване, знаете, че в някои случаи някои бази данни могат да продължат да съхраняват в паметта като ред.

В някои случаи някои бази данни могат да разбият това на колона, ориентирана и причината да направят това е, че получават много по-високо ниво на компресия, някъде около 11 до 12X, като го съхраняват в ред колони спрямо ред на реда. Това за пръв път се появи в SQL Server 2014, беше наречено „Хекатон“. Коренно се увеличава през SQL Server 2016, те ще го видят с позоваване на някои различни имена и той излезе в Oracle 12c; Казвам второто издание тук, а не R2. Имаше две различни версии на Oracle 12c, 12.1.0.1 и 12.1.0.2. Това е второто издание на R1 версията на базата данни.

И начинът, по който го дефинирате, обектът в паметта е подобен и в двете бази данни. Тук можете да видите в десния горен ъгъл, аз създавам SQL Server и можете да го видите, че с оптимизирана памет и трайност е само схема. Няма да преразглеждам всички тези значения на синтаксиса, а в Oracle всъщност е още по-просто, просто променяте таблица и казвате в памет или не и можете да промените това. Мога да кажа, че днес е в паметта, а утре не е и затова е много гъвкава.

Направих някои тестове на Oracle с таблици в паметта, имах няколко теста, които отнеха почти 40 минути, до горния ред. Важното е, че когато стигна до долните два реда, бях увеличил времето на изпълнение или го намалих, трябва да кажа, приблизително до пет минути и когато погледнах коефициента на компресия, данните в паметта всъщност бяха 3.6 до 4, 6 пъти по-малък. Това е важно, защото в този случай използвах ориентиран към колона формат и това е компресия. И така познайте какво? Всъщност вписвах почти четири до пет пъти повече данни в паметта си. Не само получих предимството на вградената памет, предимството на ориентацията на колоните, но и предимството на далеч повече данни - до пет пъти повече данни в кеша на паметта, така че това е доста мощна техника. Отново Oracle и SQL Server, които искате да разгледате, те са наистина страхотни функции. И с това, мисля, че ще го отворя за въпроси.

Ерик Кавана: Ами Берт, на първо място си бил много безкористен в цялото това прекрасно образование. Бихте ли поговорили само за минута какво правите? Защото имате известна технология, която може да улесни това, за което сте говорили. Просто поговорете за минута за това, което правите, и тогава нека оставим Дез и Робин в уравнението тук.

Берт Скалцо: Да, работя за компания, наречена IDERA. Ние сме в Тексас, със седалище в Хюстън, а аз всъщност седя в момента в Остин, но съм със седалище в Далас. Ние правим инструменти за база данни и правим инструменти за база данни, за да ви помогнем да решите проблеми. Този проблем може да бъде нещо толкова просто, колкото производителността. В този случай имаме инструмент, наречен DBArtisan, който ви позволява да извършвате административни задачи на вашата база данни и това е един инструмент, който ви позволява да управлявате 12 различни платформи за бази данни. Мога да управлявам SQL Server, мога да управлявам Oracle, мога да управлявам MySQL, DB2, Postgres и използвам един инструмент, един изпълним файл, един GUI дизайн и един последователен набор от работни процеси. Ние също така правим инструменти за спазване на изискванията, имаме инструмент, наречен SQL Compliance Manager, който да ви помогне да удовлетворите вашите нужди за съответствие. Друг инструмент, наречен SQL Security, затова се опитваме да направим инструментите, които ще ви помогнат да бъдете ефективни и ефикасни, и какво наистина е хубаво, ако отидете на нашия уебсайт, ние имаме цял куп безплатни файлове там, така че ако нищо друго, отидете да изтеглите - Мисля, че имаме около 20 или 25 автостради. Има някои наистина добри безплатни неща, като например SQL Server и помощна проверка на Windows, които просто ще разгледат какво имаш и ще ти кажа дали имаш проблеми или неща и това е напълно безплатно.

Ерик Кавана: И ти наистина си …

Bert Scalzo: Определено първите неща -

Ерик Кавана: Говорите за хетерогенността на пазара днес, имаше някакво уравнение с един размер за всички, което всъщност си спомням, че интервюирах д-р Майкъл Стоунбракър още през 2005 г., когато той продължи голям тласък да говорим за присъда за движението на базата данни, ориентирано към колоната, и той говореше за това как релационният модел с един размер отговаря на всички доминира в продължение на много години, и той предвиждаше, че всичко това ще се промени, и момче беше прав за че. Сега имаме тази наистина разнообразна и интересна среда с много различни опции и възможности, но имате нужда от някой, който да управлява всичко това и ми се струва, че вашата компания е съсредоточена доста остро върху решаването на математически проблеми, като по този начин е активист на заглавка на хетерогенност, нали?

Берт Скалцо: Абсолютно. Искам да кажа, че винаги ще има DBA, които казват: „Не искам да използвам GUI инструмент, правя всичко със скриптове“, знаете ли? Те смятат, че са супермен тип DBA и това е добре, но за повечето от нас, ние искаме просто да свършим работа и - знаете, аз използвам Microsoft Word за писане на документите си. Използвам Microsoft Outlook, за да правя имейла си. Искам да кажа, че имам инструменти за изпълнение на задачи. Ние изграждаме същия тип концепция, създаваме инструменти за администратори на бази данни и разработчици, за да им помогнем да се съсредоточат върху това, което искат да правят, а не върху това как трябва да го правят.

Ерик Кавана: Това има смисъл, но позволете ми да ви предам нашите експерти и хората се чувстват свободни да се гмуркат. Имаме няколко коментара, идващи от публиката. Може би, Дез, няколко въпроса и Робин няколко въпроса?

Дез Бланчфийлд: Разбира се. Един от първите въпроси, които искам да ви хвърля, предвид огромния период от опит, който имате, виждате ли скоро момент, когато някой от това ще се забави? Или мислите, че наистина сме точно на входната точка на тази непрекъсната линия на растеж на промяна? Мисля, че един от най-големите проблеми, с които се сблъскват компаниите, а след това неизменно хората, които се опитват да подкрепят технологията, предоставяна на тези компании да управляват бизнеса си, е, че скоростта на промените е толкова драматична, че просто не могат да бъдат в крак с всички различните функции, и софтуер, и системи, и рамки, и архитектури, и нов код, и след това хардуерът под него, виждате ли, че текущата скорост на промяна изобщо се забавя? Искам да кажа, че се занимавате с толкова широка гама от платформи с целия пакет IDERA, скоро ли ще забавим скоростта или ще се подредим на този луд бягство от товарен влак още?

Берт Скалцо: Мисля, че сме на първите 20 процента от тази крива на растеж и трябва да извървим дълъг път и има две неща, които го тласкат. Технологията продължава да се развива. Споменахте някои от новите типове памет, които предстои да излязат, това ще бъде фантастично. Samsung скоро ще има 20-терабайтна флаш памет тук реално скоро. Това ще промени нещата. Имаме всички тези NoSQL и облачни бази данни, това просто ще продължи. Единственото нещо, което е доста смешно е, когато гледам бази данни като Oracle и SQL Server и някои от другите, те вече не са релационни бази данни. Мога да поставя неструктурирани данни в Oracle и все пак да поддържам съответствие с ACID. Ако бихте ми казали това преди 20 години, просто бих казал, че сте на наркотици.

Дез Бланчфийлд: Да, да, готини са. Ами дори сега тези двигатели, които имат доста приятни нишови вертикали като GIS, просто по-добри от сегашните възможности. Направихте няколко страхотни коментара относно предизвикателствата, пред които са изпратени DBA, и различните времена на DBA, които се надяваме да видим около мястото, но как изглежда светът с вида на този слой от бизнеса, с който се занимавате? Искам да кажа, това са хората, които използват различните платформи от вашия диагностичен мениджър, до инструментите за инвентаризация и чак до следващия до дефрагментирането, как DBA се справят с тази промяна и как те са нещо - знаете ли, какво правят с вашите инструменти, за да се справят с тази значителна промяна в техния пейзаж?

Bert Scalzo: Е, аз ще се върна преди почти 20 години, тогава ще кажа, че DBA решават много специфична роля в дадена организация. Обикновено работят с една платформа на базата данни, може би две, и те управляват сравнително малък брой бази данни. Сега напред напред към днес и администратора на базата данни, той всъщност ще познава 10 платформи за бази данни. Той управлява и това не е шега, в някои случаи хиляди бази данни; това е повече за света на SQL Server или MySQL. Но все пак в света на Oracle те биха могли да управляват стотици бази данни. И така те изваждат всички тези нови функции, имат всички тези нови платформи и имат всички тези бази данни, за които отговарят. Те търсят инструменти, които да позволят тяхната производителност, а също и да им помогнат да научат някои неща.

И ще ви дам пример - ако искам да разделям таблица, това е доста неясен синтаксис и ако искам да го подразделям, синтаксисът става още по-труден. Знам какво искам да правя, искам да създавам кофи. Ако имам инструмент като DBArtisan, който казва: „Ей, ето хубав екран, който ви позволява да се концентрирате върху това, което се опитвате да направите, а не върху това, как се опитвате да го направите, и, между другото, натиснете Покажете SQL бутона, когато сте готови и ние ще ви покажем какъв е бил SQL, за да можете да започнете да научавате и овладявате това. “

DBA установяват, че инструменти, които им помагат да свършат работата, но също така помагат да ги научат на всички тези нови неща, които използват и същото би било вярно - да кажем, че съм човек от Oracle и отивам в MySQL и казвам, „Добре, създайте база данни, DBArtisan. Сега ми покажете SQL, защото се чудя какво е да създадете база данни в MySQL и току-що се научих да синтаксисам. “И така ние не само им помагаме да работят в базата данни, но и ги обучаваме в базата данни.

Дез Бланшфийлд: Става още по-интересно, когато се качите на някои от по-модерните - или не по-модерни, това не е честно нещо да се каже - но веднъж базата данни е база данни. Днес виждам всичко, за което говорите там, с добавеното предизвикателство, че технологията се трупа, която традиционно виждаме от доставчиците, и вие като вид отворен код в нея, както и че те са добри. Не само се занимавайте с двигателите на базата данни и езиците на заявките, но те се занимават и с типовете данни, структурираните и неструктурирани, знаете ли, предизвикателството да се справите с всичко от далечния край на спектъра на мултипетабайт HDFS среда за малки миниатюрни контейнери и пакетни файлове и различни формати на файловете.

И мисля, че това е нещо, което сега виждаме къде просто няма човешко същество, без значение колко супермен, супер жена, каквото и да мислят за тях, те физически, те просто не могат психически да се справят с тази скорост на промяна и мащаба на вариациите. Мисля, че наборът от инструменти, които предлагате сега, ще стигне до момент, в който те почти ще бъдат по подразбиране от много начини, така че да не можем да стартираме средата на базата данни, която получихме без тях, защото просто физически не може да хвърли толкова много тела към тях. Много ми хареса вашето представяне. Ще премина при д-р Робин Блур, сигурен съм, че има и много въпроси, които да ви хвърли.

Робин Блур: Добре. Ами със сигурност имам въпроси. Берт, не знам накъде отиваш - имах наистина интересен разговор преди няколко дни, когато някой започна да ми разказва за най-новата защита на данните на DU и ми се стори от това, което казваха, че е невероятно драконов по отношение на нещата, на които са настоявали. Чудех се дали всъщност сте гледали това; нещо познато ли си?

Берт Скалцо: Абсолютно. Да.

Robin Bloor: 2016, Добре, разкажете ни за това.

Берт Скалцо: И аз всъщност …

Robin Bloor: Дълбоко интересно.

Берт Скалцо: Всъщност работих известно време за доставчик на флаш в областта на тяхната база данни, помагайки им да изграждат флаш продукти за бази данни и мога да ви кажа, че драконианецът върви надолу. Това, което искам да кажа е, че ако си спомняте моя един слайд, казах в някои бази данни, че ще извърши криптирането, но го вкарва в паметта на сървъра, а в някои бази данни криптирането - все още е криптирано в паметта на сървъра, той се декриптира само когато тя се изпраща до клиента. Е, това, което също ще намерите, е някои от тези правителствени стандарти, особено Министерството на отбраната или военните тук в САЩ, те също стигат до нивото на флаш и искат да знаят не само, че поддържате криптиране и декриптиране в вашия хардуер, но че ако някой открадне чиповете, които - знаете, извади ги от нещата от вашия сървър, че това, което има, е криптирано и така, въпреки че имат хранилището, не може да бъде и те биха чак до действителното - не до самата флаш част, а до отделните чипове. Искаха да знаят този чип по чип, всичко беше криптирано.

Robin Bloor: Леле. Искам да кажа, че има много неща, които - знаете ли, мисля, че сте измислили за това само един или два слайда, но това беше нещо, сценарий, който според мен е наистина интересен. Редактирането на информация, например, трябва да бъде малко по-умно, отколкото просто да маскирате различни области, защото особено с машинно обучение в наши дни можете да правите дедуктивни неща, които ви позволяват да извеждате на повърхността информация, която преди не сте могли да обработвате.

Ако се опитвате да защитите, да речем здравна информация, тогава това са много, много драконични правила в САЩ по отношение на здравната информация, но всъщност можете, използвайки различни техники за машинно обучение, често можете да разберете кой е нечия медицинска информация всъщност е. Просто се зачудих дали имате нещо да кажете по въпроса, защото всички те смятат, че това е интересна област.

Берт Скалцо: Да, абсолютно, и аз просто използвам това като пример, не се опитвам да кажа, че една база данни е по-добра от друга, но това е много добър пример за това, което току-що поискахте. В Oracle, ако не ми бъде позволено да виждам ред данни например, като не ми е позволено да виждам медицинския запис на Джон Смит. В Oracle, ако кажа: „Изберете този запис“, ще бъда блокиран или ще ми бъде позволено да вижда това, което ми е позволено и той ще бъде редактиран. И ако кажа: „Изберете звездата на акаунта от таблицата, която е равна на Джон Смит“, ще получа нула.

В SQL Server той може да направи редакция, но има някои дупки. Ако кажа: „Изберете звездата на профила от таблицата, където тя се равнява на Джон Смит“, всъщност ще си върна една, така че знам, че има Джон Смит. Единият е по-сигурен от другия. Сега очаквам те да поправят това, те винаги играят скок жаба помежду си. И отново, не се опитвам да разграничавам базите данни, освен да покажа пример - вижте за какво говорим сега, нещо толкова просто като акаунта за избор трябва да бъде съкратено и от редакцията, въпреки че технически говорейки, няма нищо редактирано освен съществуването на реда.

Робин Блур: Да, така е. Това е интересно. Искам да кажа, че друг общ въпрос, тъй като нямам много време, е наистина свързан с подобренията. Искам да кажа, че сте били в един, където знам, че ни показвате примери за различни резултати от тестове, които сте пуснали - мислите ли, че традиционните бази данни, нека ги наречем доминиращите бази данни, SQL Server и Oracle, нали? мисля, че те ще останат пред завършването? Или мислите, че всъщност ще бъдат хванати от едни или други различни видове прекъсвания на пазара, които наистина работят за тях? Какво е вашето мнение?

Берт Скалцо: Имам мнение и това е - знаете ли, пак ще кажа, че това е моето мнение - Microsoft например в ерата след Балмер просто впечатлява живия ад от мен. Искам да кажа, че тази разтегателна база данни ще получи SQL Server на Linux, преодоляване на .NET над Linux, PowerShell над Linux; Не мисля, че традиционните доставчици на база данни няма да останат назад. Мисля, че са решили: „Ей, нека новите момчета, стартъпите да определят нещо. Нека да разберат какво е изострянето и как трябва да се усъвършенства, и след като направят всички изследвания и разработки, ние знаем точно какво искат потребителите, сега нека добавим изостряне към Oracle. “Мисля, че те просто стават умни и казвайки: „Хей, да си втори или трети не е лошо, когато си доминиращ играч, защото тогава хората няма да мигрират от теб.“

Робин Блур: Да, искам да кажа, че това е използвана стратегия. Искам да кажа, че IBM правеше това и цялото това - за целия им продуктов диапазон и това се оценява доста добре, докато някой не излезе с нещо, което е напълно напълно от стената, за което никой не се сеща, но не можете да планирате срещу това така или иначе.

Въпроси от публиката, Ерик?

Ерик Кавана: Да, но имаш време, мисля само за един и знам, че Берт трябва да се кандидатира. Имаше нещо тук - добре, засилващата се архитектура на Oracle 12c е, че индикация за - или какво е това показание според вас, какво мислите, че се случва там?

Bert Scalzo: Е, Oracle поглъща или предлага всичко, което са всички други доставчици на база данни. Например, мога да поставя неструктурирани данни в Oracle. Не знам как можете да поставите неструктурирани данни и след това да го наречете релационна база данни, така че няма смисъл, но можете. И сега Oracle добавя изостряне, така че Oracle казва: „Знаеш ли какво? Каквото и пазарът иска, ние ще направим нашата база данни, защото пазарът иска това, което пазарът иска и искаме да предоставим решението, искаме те да останат с нас. "

Мисля, че ще видите допълнителни елементи. Не бих се изненадал да видя като Hadoop клъстеризиране на възли на базата данни не в стелаж на Oracle или реален клъстер на приложения, а основно в повече от традиционно клъстериране тип Hadoop, което прави това заточване. И така мисля, че ще можете да разгърнете база данни като Oracle, като Hadoop, и този вид тенденции ще продължат. Тези големи доставчици на база данни, те правят милиарди долари и не искат да губят пазара си, така че са готови да се адаптират към всичко или да приемат каквото и да било.

Ерик Кавана: Е, знаете, смешно е, защото следя доставчиците с отворен код от доста време и се чудех на всичко това, макар колко голямо влияние ще има той върху традиционната технология със затворени врати и за известно време със сигурност чувствах, че продавачите с отворен код правят някои сериозни крачки и сега, като гледам пазара виждам вид на това, което казваш, че големите момчета са си направили математика, са заточили моливите си и са разбрали как те могат да тъкат много от тези неща в своите архитектури. Независимо дали става въпрос за IBM, или Oracle, или SAP - току-що бях на конференцията SapphireNow миналия месец и Стив Лукас, който ръководи половината от тази компания, се похвали, че SAP сега е включен в облачната си платформа HANA, повече компоненти с отворен код от всеки от техните конкуренти. Ако се занимавате с математика в това, това е доста впечатляващо твърдение и ми казва, че големите момчета не отиват никъде в скоро време.

Берт Скалцо: Не, бих заложил парите си и на двете. Искам да кажа, че ако погледнете, акциите на Microsoft наскоро бяха около $ 50 и, знаете, само преди няколко години беше на 25. Не удвоявате цената на акциите си за кратък период, освен ако не правите добри неща и знайте, че от правенето на всичко от Windows 10, която е безплатна за първата година, и всички останали умни неща, които правят, тази функция на базата на разтягане мисля, че е просто феноменална. Мисля, че това, което ще се случи е, че много хора ще се озоват в Azure, а не директно, не както казаха: „Нека мигрираме моята база данни към Azure.“ Ще мигрира там магически, защото ще бъде архивирана там, използвайки тази нова функция на базата на разтягане, така че приемането на Azure ще нарасне бързо.

Ерик Кавана: Това е една от тенденциите на пазара, която дори аз виждам, дори и на вашия Mac. Докато влизате в своя Mac, за да запазите някои документи, те сега - и по-новите Macs просто следват през облака, нали? Искам да кажа, че има много смисъл в тази стратегия и аз също я гледам и си отивам: „Добре момчета, вие се опитвате да ме примамите парче по парче в облачната си среда и тогава някой ден, когато искам да гледам някой филм, ако кредитната ми карта е изтекла, ще изпадна в затруднение. "

Берт Скалцо: Да, но го правиш във Facebook.

Ерик Кавана: Да. Вярно е.

Берт Скалцо: Вие пускате всичко във Facebook.

Ерик Кавана: Е, не съвсем всичко.

Берт Скалцо: Не, искам да кажа …

Ерик Кавана: Да, давай.

Берт Скалцо: Тези социални тенденции достигат до бизнеса. Сега фирмите все още имат много други неща, които трябва да правят, но виждат тези тенденции и правят едни и същи неща. Не виждам нито Oracle, нито Microsoft да си отиват. Всъщност аз ще купувам акции и на двата всеки път, когато има потапяне.

Ерик Кавана: Да, наистина. Ами хора, отидете на idera.com, IDERA точка com. Както Берт каза, те имат цял куп безплатни неща там и това е една от новите тенденции на пазара - дайте ви няколко безплатни неща, с които да си поиграете, закачете се и след това отидете да си купите истинските неща.

Хора, това е поредната гореща технология. Благодаря за отделеното време днес, Берт, Дез, разбира се и Робин. Ще говорим с вас следващата седмица, хора, много неща се случват. Ако имате някакви идеи, не се колебайте да изпратите имейлите си наистина, . Ще говорим с вас следващия път, грижете се. Чао чао.