У дома тенденции Защо да стартирате ml обучение на локална машина и след това да стартирате редовно изпълнение на сървър?

Защо да стартирате ml обучение на локална машина и след това да стартирате редовно изпълнение на сървър?

Anonim

Q:

Защо да стартирате машинно обучение (ML) на локална машина и след това да стартирате редовно изпълнение на сървър?

A:

Въпросът как да структурираме проект за машинно обучение и неговите фази на обучение и тест има много общо с това как се движим през жизнения цикъл на ML и пренасяме програмата от учебна среда в производствена среда.

Една от най-простите причини да се използва горният модел за поставяне на ML обучение на локална машина и след това преместване на изпълнение към сървърна система е предимството на същественото разделение на задълженията. По принцип искате набора за обучение да бъде изолиран, така че да имате ясна картина къде започва и спира обучението и къде започва тестването. Тази статия за KDNuggets говори на принципа по груб начин, като същевременно преминава през някои от другите причини за изолиране на учебни комплекти на локална машина. Друго основно предложение за този модел е, че с комплектите за обучение и тестове на много различни архитектури никога няма да се объркате относно съвместното разпределение на влак / тест!

Друга интересна полза е свързана с киберсигурността. Експертите посочват, че ако първоначалните влакови процеси са на местна машина, не е необходимо да се свързват с интернет! Това разширява сигурността по фундаментален начин, „инкубира” процеса, докато достигне до производствения свят, където след това трябва да изградите адекватна сигурност в сървърния модел.

В допълнение, някои от тези „изолирани“ модели могат да помогнат при проблеми като дрейф на концепцията и скрити контексти - принципът на „нестационарността“ предупреждава разработчиците, че данните не „остават същите“ във времето (в зависимост от това, което се измерва) и че може да отнеме много адаптивност, за да може тестовата фаза да съответства на фаза на влака. Или в някои случаи процесите на влак и тест се смесват, създавайки объркване.

Внедряването на тестовата фаза на сървър за първи път може да улесни различни модели „черна кутия“, при които отстранявате проблема с адаптивността на данните. В някои случаи елиминира излишния процес на поставяне на поръчки за промяна на множество платформи.

Тогава също сървърната среда очевидно обслужва реално или динамични процеси, в които инженерите ще искат достъп до моделите за пренос на данни и кодове, които работят най-добре за производство в ML. Например, AWS Lambda може да бъде привлекателна опция за работа с микрофункциите на производството (или комбинация от Lambda и S3 обект за съхранение) и без свързаност (без сървър), която става невъзможна.

Това са някои от проблемите, които разработчиците могат да помислят, когато обмислят как да разделят фазите за обучение на ML от тестване и производство.

Защо да стартирате ml обучение на локална машина и след това да стартирате редовно изпълнение на сървър?