Q:
Какво по-добре, платформа или алгоритъм за машинно обучение на AWS?
A:Днес много компании интегрират решения за машинно обучение в своя набор от инструменти за анализи, за да подобрят управлението на марката, да подобрят потребителския опит и да повишат оперативната ефективност. Моделите за машинно обучение са основният компонент на решенията за машинно обучение. Моделите се обучават с помощта на математически алгоритми и големи масиви от данни, за да се направят надеждни прогнози. Два общи примера за прогнози са (1) определяне дали набор от финансови транзакции показва измама или (2) оценка на настроенията на потребителите около даден продукт въз основа на данните, събрани от социалните медии.
Amazon SageMaker е напълно управлявана услуга, която позволява на разработчиците и учените за данни да изграждат, обучават и разгръщат модели за машинно обучение. В SageMaker можете да използвате алгоритми извън кутията или да извървите своя собствена пътека за по-персонализирано решение. И двата избора са валидни и служат еднакво добре като основа за успешно решение за машинно обучение.
(Бележка на редактора: Можете да видите други алтернативи на SageMaker тук.)
Изчерпаните алгоритми на SageMaker включват популярни, високо оптимизирани примери за класификация на изображения, обработка на естествен език и др. Пълният списък можете да намерите тук .
- Преимущества извън кутията: Тези алгоритми са предварително оптимизирани (и непрекъснато се усъвършенстват). Можете да бъдете бързо, стартирани и внедрени. Плюс това е налична автоматична настройка на хипер параметри AWS.
- Външни съображения: Непрекъснатите подобрения, споменати по-горе, може да не доведат до предсказуеми резултати, както ако имате пълен контрол върху прилагането на вашите алгоритми.
Ако тези алгоритми не са подходящи за вашия проект, имате три други варианта: (1) Amazon's Apache Spark Library, (2) персонализиран Python код (който използва TensorFLow или Apache MXNet) или (3) „донесете своето“, където сте по същество са неограничени, но ще трябва да създадете Docker изображение, за да обучите и обслужвате вашия модел (може да го направите, използвайки инструкциите тук ).
Подходът за носене на собствени ви предлага пълна свобода. Това може да се окаже привлекателно за учените с данни, които вече са изградили библиотека с персонализиран и / или патентован алгоритмичен код, който може да не е представен в текущия набор от кутии.
- Предоставете свои собствени предимства: Позволява пълен контрол върху целия тръбопровод за научни данни, заедно с използването на собствени IP.
- Вземете собствени съображения: Докеризацията е необходима за обучение и обслужване на получения модел. Включването на алгоритмични подобрения е ваша отговорност.
Независимо от избора на алгоритъм, SageMaker за AWS е подход, който си струва да се обмисли, като се има предвид колко фокус е поставен върху лекотата на използване от гледна точка на науката за данни. Ако някога сте се опитвали да мигрирате проект за машинно обучение от вашата местна среда към хостван, ще бъдете приятно изненадани от това, как го прави безпроблемният SageMaker. И ако започвате от нулата, вече сте на няколко стъпки по-близо до целта си, имайки предвид колко вече е на една ръка разстояние.