Q:
Каква е разликата между контролираното, неподдържаното и полу-контролираното обучение?
A:Ключовата разлика между контролираното и неподдържаното обучение в машинното обучение е използването на данни за обучение.
Контролираното обучение използва примерни данни, за да покаже как изглеждат "правилните" данни. Данните са структурирани така, че да показват изходите на дадени входове.
Алгоритъмът за машинно обучение, който класифицира плодовете, може да има снимки на плодове като ябълки, банани, грозде и портокали като вход и имената на тези плодове като изход.
Пример в реалния свят биха били байесовските филтри за спам в имейл програми. Тези филтри са обучени с примери на имейли, които се считат за спам. След това филтърът за спам може да търси определени фрази, които се появяват в имейлите, които се появяват в спам имейлите, и да ги премества в папка със спам.
Това е като да покажеш на човек как да направи нова задача. На човек, който прави въвеждане на данни, може да се покажат примери за данните във формат, който фирмата иска и след това се очаква да ги следва.
Програмите за машинно обучение с помощта на контролирано обучение повтарят много пъти с данните от обучението. Резултатите могат да бъдат впечатляващи, когато наистина стартират. Gmail спам филтърът на Google е много точен, защото има толкова много потребители, които го обучават.
Неуправляемото обучение няма данни за предварително обучение. В нашия пример за класификация на плодове, един алгоритъм може просто да покаже снимки на плодове и да им каже да ги класифицира.
Неподдържаното обучение има приложения в пазарни проучвания чрез изучаване на навици за покупка на клиенти или сигурност чрез наблюдение на хакерските модели.
Полуконтролираното обучение се опитва да заеме средно ниво чрез етикетиране на някои от данните. Например ябълката и портокалът може да бъдат етикетирани в програмата за класификация на плодовете, но бананът и гроздето не са.
Кога да използвате някой от тези алгоритми ще зависи от вида на използваните данни. Някои задачи имат стабилни модели, като измами с кредитни карти или спам съобщения. Контролираното обучение е подходящо за тези видове задачи. Мрежовите атаки са непредсказуеми, а методите за обучение без надзор или полу-надзор могат да бъдат по-подходящи.