У дома развитие Какво е обучение за подсилване? - определение от техопедия

Какво е обучение за подсилване? - определение от техопедия

Съдържание:

Anonim

Определение - Какво означава Укрепване на обучението?

Укрепването на обучението в контекста на изкуствения интелект е вид динамично програмиране, което тренира алгоритми, използвайки система за възнаграждение и наказание.

Алгоритъм за учене на подсилване или агент, се учи чрез взаимодействие с неговата среда. Агентът получава награди, изпълнявайки правилно и наказания за неправилно изпълнение. Агентът се учи без намеса от човек, като увеличава максимално своята награда и свежда до минимум наказанието си.

Техопедия обяснява усилването на обучението

Укрепването на обучението е подход към машинното обучение, който е вдъхновен от бихевиористичната психология. Подобно е на това как едно дете се научава да изпълнява нова задача. Усъвършенстването на обучението контрастира с други подходи за машинно обучение с това, че алгоритъмът не е изрично казан как да изпълнява задача, но работи самостоятелно чрез проблема.

Като агент, който би могъл да бъде автомобил със самостоятелно управление или програма, играеща шах, взаимодейства със средата си, получава състояние на награда в зависимост от това как се представя, като например шофиране безопасно до местоназначението или спечелване на игра. Обратно, агентът получава наказание за неправилно изпълнение, като например излизане от пътя или проверка.

Агентът във времето взема решения, за да увеличи максимално възнаграждението си и да сведе до минимум наказанието си, като използва динамично програмиране. Предимството на този подход към изкуствения интелект е, че той позволява на AI програма да се учи без програмист, който да изрича как агент трябва да изпълни задачата.

Какво е обучение за подсилване? - определение от техопедия