У дома тенденции Какво е q-обучение? - определение от техопедия

Какво е q-обучение? - определение от техопедия

Съдържание:

Anonim

Определение - Какво означава Q-обучение?

Q-обучение е термин за структура на алгоритми, представляваща безпроблемно моделиране на обучение. Чрез оценка на политиката и използване на стохастично моделиране, Q-обучението намира най-добрия път напред в процеса на решение на Марков.

Техопедия обяснява Q-обучение

Техническият състав на алгоритъма за Q-обучение включва агент, набор от състояния и набор от действия на държава.

Функцията Q използва тежести за различни стъпки във връзка с коефициент на отстъпка, за да оцени наградите.

Въпреки че може да изглежда проста идея, Q-обучението е от първостепенно значение при много видове модели за укрепване на обучението и задълбоченото обучение. Един от най-добрите примери е, когато дълбокото Q-обучение се използва за подпомагане на програми за машинно обучение за усвояване на стратегии за игра в различни видове видеоигри, например в Atari игри от 80-те години. Тук конволюционната невронна мрежа взема проби от игра, за да изработи стохастичен модел, който ще помогне на компютъра да знае как да играе играта по-добре във времето.

Q-обучението има богат потенциал за подпомагане на развитието на изкуствения интелект и машинното обучение.

Какво е q-обучение? - определение от техопедия