Q:
Как компаниите могат да използват случайни модели на горите за прогнози?
A:Фирмите често използват произволни модели на горите, за да правят прогнози с процесите на машинно обучение. Случайната гора използва множество дървета за решения, за да направи по-цялостен анализ на даден набор от данни.
Едно дърво за решения работи на базата на разделяне на определена променлива или променливи според бинарен процес. Например, при оценяване на набори от данни, свързани с набор от автомобили или превозни средства, едно дърво за решения може да сортира и класифицира всяко отделно превозно средство по тегло, като ги разделя на тежки или леки превозни средства.
Случайната гора се основава на модела на дървото за решения и го прави по-сложен. Експертите говорят за случайни гори, които представляват „стохастична дискриминация“ или метод „стохастично гадаене“ върху данни, приложени към многоизмерни пространства. Стохастичната дискриминация обикновено е начин за подобряване на анализа на моделите данни, отвъд това, което може да направи едно единствено дърво за решения.
По принцип, произволна гора създава много индивидуални дървета за решения, работещи върху важни променливи с приложен определен набор от данни. Един от основните фактори е, че в произволна гора, наборът от данни и променливият анализ на всяко дърво на решения обикновено се припокриват. Това е важно за модела, тъй като случайният модел на гората взема средните резултати за всяко дърво с решения и ги преценява в претеглено решение. По същество анализът взема всички гласове на различни дървета на решения и изгражда консенсус за предлагане на продуктивни и логични резултати.
Един пример за продуктивното използване на произволен горски алгоритъм е достъпен на сайта на R-blogger, където писателката Тежа Кодали взема примера за определяне на качеството на виното чрез фактори като киселинност, захар, серен диоксид, рН стойност и съдържание на алкохол. Кодали обяснява как случаен горски алгоритъм използва малък случаен подмножество от функции за всяко отделно дърво и след това използва получените средни стойности.
Имайки това предвид, предприятията, които искат да използват алгоритми за обучение на горски машини за предсказуемо моделиране, първо ще изолират прогнозните данни, които трябва да бъдат сведени в набор от продукции, и след това да го прилагат към произволен модел на гората, използвайки определен набор от обучение данни. Алгоритмите за машинно обучение вземат тези данни за обучение и работят с тях, за да се развият отвъд ограниченията на първоначалното им програмиране. В случай на произволни горски модели технологията се научава да формира по-сложни прогнозни резултати, използвайки тези индивидуални дървета за решения, за да изгради своя случаен горски консенсус.
Един от начините, по които това може да се приложи в бизнеса, е да се вземат различни променливи на свойствата на продукта и да се използва произволна гора, за да се посочи потенциален интерес на клиента. Например, ако има известни фактори за интерес на клиента като цвят, размер, трайност, преносимост или нещо друго, към което клиентите са посочили интерес, тези атрибути могат да бъдат въведени в наборите от данни и анализирани въз основа на тяхното собствено уникално въздействие за многофакторни анализ.