Съдържание:
- Определение - Какво означава анализ на основните компоненти (PCA)?
- Техопедия обяснява анализ на основните компоненти (PCA)
Определение - Какво означава анализ на основните компоненти (PCA)?
Анализът на основните компоненти (PCA) е техника, използвана за идентифициране на по-малък брой некорелирани променливи, известни като главни компоненти от по-голям набор от данни. Техниката се използва широко за подчертаване на вариациите и улавяне на силни модели в набор от данни. Изобретен от Карл Пиърсън през 1901 г., анализът на основните компоненти е инструмент, използван в прогнозните модели и аналитичните данни. Анализът на основните компоненти се счита за полезен статистически метод и се използва в области като компресия на изображения, разпознаване на лица, невронаука и компютърна графика.
Техопедия обяснява анализ на основните компоненти (PCA)
Анализът на основните компоненти помага за по-лесното изследване и визуализиране на данните. Това е проста непараметрична техника за извличане на информация от сложни и объркващи набори от данни. Анализът на основните компоненти е фокусиран върху максималната сума на дисперсия с най-малкия брой основни компоненти. Едно от отличителните предимства, свързани с анализа на основния компонент, е, че след като се намерят модели в съответните данни, се поддържа и компресиране на данни. Единият използва анализ на основния компонент, за да елиминира броя на променливите или когато има твърде много прогнози в сравнение с броя на наблюденията или за да се избегне мултиколинеарност. Тя е тясно свързана с каноничния корелационен анализ и използва ортогонална трансформация, за да преобразува набора от наблюдения, съдържащи корелирани променливи, в набор от стойности, известни като основни компоненти. Броят на основните компоненти, използвани при анализа на основните компоненти, е по-малък или равен на по-малкия брой наблюдения. Анализът на основните компоненти е чувствителен към относителното мащабиране на първоначално използваните променливи.
Анализът на основните компоненти се използва широко в много области като пазарни изследвания, социални науки и в индустрии, където се използват големи масиви от данни. Техниката може да помогне и за предоставяне на картина с по-малки размери на оригиналните данни. Необходими са само минимални усилия в случай на анализ на основните компоненти за намаляване на сложен и объркващ набор от данни в опростен набор от полезна информация.