Q:
Как максималното обединяване помага да се направи AlexNet страхотна технология за обработка на изображения?
A:В AlexNet, иновативна конволюционна невронна мрежа, концепцията за максимално обединяване се вмъква в сложен модел с множество спираловидни слоеве, отчасти с цел да се помогне за приспособяването и да се опрости работата, която невронната мрежа върши при работа с изображения с това, което експертите наричат „нелинейна стратегия за понижаване на опростяването“.
AlexNet се счита за доста страхотен CNN, като спечели 2012 ILSVRC (ImageNet Large-Scale Visual Recognition Challenge), което се разглежда като преломно събитие за машинно обучение и напредване на невронната мрежа (някои го наричат „Олимпиадата“ на компютърното зрение) ).
В рамките на мрежата, където обучението е разделено на два графични процесора, има пет завъртани слоя, три напълно свързани слоя и някои реализации на максимално обединяване.
По същество, максималното обединяване взема „пула” от изходи от колекция от неврони и ги прилага към стойностите на следващия слой. Друг начин да разберете това е, че подходът за максимално обединяване може да консолидира и опрости стойностите с цел по-подходящо приспособяване на модела.
Максималното обединяване може да помогне за изчисляване на наклони. Може да се каже, че „намалява изчислителната тежест“ или „свива преизпълняването“ - чрез понижаване на мащаба, максималното обединяване ангажира това, което се нарича „намаляване на размерите“.
Намаляването на размерите се занимава с въпроса за наличието на свръхсложен модел, който е трудно да се изпълнява през невронна мрежа. Представете си сложна форма, с много малки назъбени контури и всяка малка част от тази линия, представена от точка от данни. С намаляването на размерите, инженерите помагат на програмата за машинно обучение да "намали" или да извади по-малко точки от данни, за да направи модела като цяло по-опростен. Ето защо, ако погледнете слой с максимален пул и неговия изход, понякога можете да видите по-опростена пикселация, съответстваща на стратегията за намаляване на размерността.
AlexNet също използва функция, наречена ректифицирани линейни единици (ReLU), и максималното обединяване може да бъде допълващо тази техника при обработката на изображения чрез CNN.
Експертите и тези, които участват в проекта, са предоставили изобилие от визуални модели, уравнения и други подробности, за да покажат специфичното изграждане на AlexNet, но в общ смисъл можете да мислите за максимално обединяване, като коализиране или консолидиране на изхода на множество изкуствени неврони. Тази стратегия е част от цялостното изграждане на CNN, което стана синоним на авангардно машинно виждане и класификация на изображенията.