У дома звуков Как максималното обединяване помага да се направи alexnet страхотна технология за обработка на изображения?

Как максималното обединяване помага да се направи alexnet страхотна технология за обработка на изображения?

Anonim

Q:

Как максималното обединяване помага да се направи AlexNet страхотна технология за обработка на изображения?

A:

В AlexNet, иновативна конволюционна невронна мрежа, концепцията за максимално обединяване се вмъква в сложен модел с множество спираловидни слоеве, отчасти с цел да се помогне за приспособяването и да се опрости работата, която невронната мрежа върши при работа с изображения с това, което експертите наричат „нелинейна стратегия за понижаване на опростяването“.

AlexNet се счита за доста страхотен CNN, като спечели 2012 ILSVRC (ImageNet Large-Scale Visual Recognition Challenge), което се разглежда като преломно събитие за машинно обучение и напредване на невронната мрежа (някои го наричат ​​„Олимпиадата“ на компютърното зрение) ).

В рамките на мрежата, където обучението е разделено на два графични процесора, има пет завъртани слоя, три напълно свързани слоя и някои реализации на максимално обединяване.

По същество, максималното обединяване взема „пула” от изходи от колекция от неврони и ги прилага към стойностите на следващия слой. Друг начин да разберете това е, че подходът за максимално обединяване може да консолидира и опрости стойностите с цел по-подходящо приспособяване на модела.

Максималното обединяване може да помогне за изчисляване на наклони. Може да се каже, че „намалява изчислителната тежест“ или „свива преизпълняването“ - чрез понижаване на мащаба, максималното обединяване ангажира това, което се нарича „намаляване на размерите“.

Намаляването на размерите се занимава с въпроса за наличието на свръхсложен модел, който е трудно да се изпълнява през невронна мрежа. Представете си сложна форма, с много малки назъбени контури и всяка малка част от тази линия, представена от точка от данни. С намаляването на размерите, инженерите помагат на програмата за машинно обучение да "намали" или да извади по-малко точки от данни, за да направи модела като цяло по-опростен. Ето защо, ако погледнете слой с максимален пул и неговия изход, понякога можете да видите по-опростена пикселация, съответстваща на стратегията за намаляване на размерността.

AlexNet също използва функция, наречена ректифицирани линейни единици (ReLU), и максималното обединяване може да бъде допълващо тази техника при обработката на изображения чрез CNN.

Експертите и тези, които участват в проекта, са предоставили изобилие от визуални модели, уравнения и други подробности, за да покажат специфичното изграждане на AlexNet, но в общ смисъл можете да мислите за максимално обединяване, като коализиране или консолидиране на изхода на множество изкуствени неврони. Тази стратегия е част от цялостното изграждане на CNN, което стана синоним на авангардно машинно виждане и класификация на изображенията.

Как максималното обединяване помага да се направи alexnet страхотна технология за обработка на изображения?