Q:
Защо някои проекти за машинно обучение изискват огромен брой участници?
A:Когато мислите за машинно обучение, вие сте склонни да мислите за квалифицирани учени за данни, които работят върху клавиатури в компютърните стаи. Има изключителен акцент върху количествения анализ и алгоритмите. Няма много непосредствен контекст в реалния свят на много от тези програми - поне това биха си помислили много хора.
Въпреки това, някои от най-революционните програми за машинно обучение днес използват истински армии от човешки актьори на улицата, в магазините и навсякъде, където те могат да моделират основни човешки дейности като ходене, работа или пазаруване.
Безплатно изтегляне: Машинното обучение и защо има значение |
Статия на Wired от Том Симоните илюстрира това много добре с подходящото заглавие „За да направим AI по-умен, хората изпълняват странни задачи с ниска цена“.
Използвайки примера на кратки видеоклипове, направени в хранителен магазин на Whole Foods, Simonite подчертава видовете работа, които ще помогнат за изграждането на някои от следващите фази на машинното обучение.
Това води до въпроса защо всички тези хора са ангажирани да се снимат в кратки и прости видеоклипове, документиращи действия като рудиментарни като движение на ръка или крак.
Отговорът хвърля малко светлина къде е машинното обучение и къде отива.
„Изследователи и предприемачи искат да видят AI да разбере и да действа във физическия свят“, пише Саймън, обяснявайки защо той и други се движат с камери. „Следователно необходимостта работниците да изпълняват сцени в супермаркети и домове. Те генерират инструктивни материали за преподаване на алгоритми за света и хората в него. "
Както много експерти ще посочат, някои от най-големите граници на машинното обучение включват обработка на изображения и обработка на естествен език. Това са изключително количествени процедури - с други думи, няма широк спектър от входни данни, каквито има в реални среди. Вместо това програмите за машинно обучение използват визуални и аудио данни по много специфични начини за изграждане на модели. С обработката на изображения той избира функции от (крайно) зрително поле. За NLP това е сглобяване на фонеми.
Излизането извън тези специфични категории на въвеждане включва нещо, което бихте могли да наречете „пропаст в образа и речта“ - като надхвърляте неща като обработка на изображения и разпознаване на реч, се местите в области, където компютрите трябва да бъдат аналитични по различни начини. Наборите за обучение ще бъдат коренно различни.
Влезте в армията на видеографи. В някои от тези нови проекти за машинно обучение най-малките идеи на човешките дейности са учебните комплекти. Вместо да бъдат обучени да търсят функции и ръбове и пиксели, които се състоят в задачи за класификация, компютрите вместо това използват тренировъчни видеоклипове, за да преценят как изглеждат различните видове действия.
Ключовото е какво могат да правят инженерите с тези данни, когато те се агрегират и зареждат и когато компютърът е обучен на него. Скоро ще видите резултатите в различни области - например това ще направи надзора изключително ефективен. Компютрите ще могат да „виждат“ във визуалното поле какво правят хората и да го прилагат в области като маркетинг и продажби или може би в някои случаи работа на държавни агенции или наказателно правосъдие.
Последствията също хвърлят малко светлина върху дебата между въпросите за максимална полза и поверителност. Голяма част от използването на тези видеоклипове ще изгради модели за машинно обучение, които работят за наблюдение, но какво да кажем за хората, които не искат да бъдат изследвани? Когато тези нови програми за машинно обучение се внедряват в публичното пространство, какви са правата на индивида и къде е начертана тази линия?
Във всеки случай компаниите използват такива видове човешки и видео ресурси, за да се разкопаят наистина в някои кръгове от следващото ниво на машинно обучение, които всъщност ще дадат възможност на компютрите да разпознаят случващото се около тях, а не просто да класифицират изображения или да работят с фонемите на реч. Това е изключително интересно и противоречиво развитие на изкуствения интелект и заслужава своя дял внимание в технологичните медии и извън него.