У дома звуков Как новите възможности за машинно обучение могат да позволят извличането на документи за запаси за финансови данни?

Как новите възможности за машинно обучение могат да позволят извличането на документи за запаси за финансови данни?

Anonim

Q:

Как новите възможности за машинно обучение могат да позволят извличането на документи за запаси за финансови данни?

A:

Една от вълнуващите нови граници на машинното обучение и ИИ е, че учените и инженерите предприемат различни начини да използват напълно нови видове ресурси за прогнозиране на движението на акциите и инвестиционните резултати. Това е огромен смяна на игри във финансовия свят и ще промени революционните стратегии по много задълбочен начин.

Една от основните идеи за разширяване на този тип стокови изследвания е компютърната лингвистика, която включва моделиране на естествения език. Експертите проучват как да се използват текстови документи, от SEC дописи до акционерни писма до други периферни текстови ресурси, за да се разшири или прецизира анализ на запасите или да се разработят изцяло нови анализи.

Безплатно изтегляне: Машинното обучение и защо има значение

Важното отказване от отговорност е, че всичко това е възможно само чрез чисто нов напредък в невронните мрежи, машинно обучение и анализ на естествен език. Преди появата на ML / AI изчислителните технологии използваха предимно линейно програмиране, за да „четат“ входовете. Текстовите документи бяха твърде силно неструктурирани, за да бъдат полезни. Но с напредъка, постигнат в анализа на естествения език през последните няколко години, учените откриват, че е възможно да се „изкопае“ естественият език за измерими резултати или с други думи, резултати, които могат да бъдат изчислени по някакъв начин.

Някои от най-добрите доказателства и най-полезните примери за това идват от различни дисертации и докторска работа, достъпни в интернет. В статия „Приложения за машинно обучение и компютърна лингвистика във финансовата икономика“, публикувана през април 2016 г., Лили Гао способно обяснява съответните процеси, специфични за извличането на корпоративни документи на SEC, обаждания на акционери и социални медии.

„Извличането на смислени сигнали от неструктурирани и високомерни текстови данни не е лесна задача“, пише Гао. "Въпреки това, с развитието на машинното обучение и изчислителните езикови техники, обработката и статистическото анализиране на текстовите документи могат да бъдат постигнати и много приложения на статистическия анализ на текста в социалните науки се оказаха успешни." От дискусията на Гао за моделиране и калибриране в резюмето, целият разработен документ показва как някои от този тип анализи работят подробно.

Други източници за активни проекти включват страници като този кратък проект на GitHub и този ресурс на IEEE говори специално за получаване на ценна финансова информация от „анализ на настроенията в Twitter“.

Изводът е, че използването на тези нови NLP модели води до бързи иновации в използването на всякакъв вид текстови документи, не само за финансов анализ, но и за други видове авангардни открития, замъглявайки тази традиционно установена линия между "език" и "данни."

Как новите възможности за машинно обучение могат да позволят извличането на документи за запаси за финансови данни?