Friday, October 14, 2016

Estrategias De Negociación Para Explotar Blog Y Noticias Sentimiento

Publicaciones similares Estrategias de negociación para explotar Blog y Noticias Sentimiento Wenbin Zhang y Steven Skiena Departamento de Ciencias de la Computación, Universidad de Stony Brook Stony Brook, NY 11794-4400 EE. UU. Utilizamos medios cuantitativa (blogs, y las noticias como una comparación) datos generados por un procesamiento del lenguaje natural a gran escala (PNL) sistema de análisis de texto para realizar una completa y estudio comparativo sobre cómo informó de una empresa de medios cuencia cuencia, la polaridad sentimiento y subjetividad anticipa o re - fleja sus volúmenes de negociación de valores y rendimientos financieros. Nuestros análisis proporciona evidencia concreta de que los datos de los medios de comunicación es muy informativa, como se sugiere en la literatura - pero Nunca estudió en nuestra escala de varios grandes colecciones de blogs y las noticias durante más de cinco años. Sobre la base de nuestros resultados, dar a una estrategia de negociación incidencia en el mercado basado en la confianza que da retornos consistentemente favorables con baja volatilidad más un período de cinco años (2005-2009). Nuestros resultados son significativos en confirmando el desempeño de blogs general y noticias sen - métodos de análisis timent más de los dominios y las fuentes amplias. Por otra parte, varias diferencias notables entre las noticias y blogs también se identifican en este documento. Introducción La hipótesis del mercado eficiente afirma que cado financiero cados son "informativamente eficiente", lo que significa actual precios de las acciones ya reflejan toda la información conocida y todos ocurrido hechos. Por otra parte, los precios en los mercados financieros son in - sesgada y contienen toda la sabiduría o previsiones futuras inversores. Por lo tanto, los inversores no pueden hacer el exceso tabilidad su del mercado si sus estrategias comerciales se basan en información conocida, porque los precios de mercado son de manera eficiente recopilar y agregar información diversa y mantener cambiar sin demora. Sin embargo, un gran y creciente literatura que los documentos movimientos de los indicadores financieros no son siempre consistente tienda de campaña con las medidas cuantitativas de fundamentalismo de las empresas hos - (por ejemplo (Cutler, Poterba, y Summers 1989; Rollo 1988; do. 2010, la Asociación para el Avance de Artificial Inteligencia (AAAI). Reservados todos los derechos. podría proporcionar una forma viable y útil para analizar financiera Nuestro objetivo principal es el estudio de la relación entre los datos del mercado de valores y los datos de los medios lingüísticos, tanto en blogs y noticias, andtoillustratetheextenttowhichtheycancontribute para el diseño de estrategias de inversión. Nuestra contribución principal ciones en este trabajo son: • Estudio comparativo de Blogs y Noticias - Llevamos a cabo un estudio comparativo reflexivo de cada cuatro lin - diferente fuentes de tics, es decir, Twitter, blogs Spinn3r RSS, LiveJour - blogs nales y Diarios de noticias como una comparación. Nosotros esta - mos recortar sus sentimientos con sus correspondientes acciones y eva - luando el rendimiento negociación de acciones con el uso de los cuatro fuentes respectivamente. Nuestro análisis también descubre que muchos propiedades distintas entre blogs y noticias. Por ejemplo, información de noticias podría incorporarse en precios de las acciones al instante (casi dentro de 1 día) después de la liberación, mientras que el blog información como Twitter será absorbido por mercado de valores con un período de tiempo más largo (alrededor de 2 a 3 días). • análisis a gran escala - Damos resultados integrales de el análisis de mercado de valores utilizando aproximadamente un terabyte de blogs y datos de noticias y miles de diferentes empresas. Esta escala de análisis nunca se ha intentado previamente en theliterature, andenablesustoidentifyshort-termbutsta - estadísticamente correlaciones significativas entre el volumen de los medios de comunicación / sentimiento y devoluciones / los volúmenes de operaciones financieras. • Corpus tamaño importa - El trabajo previo sobre la confianza basada en análisis financiero (por ejemplo, (Tetlock, Saar-Tsechansky, y Macskassy 2007)) centrarse explícitamente en nacional financiera periódicos, a saber, el Servicio y Noticias Dow Jones el Wall Street Journal. Sin embargo, wedemonstratethatamore significativa señal de confianza, fiable proviene de analizadores • Validación de Métodos de Análisis de Sentimiento - Tal vez an - otra contribución importante de nuestro trabajo es el más fuerte validación actualizada de la exactitud de nuestro sentimiento medios metodología de análisis de Lidia. Validación adecuada es im - posible en ausencia de cualquier acordado estándar de oro de análisis de los sentimientos a nivel de entidad (Pang y Lee 2008). Pero nuestra capacidad de extraer un sentimiento suficientemente fiable señal para negociar con éxito en (independientemente del tiempo resolución) proporciona evidencia rigurosa que nuestro sentimiento métodos reflejan con precisión los cambios reales en respuesta a Lin información güístico. Este artículo está organizado de la siguiente forma: Primero revisamos re - trabajo relacionadas. A continuación, se describe el origen y características de los datos de medios de comunicación y financiera que trabajamos. Después de eso, dar un análisis completo de la correlación entre las principales las variables del mercado de valores y las principales variables de los medios de comunicación, que es la parte más importante de este trabajo. Por último, se propone y evaluar una estrategia de negociación incidencia en el mercado basado en mí - datos de diá. Llegamos a la conclusión de que los precios financieros son significativamente correlacionado con datos de medios cuantitativos y puede ser usado para formular estrategias comerciales interesantes. Trabajo relacionado El trabajo previo se divide entre la financiación y el ordenador comunidades académicas de ciencias. En primer lugar, la investigación por encuestas desde el ámbito financiero. Tetlock (Tetlock, Saar-Tsechansky y Macskassy 2007) investiga si la aparición de palabras negativas en artículos de noticias específicas de las empresas pueden ayudar a predecir de efectivo de las empresas flujos y si los precios del mercado de valores de las empresas incorporan información lingüística de manera eficiente. Afirman que las empresas ' precios de las acciones bajo-reaccionan a la información negativa subyacente ción de artículos de noticias. Más específicamente, información negativa ción de los artículos de noticias se reflejan en los precios del mercado de valores con más o menos retraso de un día. Chan (Chan 2003) examina los rendimientos mensuales a un subconjunto de las reservas después de la noticia pública acerca de ellos es liberado y se encuentra que los inversionistas reaccionan lentamente a la información, sobre todo después malas noticias. Otro hallazgo importante es que las acciones tienden a invertir en el mes siguiente después de precio extremo movimiento mentos acompañados por la noticia pública. Además, estos patrones son estadísticamente significativas. Una limitación de este estudio utiliza gruesa, granularidad mensual. En nuestro trabajo, proporcionar un análisis de noticias y precios movimientos diarios. Estudio Antweiler y Frank (Antweiler y Frank 2004) más de 1,5 millones de mensajes de Yahoo! Finanzas y Raging Bull, que son los dos más popular de Internet de la Pizarrón de mensajes. Emplearon Naive Bayes y Apoyo Clasificadores Vector Machine para evaluar el contenido de "optimismo" de estos mensajes de valores. Muestran estos tableros de mensajes son muy informativo, y además que la tendencia alcista está positivamente y se asocia significativamente con retornos. En términos de comercio volumen, el trabajo muestra opiniones controvertidas son asociaciones ated con más operaciones. Desde el lado de Ciencias de la Computación, investigaciones intensas son suministrada por las comunidades mineras de texto o de aprendizaje automático. Su idea básica es cuantificar la información lingüística con técnicas de minería de texto, obtienen el conjunto predefinido de características de los datos de entrenamiento y, a continuación, construir varios modelos con clasifi - enfoques estadísticos Cal o algoritmos de aprendizaje de estadística. Un estudio detallado de la minería de texto para la respuesta del mercado a las noticias se pueden encontrar en (Mittermayer y Knolmayer 2006a). En particular, el modelo de 3-categoría es ampliamente utilizado etiquetar documentos o palabras. La primera categoría (positivo sentimiento) se compone de los artículos de noticias o palabras que hacen que la variables financieras asociadas aumentan hasta cierto punto en un cierto período de tiempo, por ejemplo, una noticia hace que el precio de la acción individual "IBM" aumentar 0.5% en el guiente día mugido. Del mismo modo, la segunda categoría (sen - negativo timent) se define en consecuencia. La tercera categoría consiste de artículos de noticias neutrales o palabras. caracterizado bajo este modelo incluye (Fung, Yu, y Lam 2.002; Mittermayer y Knolmayer 2006b; Thomas 2003; Wuthrich, Cho, y etc 1998). También ha habido gran interés en la opinión la minería y la comunidad de la PNL en el uso de flujos de texto financieros Aquí se describen las fuentes de datos de acciones y los medios de comunicación, que es la base para nuestro análisis en este trabajo. Datos de la Nuestro precio de las acciones y los datos de volumen se obtiene de Thom Datos de Medios Blog y noticias de los datos relacionados con la empresa, se generó nosotros - ing la Lydia ((Lloyd, Kechagias y Skiena 2005), textmap), un ma procesamiento de textos de alta velocidad


No comments:

Post a Comment