Preguntas frecuentes sobre automatización de textos y periodismo robotizado
USPs / puntos de venta únicos
¿Qué distingue a nuestra tecnología de las demás?
- Con TCL (Text Composing Language) proporcionamos un lenguaje de programación para la generación de texto basado en plantillas que también es adecuado para los profesionales de la programación.
- Durante la generación de texto, podemos acceder a cualquier número de interfaces y bases de datos simultáneamente.
- Una amplia biblioteca de funciones constituye la base para la implementación eficiente de los requisitos más complejos.
- Si es necesario, el usuario puede ampliar el rango de idiomas.
- Si se necesitan grandes cantidades de texto en el menor tiempo posible, los entornos de producción textOmatic*Composer pueden funcionar en sistemas de nube.
- Para los sistemas editoriales líderes como DIALOG de Funkinform o Gogol Publishing, existen interfaces que permiten la entrega directa de las noticias generadas para publicaciones impresas y en línea.
- Las funciones de interfaz integradas con WhatsApp, Facebook Messenger, etc. permiten el envío de mensajes hiperpersonalizados y la implementación de bots de chat.
- Las páginas de aterrizaje SEO automatizadas proporcionan más visibilidad y alcance.
¿Qué apoyo hay para la implementación de proyectos de automatización de textos?
Como usuario, usted tiene la opción:
- La realización completa de su proyecto de automatización de textos por nosotros, como un servicio completo:
Junto con nosotros, sólo se tiene que realizar el suministro de los textos generados en el entorno de su aplicación.
- La realización completa del proyecto por usted:
Configuramos el entorno de desarrollo y le ayudamos con el modelado de datos, la implementación de interfaces de importación y la programación de plantillas si es necesario. Ofrecemos cursos de formación y talleres para el uso de herramientas.
- La realización de su proyecto de automatización de textos como un proyecto cooperativo:
Si desea beneficiarse de una rápida implementación del proyecto y, al mismo tiempo, adquirir conocimientos sobre la tecnología, se recomienda este enfoque.
Le apoyamos en la investigación de datos y en la implementación de interfaces de importación.
- En áreas como Ya hemos implementado interfaces de importación a varios proveedores de datos para el clima, las finanzas, los deportes y el tráfico.
- También hay bases de datos con información de fondo de Wikipedia, así como directorios de todos los países, lugares y suburbios de Alemania con coordenadas GEO.
- Un léxico multilingüe soporta las traducciones.
¿Cuáles son los beneficios para la implementación de los proyectos?
Rapidez de implementación / Time to Market
- Ejemplos sencillos de generación de texto y PoCs (Proof of Concepts) pueden ser implementados rápidamente. Esto es posible gracias a la perfecta integración del sistema CMS y el módulo de generación de texto.
- Los entornos de desarrollo basados en la web permiten probar los textos generados en línea en cualquier momento.
- Las plantillas pueden ser editadas simultáneamente por varios usuarios.
- Para proyectos más complejos, la experiencia muestra que las plantillas pueden ser creadas y ampliadas a nivel de lenguaje de programación en una fracción del tiempo comparado con la introducción de plantillas en editores basados en sintaxis.
Escalabilidad en el rendimiento y el tamaño de la base de datos
- Mediante los servicios en la nube, la generación automática de texto es infinitamente escalable y genera varios miles de textos o más por segundo, dependiendo de las necesidades.
- Durante la generación de texto, se puede acceder simultáneamente a cualquier número de bases de datos. Por lo tanto, la información de fondo, por ejemplo, sobre ubicaciones, empresas (bursátiles), personas, asociaciones, países, estadios, etc., puede utilizarse fácilmente para la generación de textos.
- Para volúmenes de datos extremadamente grandes del orden de billones de entradas, el motor O4Store se puede reservar opcionalmente, lo que permite obtener una ganancia de rendimiento de hasta un factor de 100 en las consultas de datos.
Transparencia
- Las redundancias en la programación se evitan mediante el uso de bibliotecas de funciones. Las aplicaciones de generación de texto son, por lo tanto, fáciles de mantener y ampliar.
- Durante el proceso de oferta, todas las posiciones individuales hasta el precio del texto se listan de forma transparente, por ejemplo, el cliente no alquila ningún texto generado, sino que lo compra.
Capacidad multilingüe
- No hay restricciones en cuanto al idioma en el que se deben generar los textos. En nuestro proyecto 3dna.news, patrocinado por Google DNI, mostraremos ejemplos de varios textos de noticias de los campos del tiempo, deportes, finanzas y eventos en los idiomas europeos más hablados.
Preguntas frecuentes en relación con la generación de textos en lenguaje natural
- ¿Qué técnicas existen para hacer de los registros un lenguaje escrito?
- ¿Cómo es el trabajo de los programadores o lingüistas en el campo de la generación automática de textos?
- ¿Cómo obtiene el programa los datos necesarios, que deberían estar en el texto?
- Se supone que los periodistas saben mejor que nadie cómo debe sonar un texto.
- ¿Por qué las aplicaciones de compositores de texto son tan solicitadas hoy en día?
- ¿Qué ha cambiado en el periodismo?
- ¿Qué soporte pueden esperar los editores de la generación automática de texto?
- ¿Cuándo vale la pena invertir en tecnología de generación de texto?
Técnica y tecnología de generación automática de textos
¿Qué técnicas existen para hacer de los registros un lenguaje escrito?
¿Cómo funcionan en principio?
Esencialmente, se hace una distinción entre los métodos basados en la gramática y los basados en plantillas. De acuerdo con la opinión de los principales especialistas en el campo de la informática lingüística, se puede suponer que ambos enfoques son igualmente poderosos. Por lo tanto, no existen restricciones en cuanto a la diversidad lingüística, la expresividad y el tipo y alcance de los textos generados.
Los métodos basados en la gramática, sin embargo, asumen que la gramática completa para cada idioma debe ser almacenada en el software de generación de texto o hecha aplicable y están diseñados principalmente para generar textos frase por frase.
Por el contrario, el proceso basado en plantillas utilizado en textOmatic*Composer le permite empezar a generar textos inmediatamente y aumentar la expresividad de los textos generados de forma continua mediante la ampliación de las plantillas. Además, las partes del texto también pueden vincularse sintácticamente y en cuanto al contenido más allá de los límites de la frase, el párrafo y el capítulo por medio de los llamados medios complementarios de cohesión y cohesión.
¿Cómo es el trabajo de los programadores o lingüistas en el campo de la generación automática de textos?
¿Qué clase de expertos pueden enseñar a una computadora a "escribir"?
Según el estado actual de la técnica, no es posible generar automáticamente textos de la más alta calidad a partir del aprendizaje automático. Aunque el software de traducción como Google Translate es de gran ayuda para las necesidades prácticas, las traducciones realizadas no siempre son perfectas. Los textos destinados a la publicación deben, en el mejor de los casos, estar 100% libres de errores.
El trabajo de los desarrolladores de software y de los lingüistas informáticos en el campo de la creación de plantillas para la generación automática de textos es esencialmente una actividad de programación (machine teaching). Para esta nueva profesión, los términos diseñador de textos, diseñador de lenguaje o programador de textos son los más apropiados.
Una vez definida la estructura del informe, el objetivo es diseñar las partes del texto de forma que se consiga la mayor varianza posible entre los textos (ooak = único en su género) y los medios lingüísticos utilizados. Entre otras cosas, se deben crear diccionarios con listas de sinónimos que se adapten con precisión al dominio de la aplicación. El objetivo no es sólo generar textos correctos, sino también evitar ambigüedades y malentendidos. El diseño del texto también implica la elección de los medios y estilos lingüísticos. Esto puede variar de la materia-de-hecho/sober/scientifically a inusual/colloquial/removido/esotérico.
¿Cómo obtiene el programa los datos necesarios, que deberían estar en el texto?
En muchas áreas hay proveedores de servicios profesionales o autoridades que recopilan datos regularmente. Usted cuenta estos datos, por ejemplo, datos financieros, meteorológicos y deportivos. Los datos se pueden obtener normalmente a través de interfaces XML. Para cada fuente de datos, primero se debe desarrollar un módulo de importación, que transfiere los datos a una base de datos central. También es posible la importación directa desde tablas Excel o archivos de texto csv/tab.
Además, se puede acceder directamente a recursos de datos externos como DBPedia, etc. a través de los Protocolos de Web Semántica (RDF/OWL). La información almacenada allí se puede integrar directamente en el proceso de generación como información de fondo.
Se supone que los periodistas saben mejor que nadie cómo debe sonar un texto.
¿Hay demanda de periodistas en su sector?
En principio, cada editorial tiene su propio "lenguaje propio". Esto puede incluso especificarse en guías de estilo y manuales. Aunque inicialmente parece que los textos generados en un área de aplicación tendrían que variar poco en términos de estilo, en la práctica a menudo hay requisitos para satisfacer una "dicción" correspondiente. Incluso los "suizos" deben ser tratados como una lengua extranjera con respecto al alemán. También en este caso, el enfoque de generación basado en plantillas tiene posibilidades significativamente mejores para hacer frente a estos requisitos debido a su flexibilidad.
Los metaperiodistas y los especialistas en idiomas son necesarios para cumplir con el requisito en términos de estilo y participan en el desarrollo de los reglamentos pertinentes. Ciertos estilos de redacción son necesarios no sólo al escribir textos periodísticos, sino también para descripciones de productos o informes de negocios que pretenden llegar a un grupo objetivo específico con un estilo de redacción particular. En este caso, se necesitan expertos en marketing en lugar de periodistas.
Finalidades
¿Por qué las aplicaciones de compositores de texto son tan solicitadas hoy en día?
Los informes y mensajes deben escribirse con prontitud, con gran pertinencia y corrección. Además, deben adaptarse lo más individualmente posible al lector. En muchas áreas se alcanza rápidamente el límite en el que simplemente ya no es posible que un editor humano escriba informes con la calidad requerida en el tiempo disponible. Por ejemplo, un informe de 700 palabras sobre un índice bursátil puede generarse en pocos segundos. La redacción llevaría más de media hora con un editor humano - sin embargo, el informe ya está superado durante mucho tiempo por la actualidad.
¿Qué ha cambiado en el periodismo?
No mucho, en primer lugar. Sin embargo, puede haber un área pequeña donde se escriben informes y mensajes cortos de voluntarios y ayudantes. Los programas de escritura pueden hacerse cargo de esta área paso a paso. El software de generación automática de texto también se utilizará cada vez más, por ejemplo, para generar descripciones de productos. Estas áreas no constituyen el trabajo periodístico propiamente dicho. Es más bien una "tortura" para periodistas y autores tener que escribir siempre textos según el mismo esquema. Además, se trata del límite de coste por encima del cual la creación de textos por autores humanos resulta simplemente demasiado cara. Especialmente con un gran número de casos, el límite se alcanza con relativa rapidez, en el que el esfuerzo inicial de programación del software de generación de texto da sus frutos.
En el negocio principal del periodismo, sin embargo, todo seguirá igual durante mucho tiempo. Los informes, los informes de fondo y los artículos de la feuilleton requieren un trabajo de investigación que los ordenadores no pueden realizar en la medida necesaria. En este sentido, el temor de los periodistas a ser reprimidos por el periodismo robot es bastante infundado.
¿Qué soporte pueden esperar los editores de la generación automática de texto?
¿Qué áreas de aplicación adicionales se pueden abrir mediante la generación automática de texto?
Para muchas redacciones, uno de los principales criterios de éxito es la visibilidad y el alcance de las noticias publicadas en línea. La cantidad y la calidad de la información juegan un papel importante aquí. En cuanto a la buscabilidad en los motores de búsqueda como Google, Bing, etc., depende de los mejores rankings. Para sobrevivir a la "guerra del campo de tiro", es necesario ampliar significativamente la gama de servicios en comparación con los competidores y ofrecer contenidos más originales. La generación automática de mensajes puede contribuir significativamente a ello. Pero no se trata sólo de adelantar o reprimir en los resultados de los motores de búsqueda. Más bien, al proporcionar nuevos tipos de información, se pueden hacer ofertas únicas.
Además de las áreas de aplicación en periodismo y medios online, la composición de textos puede ser utilizada para cualquier tipo de generación de informes. En particular, esto incluye la generación de informes anuales. Por ejemplo, más del 50% de todos los sitios web utilizan la herramienta de seguimiento de datos Google Analytics. Sobre esta base, se pueden generar informes exhaustivos sobre el uso de los sitios web con recomendaciones de acción derivadas de ellos.
El Boletín Federal electrónico publica, entre otras cosas, anuncios sobre los estados financieros anuales de las empresas. Estos datos también pueden consultarse automáticamente para generar informes sobre el desarrollo financiero de las empresas.
Las áreas de aplicación para la generación automática de texto son muy versátiles, pero en cada caso se asume que los datos subyacentes están bien estructurados y pueden ser leídos en la base de datos utilizada para la generación de texto mediante interfaces o funciones de importación.
¿Cuándo vale la pena invertir en tecnología de generación de texto?
Según el estado actual de la técnica, no hay programas que generen textos e informes sofisticados y que puedan ser comprados "de inmediato". Cuando el uso de la tecnología de generación automática de textos resulta rentable, lo decide el propio cliente potencial. Un valor añadido adicional o los costes actuales del cliente para la creación de, por ejemplo, descripciones de productos, se comparan con la oferta para la generación automática de textos, con el fin de poder tomar la decisión a favor o en contra de una inversión.
Para la preparación de una oferta relacionada con el proyecto es necesario: Información sobre las necesidades y verificación de la calidad de los datos