FAQ sur l'automatisation des textes et le journalisme robotisé
USP / arguments de vente uniques
Qu'est-ce qui distingue notre technologie des autres?
- Avec TCL (Text Composing Language), nous proposons un langage de programmation pour la génération de texte à base de modèles qui convient également aux professionnels de la programmation.
- Lors de la génération de texte, nous pouvons accéder simultanément à un nombre illimité d'interfaces et de bases de données.
- Une vaste bibliothèque de fonctions constitue la base d'une mise en œuvre efficace des exigences les plus complexes.
- En cas de besoin, l'utilisateur peut élargir la gamme de langues lui-même.
- Si de très grandes quantités de texte sont nécessaires dans les plus brefs délais, les environnements de production textOmatic*Composer peuvent être exploités dans des systèmes cloud.
- Pour les systèmes éditoriaux de pointe tels que DIALOG de Funkinform ou Gogol Publishing, il existe des interfaces qui permettent la diffusion directe des nouvelles générées pour les publications imprimées et en ligne.
- Des fonctions d'interface intégrées à WhatsApp, Facebook Messenger, etc. permettent l'envoi de messages hyper-personnalisés et l'implémentation de chat bots.
- Les pages d'atterrissage SEO automatisées offrent plus de visibilité et de portée.
Quel soutien existe-t-il pour la mise en œuvre de projets d'automatisation des textes ?
En tant qu'utilisateur, vous avez le choix:
- La réalisation complète de votre projet d'automatisation de texte par nos soins, en tant que service complet:
Avec nous, seule la mise à disposition des textes générés dans votre environnement applicatif doit être réalisée.
- La réalisation complète du projet par vous:
Nous mettons en place l'environnement de développement et, si nécessaire, nous vous assistons dans la modélisation des données, la mise en œuvre des interfaces d'importation et la programmation des modèles. Nous offrons des formations et des ateliers pour l'utilisation des outils.
- La réalisation de votre projet d'automatisation de texte en tant que projet coopératif:
Si vous souhaitez bénéficier d'une mise en œuvre rapide du projet et en même temps acquérir un savoir-faire sur la technologie, cette approche est recommandée.
Nous vous assistons dans la recherche de données et l'implémentation d'interfaces d'importation.
- Dans des domaines tels que Nous avons déjà mis en place des interfaces d'importation avec différents fournisseurs de données pour la météo, les finances, le sport et le trafic.
- Il y a aussi des bases de données avec des informations de fond de Wikipedia ainsi que des répertoires de tous les pays, lieux et banlieues d'Allemagne avec des coordonnées GEO.
- Un lexique multilingue prend en charge les traductions.
Quels sont les avantages pour la mise en œuvre des projets ?
Rapidité de mise en œuvre / Délai de mise sur le marché
- Des exemples simples de génération de texte et des PoCs (Proof of Concepts) peuvent être implémentés rapidement. Ceci est rendu possible grâce à l'intégration transparente du système CMS et du module de génération de texte.
- Les environnements de développement basés sur le Web permettent de tester les textes générés en ligne à tout moment.
- Les modèles peuvent être édités simultanément par plusieurs utilisateurs.
- Pour des projets plus complexes, l'expérience montre que les modèles peuvent être créés et étendus au niveau du langage de programmation en une fraction du temps par rapport à la saisie des modèles dans des éditeurs syntaxiques.
Évolutivité des performances et de la taille des bases de données
- Grâce aux services cloud, la génération automatique de texte est évolutive à l'infini et génère plusieurs milliers de textes ou plus par seconde, selon les besoins.
- Lors de la génération de texte, un nombre illimité de bases de données peut être accédé simultanément. Par conséquent, les informations de base, par exemple sur les sites, les sociétés (boursières), les personnes, les associations, les pays, les stades, etc. peuvent facilement être utilisées pour la génération de texte.
- Pour des volumes de données extrêmement importants de l'ordre de plusieurs billions d'entrées, le moteur O4Store peut être réservé en option, ce qui permet d'obtenir un gain de performance pouvant atteindre un facteur 100 pour les requêtes de données.
Transparence
- Les redondances dans la programmation sont évitées en utilisant des bibliothèques de fonctions. Les applications de génération de texte sont donc faciles à maintenir et à étendre.
- Pendant le processus d'offre, tous les articles individuels jusqu'au prix du texte sont listés de manière transparente, c'est-à-dire qu'aucun texte généré n'est loué par le client mais acheté.
Capacité multilingue
- Il n'y a aucune restriction quant à la langue dans laquelle les textes doivent être générés. Dans notre projet 3dna.news, sponsorisé par Google DNI, nous présenterons des exemples de différents textes d'actualité dans les domaines de la météo, du sport, des finances et des événements dans les langues européennes les plus parlées.
Foire aux questions sur la production de textes en langage naturel
- Quelles techniques existe-t-il pour faire du langage écrit à partir de documents?
- A quoi ressemble le travail des programmeurs ou des linguistes dans le domaine de la génération automatique de texte?
- Comment le programme obtient-il les données nécessaires, qui devraient alors être dans le texte?
- Les journalistes sont censés être les mieux placés pour savoir comment un texte doit sonner.
- Pourquoi les applications de composition de texte sont-elles en demande aujourd'hui?
- Qu'est-ce qui a changé dans le journalisme?
- Quelle aide les éditeurs peuvent-ils attendre de la génération automatique de texte?
- Quand vaut-il la peine d'investir dans la technologie de génération de texte?
Technique and technology of automatic text generation
Quelles techniques existe-t-il pour faire du langage écrit à partir de documents?
Comment fonctionnent-ils en principe?
Essentiellement, une distinction est faite entre les méthodes basées sur la grammaire et les méthodes basées sur des modèles. D'après l'opinion de spécialistes éminents dans le domaine de la linguistique informatique, on peut supposer que les deux approches sont aussi puissantes l'une que l'autre. Il n'y a donc aucune restriction quant à la diversité linguistique, à l'expressivité, au type et à la portée des textes générés.
Les méthodes basées sur la grammaire, cependant, supposent que la grammaire complète pour chaque langue doit être stockée dans le logiciel de génération de texte ou rendue applicable et sont principalement conçues pour générer des textes phrase par phrase.
En revanche, le processus à base de modèles utilisé dans textOmatic*Composer vous permet de commencer immédiatement à générer des textes et d'augmenter l'expressivité des textes générés en continu en étendant les modèles. En outre, les parties de texte peuvent également être reliées syntaxiquement et au niveau du contenu au-delà des limites des phrases, des paragraphes et des chapitres par des moyens complémentaires dits de cohésion et de cohésion.
A quoi ressemble le travail des programmeurs ou des linguistes dans le domaine de la génération automatique de texte?
Quel genre d'experts peut apprendre à un ordinateur à "écrire"?
Selon l'état actuel de la technique, il n'est pas possible de générer automatiquement des textes de la plus haute qualité sur la base de l'apprentissage machine. Bien que les logiciels de traduction tels que Google Translate soient d'une grande aide pour les besoins pratiques, les traductions produites ne sont pas toujours parfaites. Les textes destinés à la publication devraient au mieux être exempts d'erreurs à 100%.
Le travail des développeurs de logiciels et des linguistes informatiques dans le domaine de la création de modèles pour la génération automatique de textes est essentiellement une activité de programmation (enseignement machine). Pour cette nouvelle profession, les termes concepteur de texte, concepteur de langage ou programmeur de texte sont les plus appropriés.
Une fois la structure de l'état définie, l'objectif est de concevoir les parties de texte de manière à obtenir le plus grand écart possible entre les textes (ooak = unique en son genre) et les moyens linguistiques utilisés. Entre autres choses, il faut créer des dictionnaires avec des listes de synonymes qui sont précisément adaptés au domaine d'application. L'objectif n'est pas seulement de générer des textes corrects, mais aussi d'éviter les ambiguïtés et les erreurs d'interprétation. La conception des textes implique également le choix des moyens et des styles linguistiques. Cela peut varier d'un point de vue factuel/sobre/scientifique/scientifique à inhabituel/colloquial/supprimé/ésotérique.
Comment le programme obtient-il les données nécessaires, qui devraient alors être dans le texte?
Dans de nombreux domaines, il existe des prestataires de services professionnels ou des autorités qui collectent régulièrement des données. Vous comptez ces données, par exemple les données financières, météorologiques et sportives. Les données peuvent généralement être obtenues via des interfaces XML. Pour chaque source de données, un module d'importation doit d'abord être développé, qui transfère les données à une base de données centrale. Une importation directe à partir de tableaux Excel ou de fichiers texte csv/tab est également possible.
De plus, les ressources de données externes telles que DBPedia, etc. peuvent être accédées directement via les protocoles Web sémantiques (RDF/OWL). Les informations qui y sont stockées peuvent être directement intégrées dans le processus de génération en tant qu'informations d'arrière-plan.
Les journalistes sont censés être les mieux placés pour savoir comment un texte doit sonner.
Les journalistes sont-ils en demande dans leur secteur?
En principe, chaque maison d'édition a son propre "langage maison". Cela peut même être spécifié dans les guides de style et les manuels. Même s'il apparaît à première vue que les textes générés dans un domaine d'application doivent varier peu en termes de style, dans la pratique, il est souvent nécessaire de satisfaire à une "diction" correspondante. Même le "suisse" doit être considéré comme une langue étrangère par rapport à l'allemand. Ici aussi, l'approche de génération basée sur des modèles offre de bien meilleures possibilités de répondre à ces exigences grâce à sa flexibilité.
Des métajournalistes et des spécialistes en langues sont nécessaires pour mettre en œuvre l'exigence en termes de style et participent à l'élaboration des règlements pertinents. Certains styles de rédaction sont nécessaires non seulement pour la rédaction de textes journalistiques, mais aussi pour les descriptions de produits ou les rapports d'activité qui sont destinés à atteindre un groupe cible ciblé avec un style de rédaction particulier. Dans ce cas, il faut des experts en marketing plutôt que des journalistes.
Utilisations
Pourquoi les applications de composition de texte sont-elles en demande aujourd'hui?
Les rapports et les messages doivent être rédigés rapidement, avec une grande pertinence et exactitude. En outre, ceux-ci doivent être adaptés aussi individuellement que possible au lecteur. Dans de nombreux domaines, la limite est rapidement atteinte et il n'est tout simplement plus possible pour un éditeur humain d'écrire des rapports dans la qualité requise dans le temps disponible. Par exemple, un rapport de 700 mots sur un indice boursier peut être généré en quelques secondes. L'écriture prendrait plus d'une demi-heure avec un rédacteur humain - mais le rapport est déjà depuis longtemps dépassé par l'actualité.
Qu'est-ce qui a changé dans le journalisme?
Pas grand-chose, tout d'abord. Cependant, il peut y avoir un petit secteur où de courts rapports et des messages de bénévoles et d'aides sont rédigés. Les programmes d'écriture peuvent prendre en charge ce domaine étape par étape. Le logiciel de génération automatique de texte sera également de plus en plus utilisé, par exemple pour générer des descriptions de produits. Ces domaines ne constituent de toute façon pas le travail journalistique proprement dit. C'est plutôt une "torture" pour les journalistes et les auteurs de devoir toujours écrire des textes selon le même schéma. De plus, il s'agit de la limite de coût au-delà de laquelle la création de textes par des auteurs humains devient tout simplement trop coûteuse. Surtout avec un grand nombre de cas, la limite est atteinte relativement rapidement, à partir de laquelle l'effort initial de programmation du logiciel de génération de texte s'avère payant.
Dans le métier de base du journalisme, cependant, tout restera le même pendant longtemps encore. Les rapports, les rapports d'information et les articles du feuilleton exigent un travail de recherche que les ordinateurs ne peuvent pas faire dans la mesure requise. A cet égard, la crainte des journalistes d'être réprimés par le journalisme robotisé est plutôt infondée.
Quelle aide les éditeurs peuvent-ils attendre de la génération automatique de texte?
Quels domaines d'application supplémentaires peuvent être ouverts par la génération automatique de texte?
Pour de nombreuses rédactions, l'un des principaux critères de succès est la visibilité et la portée des informations publiées en ligne. La quantité et la qualité de l'information jouent ici un rôle important. En ce qui concerne la visibilité dans les moteurs de recherche tels que Google, Bing, etc., cela dépend du meilleur classement. Pour survivre à la "guerre des gammes", il est nécessaire d'élargir considérablement la gamme de services par rapport à la concurrence et d'offrir un contenu plus original. La génération automatisée de messages peut y contribuer de manière significative. Mais il ne s'agit pas seulement de doubler ou de réprimer dans les résultats des moteurs de recherche. Au contraire, en fournissant de nouveaux types d'informations, des offres uniques peuvent être mises à disposition.
En plus des domaines d'application dans le journalisme et les médias en ligne, la composition de texte peut être utilisée pour tout type de génération de rapport. Cela comprend notamment la production de rapports annuels. Par exemple, plus de 50 % de tous les sites Web utilisent l'outil de suivi des données Google Analytics. Sur cette base, des rapports détaillés sur l'utilisation des sites Web et des recommandations sur les mesures à prendre qui en découlent peuvent être établis.
Le Moniteur fédéral électronique publie, entre autres, des annonces sur les comptes annuels des entreprises. Ces données peuvent également être interrogées automatiquement pour générer des rapports sur l'évolution financière des entreprises.
Les domaines d'application pour la génération automatique de texte sont très variés, mais dans chaque cas, il est supposé que les données sous-jacentes sont bien structurées et peuvent être lues dans la base de données utilisée pour la génération de texte via des interfaces ou des fonctions d'importation.
Quand vaut-il la peine d'investir dans la technologie de génération de texte?
Selon l'état de l'art, il n'existe aujourd'hui aucun programme qui génère des textes et des rapports sophistiqués et que l'on pourrait acheter " à la carte ". Lorsque l'utilisation de la technologie de génération automatique de texte est rentable, elle est décidée par le client potentiel lui-même. Une valeur ajoutée supplémentaire ou les coûts actuels du client pour la création de descriptions de produits, par exemple, sont comparés avec l'offre pour la génération automatique de texte afin de pouvoir prendre la décision pour ou contre un investissement.
Pour la préparation d'une offre relative à un projet sont nécessaires : Informations sur les besoins et vérification de la qualité des données