Domande frequenti sull'automazione dei testi e il giornalismo robotico
FPSU / punti vendita unici
Cosa distingue la nostra tecnologia dagli altri?
- Con il TCL (Text Composing Language) forniamo un linguaggio di programmazione per la generazione di testi basati su modelli, adatto anche ai professionisti della programmazione.
- Durante la generazione del testo, possiamo accedere contemporaneamente a qualsiasi numero di interfacce e database.
- Un'ampia libreria di funzioni costituisce la base per l'efficiente implementazione dei requisiti più complessi.
- Se necessario, la gamma linguistica può essere ampliata dall'utente stesso.
- Se sono necessarie grandi quantità di testo nel più breve tempo possibile, gli ambienti di produzione textOmatic*Composer possono essere utilizzati in sistemi cloud.
- Per i principali sistemi editoriali come DIALOG di Funkinform o Gogol Publishing, ci sono interfacce che consentono la consegna diretta delle notizie generate per la stampa e le pubblicazioni online.
- Le funzioni di interfaccia integrata a WhatsApp, Facebook Messenger ecc. consentono l'invio di messaggi iperpersonalizzati e l'implementazione di chat bot.
- Le landing page SEO automatizzate forniscono maggiore visibilità e portata.
Quale supporto c'è per l'implementazione di progetti di automazione testuale?
Come utente, avete la scelta:
- La realizzazione completa del vostro progetto di automazione dei testi da parte nostra, come servizio completo:
Insieme a noi, deve essere realizzata solo la fornitura dei testi generati nel vostro ambiente applicativo.
- La realizzazione completa del progetto da parte vostra:
Creiamo l'ambiente di sviluppo e vi supportiamo con la modellazione dei dati, l'implementazione di interfacce di importazione e, se necessario, la programmazione dei modelli. Offriamo corsi di formazione e workshop per l'utilizzo degli utensili.
- La realizzazione del vostro progetto di automazione dei testi come progetto cooperativo:
Se si desidera beneficiare di una rapida realizzazione del progetto e allo stesso tempo acquisire know-how sulla tecnologia, si consiglia questo approccio.
Vi supportiamo nella ricerca dei dati e nell'implementazione di interfacce di importazione.
- In aree quali Abbiamo già implementato interfacce di importazione con diversi fornitori di dati per il meteo, la finanza, lo sport e il traffico.
- Ci sono anche banche dati con informazioni di base da Wikipedia e directory di tutti i paesi, luoghi e periferie della Germania con coordinate GEO.
- Un lessico multilingue supporta le traduzioni.
Quali sono i vantaggi per l'attuazione dei progetti?
Velocità di implementazione / Time to Market
- Semplici esempi di generazione di testi e PoC (Proof of Concepts) possono essere implementati rapidamente. Ciò è reso possibile dalla perfetta integrazione del sistema CMS e del modulo di generazione di testo.
- Gli ambienti di sviluppo basati sul web permettono di testare i testi generati online in qualsiasi momento.
- I modelli possono essere modificati contemporaneamente da più utenti.
- Per progetti più complessi, l'esperienza dimostra che i modelli possono essere creati ed estesi a livello di linguaggio di programmazione in una frazione del tempo rispetto all'inserimento di modelli in editor basati sulla sintassi.
Scalabilità in termini di prestazioni e dimensioni del database
- Grazie ai servizi cloud, la generazione automatica di testi è scalabile all'infinito e genera diverse migliaia di testi al secondo o più, a seconda delle esigenze.
- Durante la generazione del testo è possibile accedere contemporaneamente a un numero qualsiasi di database. Pertanto, le informazioni di base, ad esempio su sedi, società (di borsa), persone, associazioni, paesi, paesi, stadi, ecc. possono essere facilmente utilizzate per la generazione di testi.
- Per volumi di dati estremamente grandi nell'ordine di miliardi di voci, il motore O4Store può essere prenotato come opzione, il che consente di ottenere un guadagno di prestazioni fino a un fattore 100 per le richieste di dati.
Trasparenza
- Le ridondanze nella programmazione sono evitate utilizzando le librerie di funzioni. Le applicazioni di generazione di testi sono quindi facili da mantenere ed estendere.
- Durante il processo di quotazione, tutte le singole voci fino al prezzo del testo sono elencate in modo trasparente, ad esempio, nessun testo generato viene affittato dal cliente ma acquistato.
Capacità multilingue
- Non ci sono restrizioni per quanto riguarda la lingua in cui i testi devono essere generati. Nel nostro progetto 3dna.news, sponsorizzato da Google DNI, mostreremo esempi di vari testi di notizie dai campi del meteo, dello sport, della finanza e degli eventi nelle lingue europee più diffuse.
Domande frequenti in relazione alla generazione di testi in linguaggio naturale
- Quali tecniche ci sono per rendere il linguaggio scritto a partire dai documenti?
- Come si presenta il lavoro dei programmatori o dei linguisti nel campo della generazione automatica del testo?
- Come fa il programma ad ottenere i dati necessari, che dovrebbero poi essere nel testo?
- I giornalisti dovrebbero sapere meglio di chiunque altro come dovrebbe suonare un testo.
- Perché oggi sono richieste le applicazioni per compositori di testi?
- Cosa è cambiato nel giornalismo?
- Quale supporto possono aspettarsi i redattori dalla generazione automatica del testo?
- Quando vale la pena investire nella tecnologia di generazione di testi?
Tecnica e tecnologia di generazione automatica del testo
Quali tecniche ci sono per rendere il linguaggio scritto a partire dai documenti?
Come funzionano in linea di principio?
In sostanza, si distingue tra metodi basati sulla grammatica e metodi basati su modelli. Secondo l'opinione di specialisti di primo piano nel campo della linguistica informatica, si può presumere che entrambi gli approcci siano ugualmente potenti. Non vi sono quindi restrizioni per quanto riguarda la diversità linguistica, l'espressività, il tipo e la portata dei testi generati.
I metodi basati sulla grammatica, tuttavia, presuppongono che la grammatica completa per ogni lingua debba essere memorizzata nel software di generazione del testo o resa applicabile e sono progettati principalmente per generare testi frase per frase.
Al contrario, il processo basato su modelli utilizzato in textOmatic*Composer permette di iniziare immediatamente a generare testi e di aumentare l'espressività dei testi generati in modo continuo estendendo i modelli. Inoltre, le parti di testo possono anche essere collegate sintatticamente e contenutisticamente al di là dei confini di frase, paragrafo e capitolo per mezzo dei cosiddetti mezzi supplementari di coesione e coesione.
Come si presenta il lavoro dei programmatori o dei linguisti nel campo della generazione automatica del testo?
Che tipo di esperti possono insegnare ad un computer a "scrivere"?
Secondo l'attuale stato dell'arte, non è possibile generare automaticamente testi di altissima qualità sulla base dell'apprendimento automatico. Anche se un software di traduzione come Google Translate è di grande aiuto per le esigenze pratiche, le traduzioni prodotte non sono sempre impeccabili. I testi destinati alla pubblicazione dovrebbero al massimo essere privi di errori al 100%.
Il lavoro degli sviluppatori di software e dei linguisti informatici nel campo della creazione di modelli per la generazione automatica del testo è essenzialmente un'attività di programmazione (machine teaching). Per questa nuova professione, i termini text designer, language designer o programmatore di testi sono i più appropriati.
Una volta definita la struttura di un rapporto, l'obiettivo è quello di progettare le parti di testo in modo tale da ottenere la massima varianza possibile tra i testi (ooak = unico nel suo genere) e i mezzi linguistici utilizzati. Tra le altre cose, devono essere creati dizionari con elenchi di sinonimi che siano esattamente adattati al campo di applicazione. L'obiettivo non è solo quello di generare testi corretti, ma anche di evitare ambiguità e interpretazioni errate. Il design del testo prevede anche la scelta dei mezzi linguistici e degli stili. Questo può variare dalla materia di fatto/sober/scientificamente a insolito/colloquiale/rimosso/esoterico.
Come fa il programma ad ottenere i dati necessari, che dovrebbero poi essere nel testo?
In molti settori ci sono fornitori di servizi professionali o autorità che raccolgono regolarmente i dati. Contieni questi dati, ad es. dati finanziari, meteorologici e sportivi. I dati possono essere ottenuti solitamente tramite interfacce XML. Per ogni fonte di dati deve prima essere sviluppato un modulo di importazione, che trasferisce i dati in una banca dati centrale. È inoltre possibile l'importazione diretta da tabelle Excel o da file di testo csv/tab-text.
Inoltre, risorse di dati esterne come DBPedia, ecc. sono accessibili direttamente tramite i Semantic Web Protocols (RDF/OWL). Le informazioni ivi memorizzate possono essere integrate direttamente nel processo di generazione come informazioni di base.
I giornalisti dovrebbero sapere meglio di chiunque altro come dovrebbe suonare un testo.
I giornalisti sono richiesti nel loro settore?
In linea di principio, ogni casa editrice ha il proprio "linguaggio domestico". Questo può anche essere specificato in guide di stile e manuali. Anche se inizialmente sembra che i testi generati in un'area di applicazione dovrebbero variare poco in termini di stile, in pratica ci sono spesso requisiti per soddisfare una "dizione" corrispondente. Anche lo "svizzero" deve essere trattato come una lingua straniera per quanto riguarda il tedesco. Anche in questo caso, grazie alla sua flessibilità, l'approccio di generazione basato su modelli ha possibilità decisamente migliori per far fronte a queste esigenze.
I metagiornalisti e gli specialisti linguistici sono necessari per implementare il requisito in termini di stile e sono coinvolti nello sviluppo delle relative normative. Alcuni stili di scrittura sono necessari non solo per la scrittura di testi giornalistici, ma anche per descrizioni di prodotti o rapporti commerciali che sono destinati a raggiungere un gruppo target mirato con un particolare stile di scrittura. In questo caso sono necessari esperti di marketing piuttosto che giornalisti.
Impieghi
Perché oggi sono richieste le applicazioni per compositori di testi?
Le relazioni e i messaggi devono essere scritti prontamente e con la massima pertinenza e correttezza. Inoltre, questi devono essere adattati al lettore nel modo più individuale possibile. In molte aree si raggiunge rapidamente il limite per cui non è più possibile per un editore umano scrivere rapporti nella qualità richiesta nel tempo a disposizione. Ad esempio, un rapporto di 700 parole su un indice azionario può essere generato in pochi secondi. La scrittura richiederebbe più di mezz'ora con un editore umano - tuttavia il rapporto è già da tempo superato dall'attualità.
Cosa è cambiato nel giornalismo?
Non molto, prima di tutto. Tuttavia, ci può essere una piccola area dove vengono scritti brevi rapporti e messaggi da parte di volontari e aiutanti. I programmi di scrittura possono occupare questo settore passo dopo passo. Anche il software di generazione automatica dei testi verrà utilizzato sempre più spesso, ad esempio per generare descrizioni dei prodotti. Queste aree non costituiscono comunque il vero e proprio lavoro giornalistico. Per i giornalisti e gli autori è piuttosto una "tortura" dover sempre scrivere testi secondo lo stesso schema. Inoltre, si tratta del limite di costo oltre il quale la creazione di testi di autori umani diventa semplicemente troppo costosa. Soprattutto con un gran numero di casi, il limite viene raggiunto in tempi relativamente brevi e lo sforzo iniziale per la programmazione del software di generazione del testo viene ripagato.
Nel core business del giornalismo, tuttavia, tutto rimarrà lo stesso per molto tempo a venire. Le relazioni, le relazioni di fondo e gli articoli del feuilleton richiedono un lavoro di ricerca che i computer non possono fare nella misura richiesta. In questo senso, la paura dei giornalisti di essere repressi dal giornalismo robotico è piuttosto infondata.
Quale supporto possono aspettarsi i redattori dalla generazione automatica del testo?
Quali altri campi di applicazione possono essere aperti con la generazione automatica del testo?
Per molte redazioni, uno dei criteri chiave di successo è la visibilità e la portata delle notizie pubblicate online. La quantità e la qualità delle informazioni gioca un ruolo importante in questo senso. Per quanto riguarda la reperibilità nei motori di ricerca come Google, Bing, ecc. dipende dal miglior posizionamento. Per sopravvivere alla "guerra della gamma", è necessario ampliare significativamente la gamma dei servizi rispetto ai concorrenti e offrire contenuti più originali. La generazione automatizzata di messaggi può dare un contributo significativo in tal senso. Ma non si tratta solo di sorpassare o reprimere nei risultati dei motori di ricerca. Piuttosto, fornendo nuovi tipi di informazioni, è possibile mettere a disposizione offerte uniche.
Oltre alle aree di applicazione del giornalismo e dei media online, la composizione di testi può essere utilizzata per qualsiasi tipo di generazione di report. In particolare, ciò include l'elaborazione di relazioni annuali. Ad esempio, ben oltre il 50% di tutti i siti web utilizza lo strumento di monitoraggio dei dati Google Analytics. Su questa base, possono essere generati rapporti completi sull'uso dei siti web con le raccomandazioni per le azioni che ne derivano.
Il Foglio federale elettronico pubblica, tra l'altro, annunci sui conti annuali delle società. Questi dati possono anche essere interrogati automaticamente per generare rapporti sullo sviluppo finanziario delle aziende.
I campi di applicazione per la generazione automatica del testo sono molto versatili, ma in ogni caso si presume che i dati sottostanti siano ben strutturati e possano essere letti nel database utilizzato per la generazione del testo tramite interfacce o funzioni di importazione.
Quando vale la pena investire nella tecnologia di generazione di testi?
Secondo lo stato dell'arte, oggi non ci sono programmi che generano testi e rapporti sofisticati e che potrebbero essere acquistati "fuori dai guai". Quando l'utilizzo della tecnologia di generazione automatica di testi viene deciso dal potenziale cliente stesso. Un valore aggiunto aggiuntivo o i costi attuali del cliente per la creazione, ad esempio, di descrizioni di prodotti vengono confrontati con l'offerta per la generazione automatica del testo, in modo da poter prendere la decisione a favore o contro un investimento.
Per la preparazione di un'offerta relativa al progetto sono necessari: Informazioni sulle esigenze e verifica della qualità dei dati.