Tel.: +49 (0)231 476 471 25

info@textOmatic.ag

FAQ's over tekstautomatisering en robotjournalistiek

LUD's / unique selling points

 

Wat onderscheidt onze technologie van anderen?

  • Met TCL (Text Composing Language) bieden wij een programmeertaal voor het genereren van sjablonen, die ook geschikt is voor programmeurs.
  • Tijdens het genereren van tekst hebben we toegang tot een willekeurig aantal interfaces en databases tegelijk.
  • Een uitgebreide bibliotheek van functies vormt de basis voor de efficiënte implementatie van de meest complexe eisen.
  • Indien nodig kan het taalbereik door de gebruiker zelf worden uitgebreid.
  • Als er in de kortst mogelijke tijd extreem grote hoeveelheden tekst nodig zijn, kunnen de tekstOmatic*Composer productieomgevingen in cloudsystemen worden gebruikt.
  • Voor toonaangevende redactionele systemen zoals DIALOG van Funkinform of Gogol Publishing zijn er interfaces die de directe levering van gegenereerd nieuws voor drukwerk en online publicaties mogelijk maken.
  • Geïntegreerde interfacefuncties naar WhatsApp, Facebook Messenger, etc. maken het verzenden van hyperpersoonlijke berichten en de implementatie van chat bots mogelijk.
  • Geautomatiseerde SEO-landingspagina's bieden meer zichtbaarheid en bereik.

 

Welke ondersteuning is er voor de implementatie van tekstautomatiseringsprojecten?

Als gebruiker heeft u de keuze:

  • De volledige realisatie van uw tekstautomatiseringsproject door ons, als een full service:
    Samen met ons hoeft alleen de levering van de gegenereerde teksten in uw applicatie-omgeving te worden gerealiseerd.
     
  • De complete projectrealisatie door u zelf:
    We zetten de ontwikkelomgeving op en ondersteunen u met datamodellering, implementatie van importinterfaces en desgewenst het programmeren van sjablonen. Wij bieden trainingen en workshops aan voor het gebruik van gereedschappen.
     
  • De realisatie van uw tekstautomatiseringsproject als samenwerkingsproject:
    Als u wilt profiteren van een snelle projectimplementatie en tegelijkertijd kennis over de technologie wilt verwerven, is deze aanpak aan te bevelen.

Wij ondersteunen u met gegevensonderzoek en de implementatie van importinterfaces.

  • In gebieden zoals We hebben al importinterfaces geïmplementeerd naar verschillende dataleveranciers voor weer, financiën, sport en verkeer.
  • Er zijn ook databanken met achtergrondinformatie van Wikipedia, alsmede directories van alle landen, plaatsen en voorsteden in Duitsland met GEO-coördinaten.
  • Een meertalig lexicon ondersteunt vertalingen.

 

Wat zijn de voordelen voor de uitvoering van de projecten?

Snelheid van implementatie / time-to-market

  • Eenvoudige tekstgeneratie voorbeelden en PoC's (Proof of Concepts) kunnen snel worden geïmplementeerd.  Dit wordt mogelijk gemaakt door de naadloze integratie van CMS-systeem en tekstgeneratiemodule.
  • Web-based ontwikkelomgevingen maken het mogelijk om de gegenereerde teksten op elk moment online te testen.
  • De sjablonen kunnen door meerdere gebruikers tegelijk worden bewerkt.
  • Voor complexere projecten leert de ervaring dat sjablonen op het niveau van de programmeertaal in een fractie van de tijd kunnen worden aangemaakt en uitgebreid in vergelijking met het invoeren van sjablonen in syntaxgedreven editors.

Schaalbaarheid in prestaties en databasegrootte

  • Met cloud services is automatische tekstgeneratie oneindig schaalbaar en genereert meerdere duizenden teksten per seconde, afhankelijk van de behoefte.
  • Tijdens het genereren van tekst kan een willekeurig aantal databases tegelijkertijd worden benaderd. Daarom kan achtergrondinformatie, bijvoorbeeld over locaties, (beurs)bedrijven, personen, verenigingen, landen, stadions, etc., gemakkelijk worden gebruikt voor het genereren van tekst.
  • Voor extreem grote datavolumes in de orde van grootte van triljoenen inzendingen kan de O4Store motor optioneel worden geboekt, wat een prestatiewinst van maximaal een factor 100 oplevert voor datavragen.

Doorzichtigheid

  • Ontsporingen in de programmering worden vermeden door gebruik te maken van functiebibliotheken. De tekstgeneratietoepassingen zijn daarom eenvoudig te onderhouden en uit te breiden.
  • Tijdens het offerteproces worden alle afzonderlijke artikelen tot en met de tekstprijs op een transparante manier vermeld, bijv. geen gegenereerde teksten worden door de klant gehuurd, maar gekocht.

Meertalig vermogen

  • Er zijn geen beperkingen ten aanzien van de taal waarin de teksten moeten worden gegenereerd. In ons project 3dna.news, gesponsord door Google DNI, tonen we voorbeelden van diverse nieuwsberichten op het gebied van weer, sport, financiën en evenementen in de meest gesproken Europese talen.

Veelgestelde vragen in verband met het genereren van natuurlijke taalteksten


Techniek en technologie van automatische tekstgeneratie

Welke technieken zijn er om van archiefdocumenten geschreven taal te maken?

Hoe werken ze in principe?

In wezen wordt er een onderscheid gemaakt tussen grammaticale en template-gebaseerde methoden. Volgens de mening van vooraanstaande specialisten op het gebied van computerlinguïstiek kan worden aangenomen dat beide benaderingen even krachtig zijn. Er zijn dus geen beperkingen met betrekking tot de taaldiversiteit, de uitdrukkingskracht en het type en de reikwijdte van de gegenereerde teksten.

Grammaticamethoden gaan er echter van uit dat de volledige grammatica voor elke taal moet worden opgeslagen in de tekstgeneratiesoftware of toepasbaar moet worden gemaakt en in de eerste plaats bedoeld zijn om teksten zin voor zin te genereren.

Het template-based proces dat in textOmatic*Composer wordt gebruikt, stelt u daarentegen in staat om onmiddellijk te beginnen met het genereren van teksten en de expressiviteit van de gegenereerde teksten continu te verhogen door de sjablonen uit te breiden. Daarnaast kunnen tekstdelen ook syntactisch en inhoudelijk aan elkaar worden gekoppeld buiten zin, paragraaf en hoofdstukgrenzen door middel van zogenaamde cohesie en samenhangende aanvullende middelen.


Hoe ziet het werk van programmeurs of linguïsten eruit op het gebied van automatische tekstgeneratie?

Wat voor soort experts kunnen een computer leren "schrijven"?

Volgens de huidige stand van de techniek is het niet mogelijk om automatisch gegenereerde teksten van de hoogste kwaliteit te genereren op basis van machinaal leren. Hoewel vertaalsoftware zoals Google Translate een grote hulp is voor praktische behoeften, zijn de geproduceerde vertalingen niet altijd vlekkeloos. Teksten die bestemd zijn voor publicatie dienen in het beste geval 100% vrij van fouten te zijn.

Het werk van de software-ontwikkelaars en computerlinguïsten op het gebied van het maken van sjablonen voor het automatisch genereren van tekst is in wezen een programmeeractiviteit (machine teaching). Voor dit nieuwe beroep zijn de termen tekstontwerper, taalontwerper of tekstprogrammeur het meest geschikt.

Zodra een rapportstructuur is gedefinieerd, is het doel om de tekstdelen zo te ontwerpen dat de grootst mogelijke variatie wordt bereikt tussen de teksten (ooak = one-of-a-kind) en de gebruikte taalmiddelen. Er moeten onder andere woordenboeken met synoniemenlijsten worden gemaakt die precies zijn afgestemd op het toepassingsdomein. Het doel is niet alleen om correcte teksten te genereren, maar ook om dubbelzinnigheden en verkeerde interpretaties te voorkomen. Tekstontwerp houdt ook de keuze van taalmiddelen en stijlen in. Dit kan variëren van zakelijk/nober/wetenschappelijk tot ongewoon/colloquiaal/verwijderd/esoterisch.


Hoe krijgt het programma de nodige gegevens, die dan in de tekst moeten staan?

Op veel gebieden zijn er professionele dienstverleners of autoriteiten die regelmatig gegevens verzamelen. U telt deze gegevens, bijv. financiële, weer- en sportgegevens. De gegevens kunnen gewoonlijk via XML-interfaces worden verkregen. Voor elke gegevensbron moet eerst een importmodule worden ontwikkeld, die de gegevens overbrengt naar een centrale database. Een directe import uit Excel-tabellen of csv/tab-tekstbestanden is ook mogelijk.

Bovendien kunnen externe gegevensbronnen zoals DBPedia enz. rechtstreeks worden benaderd via Semantic Web Protocols (RDF/OWL). De daar opgeslagen informatie kan direct als achtergrondinformatie in het generatieproces worden geïntegreerd.


Journalisten zouden het beste weten hoe een tekst moet klinken.

Is er vraag naar journalisten in hun branche?

In principe heeft elke uitgeverij zijn eigen "huistaal". Dit kan zelfs worden gespecificeerd in stijlgidsen en handleidingen. Zelfs als in eerste instantie blijkt dat de gegenereerde teksten in een toepassingsgebied weinig van stijl zouden moeten verschillen, zijn er in de praktijk vaak eisen om aan een overeenkomstige "dictie" te voldoen. Zelfs "Zwitsers" moet worden behandeld als een vreemde taal ten opzichte van het Duits. Ook hier heeft de op sjablonen gebaseerde generatiebenadering door haar flexibiliteit aanzienlijk betere mogelijkheden om aan deze eisen te voldoen.

Meta-journalisten en taalspecialisten zijn nodig om de eisen op het gebied van stijl te implementeren en zijn betrokken bij de ontwikkeling van de relevante regelgeving. Bepaalde schrijfstijlen zijn niet alleen vereist bij het schrijven van journalistieke teksten, maar ook voor productbeschrijvingen of zakelijke rapporten die bedoeld zijn om een gerichte doelgroep met een bepaalde schrijfstijl te bereiken. In dit geval zijn marketingdeskundigen in plaats van journalisten nodig.


Gebruiksmogelijkheden

Waarom is er vandaag de dag vraag naar tekstcomponistentoepassingen?

Rapporten en berichten moeten onmiddellijk worden geschreven met een hoge relevantie en correctheid. Bovendien moeten deze zo individueel mogelijk op de lezer worden afgestemd. In veel gebieden wordt de grens snel bereikt waarbij het voor een menselijke redacteur eenvoudigweg niet meer mogelijk is om binnen de beschikbare tijd rapporten in de vereiste kwaliteit te schrijven. Bijvoorbeeld, een rapport van 700 woorden over een aandelenindex kan binnen enkele seconden worden gegenereerd. Het schrijven zou meer dan een half uur in beslag nemen met een menselijke redacteur - maar het rapport is dan al lang achterhaald door de actualiteit.


Wat is er veranderd in de journalistiek?

Niet veel, in de eerste plaats. Er kan echter een klein gebied zijn waar korte verslagen en berichten van vrijwilligers en helpers worden geschreven. De schrijfprogramma's kunnen dit gebied stap voor stap overnemen. De automatische tekstgeneratiesoftware zal ook steeds meer worden gebruikt, bijvoorbeeld om productbeschrijvingen te genereren. Deze gebieden vormen sowieso niet het eigenlijke journalistieke werk. Het is eerder een "marteling" voor journalisten en auteurs om altijd teksten op te schrijven volgens hetzelfde schema. Bovendien gaat het om de kostengrens waarboven het maken van teksten door menselijke auteurs gewoonweg te duur wordt. Vooral bij grote aantallen gevallen wordt de grens relatief snel bereikt, waarbij de aanvankelijke inspanning voor het programmeren van de tekstgeneratiesoftware loont.

In de kernactiviteit van de journalistiek zal alles echter nog lang hetzelfde blijven. Rapporten, achtergrondrapporten en artikelen in het feuilleton vereisen onderzoekswerk dat computers niet in de vereiste mate kunnen doen. In dit opzicht is de angst van journalisten om onderdrukt te worden door robotjournalistiek nogal ongegrond.


Welke ondersteuning kunnen redacteuren verwachten van automatische tekstgeneratie?

Welke extra toepassingsgebieden kunnen worden geopend door automatische tekstgeneratie?

Voor veel redactiekantoren is een van de belangrijkste succescriteria de zichtbaarheid en het bereik van het online gepubliceerde nieuws. Zowel de kwantiteit als de kwaliteit van de informatie speelt hierbij een belangrijke rol. Met betrekking tot vindbaarheid in zoekmachines zoals Google, Bing, etc., het hangt af van de beste rankings. Om de "range war" te overleven, is het noodzakelijk om het dienstenaanbod aanzienlijk uit te breiden in vergelijking met de concurrentie en om meer originele inhoud aan te bieden. Geautomatiseerde berichtgeving kan hier een belangrijke bijdrage aan leveren. Maar het gaat niet alleen om het inhalen of onderdrukken in de zoekmachine resultaten. In plaats daarvan kunnen door het verstrekken van nieuwe soorten informatie unieke aanbiedingen beschikbaar worden gesteld.

Naast de toepassingsgebieden in de journalistiek en online media, kan tekstcompositie worden gebruikt voor elk type rapportgeneratie. Dit omvat in het bijzonder het opstellen van jaarverslagen. Zo maakt bijvoorbeeld meer dan 50% van alle websites gebruik van de datatrackingtool Google Analytics. Op basis hiervan kunnen uitgebreide rapporten over het gebruik van de websites met aanbevelingen voor actie worden gegenereerd.

De elektronische Staatscourant publiceert onder andere aankondigingen over de jaarrekeningen van ondernemingen. Deze gegevens kunnen ook automatisch worden opgevraagd om rapporten te genereren over de financiële ontwikkeling van de bedrijven.

De toepassingsgebieden voor het automatisch genereren van tekst zijn zeer veelzijdig, maar in elk geval wordt ervan uitgegaan dat de onderliggende gegevens goed gestructureerd zijn en kunnen worden ingelezen in de database die gebruikt wordt voor het genereren van tekst via interfaces of importeerfuncties.


Wanneer is het de moeite waard om te investeren in tekstgeneratietechnologie?

Volgens de stand van de techniek zijn er vandaag de dag geen programma's die geavanceerde teksten en rapporten genereren en die "off the peg" gekocht kunnen worden. Wanneer het gebruik van de automatische tekstgeneratietechnologie de moeite waard is, wordt dit door de potentiële klant zelf bepaald. Een extra toegevoegde waarde of de huidige kosten van de klant voor het maken van bijvoorbeeld productbeschrijvingen worden vergeleken met het aanbod voor de automatische tekstgeneratie om de beslissing voor of tegen een investering te kunnen nemen.

Voor de voorbereiding van een projectgerelateerde offerte is een offerte nodig: Informatie over de behoeften en controle van de kwaliteit van de gegevens


 
ontlg4us 2024-11-21 wid-1943 drtm-bns 2024-11-21