WP6: Tekst
Werkpakket 6 richt zich op data en tools voor onderzoekers uit de literatuurwetenschappen, geschiedenis, filosofie, theologie en religiestudies, en op andere onderzoekers die tekstuele gegevens gebruiken.
Werkpakket 6 werkt toe naar een online omgeving waarin onderzoekers met hun teksten kunnen werken in alle mogelijke fasen van hun onderzoek. Het heeft tot doel data, tools en handleidingen te bieden voor een breed scala aan taken: handgeschreven tekstherkenning, optische tekenherkenning, tagging van spraakgedeelten voor historisch en hedendaags Nederlands, het voorbereiden van een wetenschappelijke editie van teksten, het annoteren van tekst, teksten analyseren met computationele stilistische tools, en nog veel meer.
Omdat Werkpakket 6 pas in 2019 aan CLARIAH is toegevoegd, zijn er nog niet veel data en tools beschikbaar. De infrastructureel-technische uitdaging voor werkpakket 6 is om bestaande middelen (zoals die beschikbaar zijn via Nederlab, om maar één voorbeeld te noemen) op een manier aan te bieden die geschikt is voor hergebruik door willekeurige tekstanalysetools. Bovendien is verspreiding door middel van documentatie en instructie belangrijk in werkpakket 6. Digitale gegevens en hulpmiddelen zullen moeten worden voorzien van voldoende documentatie en trainingsmateriaal om onderzoekers op elk niveau van "digitale geletterdheid" kansen te bieden. Duidelijk maken wat wel en niet mogelijk is met de beschikbare data en wat computerhulpmiddelen wel en niet kunnen, is een belangrijk onderwerp.