Bienvenue dans la Générothèque

La Générothèque est une bibliothèque de modèles permettant de prédire le « genre » ou d'autres formes de classification de texte, d'images ou d'autres structures éditoriales. Les modèles peuvent être réutilisés pour classer de nouveaux corpus avec Tidysupervise. La générothèque donne également accès aux corpus d'entraînement s'ils sont dans le domaine public ou sous licence libre ce qui permet d'entraîner de nouveaux modèles.
La Générothèque est une initiative du projet Numapresse, initialement développé dans le cadre d'un programme précis : la classification des genres journalistiques des quotidiens nationaux français au XIXe siècle et au début du XXe siècle. Depuis le projet a pris de l'ampleur et s'est élargi à d'autres corpus, d'autres périodes et, surtout, à de nouveaux objets en dehors des textes