Il corpus DIADIta è un corpus diacronico di testi in lingua italiana che consente di indagare un ampio spettro di fenomeni pragmatici nelle diverse fasi della lingua, ma soprattutto di osservare le relazioni esistenti tra diversi fenomeni o categorie pragmatiche e come queste relazioni cambino nel tempo. Contiene testi composti tra il XIII e il XX secolo appartenenti ai generi testuali che imitano o riproducono più fedelmente l’interazione parlata, ovvero il testo teatrale, ma anche il romanzo e la novella (l’annotazione linguistica riguarda, per romanzi e novelle, le sole parti dialogiche).
Al momento, i testi già disponibili per la consultazione attraverso l’interfaccia online sono cinque (l’elenco delle opere e delle edizioni di riferimento utilizzate è consultabile qui); altri testi verranno aggiunti nel corso del progetto, incrementando l’ampiezza del corpus.
L’annotazione del corpus DIADIta è stata condotta manualmente e comprende 60 categorie, organizzate su 5 livelli:
Forme. Espressioni linguistiche di varia natura ed estensione che assumono una funzione pragmatica particolarmente rilevante sul piano interazionale: segnali discorsivi, ripetizioni, espressivi.
Funzioni pragmatiche. Categorie accomunate dal fatto di avere (anche, o esclusivamente) una valenza pragmatica legata alle intenzioni comunicative del parlante, ad es. (s)cortesia, mitigazione, vaghezza intenzionale, manifestazione di accordo o disaccordo, epistemicità.
Finalità pragmatiche. Categorie accomunate dal fatto di avere (anche, o esclusivamente) una valenza pragmatica legata soprattutto alla reazione che il parlante intende produrre nell’interlocutore, ad es. richiamo dell’attenzione, richiesta di conferma o accordo.
Atti linguistici. Sono stati annotati più di trenta tipi di atti linguistici (direttivi, espressivi, commissivi o assertivi) tra quelli che hanno maggiore rilevanza a livello interazionale, ad es. rimprovero, ringraziamento, scusa, richiesta.
Genere del parlante. Questo livello di annotazione sociolinguistico distingue tra discorso pronunciato da personaggi femminili o maschili.
Per un elenco completo delle categorie annotate, comprensivo di definizioni, esempi e ulteriori dettagli sul processo di annotazione, si rimanda alle Linee guida per l’annotazione del corpus DIADIta.
Indicazioni più precise su come esplorare il corpus sono contenute nella Guida utente.
Licenza d’uso: Nel rispetto della licenza Creative Commons – Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0), in caso di pubblico riutilizzo dei dati annotati è doveroso citare il corpus DIADIta come fonte. È vietata ogni forma di riutilizzo a scopo commerciale. Se i dati esportati vengono modificati o riutilizzati, devono essere distribuiti con la medesima licenza.





