Rivista "IBC" IX, 2001, 3

Dossier: Messinscena... in video e in linea

biblioteche e archivi, dossier /

Thesaurus teatrale / 2

Antonio Tolo
[Biblioteca comunale di Bellaria - Igea Marina (Rimini)]

1. PRINCIPI GENERALI

Il Thesaurus teatrale (d'ora in poi indicato come TT), come tutti i thesauri, è un vocabolario controllato di termini di indicizzazione derivati dal linguaggio naturale, il cui controllo si articola in due ambiti tra loro collegati: sulla loro forma e sulla loro accettabilità come termini di indicizzazione (controllo morfologico); sulla struttura del vocabolario e la sua organizzazione semantica e classificatoria.

I principi e i criteri su cui si basa il TT si ispirano allo standard internazionale corrente ISO 2788-1986 Guidelines for the establishment and development of monolingual thesauri. Il riferimento a ISO 2788-1986 rende evidente anche la scelta del thesaurus quale strumento di controllo terminologico più idoneo in un contesto tecnologicamente avanzato quale quello in cui sarà applicato il TT.


2. CONTROLLO MORFOLOGICO

Il controllo morfologico tende ad assicurare l'omogeneità del linguaggio dal punto di vista formale, facendo sì che la forma dei termini dipenda da criteri certi e stabili. Le due aree più importanti di applicazione dei principi morfologici sono quelle del numero, e del trattamento dei termini composti. Inoltre questo tipo di controllo definisce quali tipi di termini (di solito sostantivi o equivalenti) sono accettabili come voci di indicizzazione e come devono o possono essere trattati gli altri tipi (aggettivi, verbi ecc.).

Problema di tipo morfologico è anche la gestione dei nomi propri e delle classi di uno (la loro forma: punteggiatura interna, uso di qualificatori o di elementi di disambiguazione; la loro posizione nella stringa). Infine sono principi morfologici quelli che regolano sia l'uso dei simboli e dei segni di interpunzione interni al singolo termine, sia le modalità per distinguere termini polisemi e omografi, cioè per disambiguare termini che hanno la stessa forma linguistica.

L'omogeneità del vocabolario è un prerequisito fondamentale sia per garantire una base solida alle operazioni classificatore necessarie nel controllo del vocabolario, sia per la sintassi. In particolare, le scelte riguardanti la scomposizione dei termini composti influiscono in maniera determinante sulle dimensioni del vocabolario e sulla sua complessità.


2.1. Uso di plurale e singolare

L'uso di singolare e plurale è estremamente importante in un linguaggio di indicizzazione e non è pensabile lasciare al caso l'uso di una delle due forme di un termine.1 Occorre fissare (e seguire) dei principi certi e predefiniti per garantire al thesaurus la necessaria omogeneità e dar modo a chi lo usa di apportare coerentemente le eventuali integrazioni e modifiche. Per il TT si è scelto di esprimere i termini sia al singolare che nella forma plurale seguendo i principi della numerabilità e dell'appartenenza categoriale del termine.


2.1.1. Principio della numerabilità

Il principio base per la scelta della forma singolare o plurale è quello della numerabilità:

si usa il plurale per i termini che rappresentano concetti numerabili, che cioè si possono contare e che quindi rispondono alla domanda "quanti?"; si usa, invece, il singolare per i termini che non sono numerabili, (per esempio: Teatro musicale) o che esprimono concetti astratti (per esempio: Acustica).

Il pregio maggiore di questo principio è la sua chiarezza e semplicità; purtroppo sussistono molti condizionamenti (culturali, linguistici, semantici ecc.) che ne rendono l'applicazione meno trasparente di quanto sarebbe desiderabile. Dunque è stato indispensabile ricorrere ad altri criteri che facilitino l'applicazione del principio della numerabilità e consentano il più possibile di ricondurre le eccezioni alla regola o a casi particolari della regola. Un caso tipico di condizionamento linguistico e culturale è legato all'uso di parole straniere entrate nel lessico in una determinata forma, e alle quali non ci sembra congruo applicare il principio della numerabilità.


2.1.2. Appartenenza categoriale dei termini

Il principio della numerabilità, prima di essere applicato al singolo termine, è applicato al vocabolario nel suo insieme, ossia alle categorie nelle quali è organizzato. Si avranno così categorie tendenzialmente plurali e categorie tendenzialmente singolari, sempre in riferimento al principio della numerabilità.

Categorie tendenzialmente plurali:

- Aree

- Avvenimenti

- Istituzioni

- Oggetti (attrezzature, strumenti, strutture, documenti)

- Persone

Categorie tendenzialmente singolari:

- Attività, discipline, processi

- Credenze e sistemi ideologici

- Materia (sostanze, materiali)

- Proprietà, caratteristiche, condizioni

- Tempo

Sulla base di questa distinzione si può formulare il criterio del numero della categoria nel modo seguente:

in linea di massima, in caso di dubbio tra la forma singolare o plurale di un termine, si dà la precedenza al numero che è tipico della categoria di appartenenza. Per esempio: se il dubbio riguarda la scelta tra Menestrello e Menestrelli, si adotterà il plurale, poiché la categoria delle persone è normalmente al plurale.

Un caso a parte è quello dei nomi propri, o dei termini che contengono nomi propri, che vanno nel numero che è loro proprio, che può essere singolare ([1] Actors' Studio) o plurale ([2] Balletti Svedesi).2


2.1.3. Uso delle due forme per lo stesso lemma

La scelta di utilizzare nel TT sia il plurale che il singolare, in alternativa all'uso del solo singolare, ha il vantaggio di permettere l'impiego delle due forme per uno stesso lemma. Si tratta di una pratica molto diffusa, accettata nella quasi totalità dei linguaggi documentari, che però non sempre è regolamentata da criteri rigorosi. Al fine di assicurare uniformità e coerenza a tale pratica è opportuno fare riferimento al criterio dello scostamento categoriale, che può essere enunciato nel modo seguente:

la compresenza nello stesso vocabolario delle due forme, la plurale e la singolare, per uno stesso lemma, è possibile solo se il cambiamento di numero produce uno scostamento categoriale, ossia se i concetti rappresentati dalle due forme appartengono a due diverse categorie.

Esempi:

[3] Fotografia (nel senso della tecnica)

Fotografie (nel senso degli oggetti)

[4] Memoria (nel senso della proprietà)

Memorie (nel senso dei documenti)

Tali esempi, anche se rappresentano due casi sensibilmente diversi tra loro dal punto di vista della struttura del vocabolario, in quanto la prima coppia è legata da una relazione associativa molto stretta, mentre la seconda no, mostrano che le due forme di ciascun lemma hanno significati chiaramente distinti, dove il criterio di distinzione non può essere che l'appartenenza a due diverse categorie.3


2.1.4. Criteri empirici

Quando non si è potuto dirimere una questione circa l'uso del singolare o del plurale, si è fatto ricorso a criteri empirici (ad esempio simulando le modalità di accesso all'informazione da parte degli utenti; oppure la vicinanza di una forma a quella impiegata in letteratura o nel linguaggio naturale, ecc.). Questi criteri sono stati comunque usati con cautela, caso per caso, senza essere generalizzati.


2.2. Termini composti

Per ridurre la complessità dei termini di indicizzazione la norma ISO 2788 stabilisce "che i termini dovrebbero rappresentare concetti semplici o unitari e che i termini composti dovrebbero essere scomposti in elementi più semplici, eccetto quando ciò può comprometterne la comprensione da parte dell'utente" (ISO 2788, 7.1.1).

Per la scomposizione dei termini composti, il TT ha seguito due criteri, così riassumibili:

a) se in un termine composto sussistono tra i componenti relazioni di ruolo (come tra una parte e l'insieme o tra azione e l'oggetto, ecc.), tale composto dovrebbe preferibilmente essere scomposto in componenti separati, ognuno dei quali è accettato come termine d'indicizzazione a sé stante;

b) se in un termine composto sussistono tra i componenti relazioni che non possono essere riespresse, con equivalente significato, analogo grado di comprensione e senza rischio d'ambiguità, attraverso la combinazione di termini indipendenti, tale composto dovrebbe essere mantenuto nella sua forma composta.

Questo duplice criterio intende ridurre la complessità dei termini d'indicizzazione e accrescere la coerenza del vocabolario, favorendo una pratica uniforme nel trattamento dei termini composti.


2.2.1. Analisi dei termini composti

Per poter procedere alla scomposizione, occorre analizzare i termini composti sotto tre distinte modalità.

A) Forma grammaticale

Un termine composto ha la forma di un sintagma nominale costituito da:

- nome + aggettivo, per esempio: [5] Teatro musicale;

- nome + sintagma prepositivo, per esempio: [6] Libretti per musica;

- nome + nome, per esempio: [7] Opéra-ballet.

B) Componenti strutturali

Un termine composto può essere analizzato nei seguenti componenti:

- la testa, ossia l'elemento nominale, detto anche focus, che identifica la classe cui il termine nel suo insieme appartiene: "Teatro" nel termine composto [5] Teatro musicale; "Libretti" nel termine composto [6] Libretti per musica;

- Il modificatore, detto anche differenza, che specifica una delle sottoclassi del focus: "musicale" nel termine [5] Teatro musicale; "per musica" nel termine [6] Libretti per musica.

Questa modalità di analisi non può essere applicata ai seguenti termini composti:

- quelli in cui il modificatore non funge da differenza del nome di testa, poiché non ne specifica una sottoclasse, come [7] Colonna sonora, che non è una "Colonna". Parallelamente, in questi casi, il nome di testa da solo non vale ad identificare la classe di concetti cui il termine nel suo insieme appartiene, per questo è detto sincategorematico. Tali termini composti sono dunque da considerare come una singola unità semantica;

- quei termini giustapposti in cui la relazione tra le due parole di coordinazione e non di subordinazione, per esempio: [8] Baby ballerina. Anche questi termini sono mantenuti normalmente nella loro forma composta.

C) Tecniche di scomposizione

- scomposizione semantica: questa tecnica è applicabile sia a singole parole che a termini composti e consiste nello scomporre un concetto complesso nei suoi componenti, riesprimendo il termine corrispondente con una combinazione di elementi più semplici. I termini più semplici sono quelli compresi nella definizione del termine di significato complesso. Questa tecnica di scomposizione è, dunque, utile all'individuazione delle relazioni semantiche di un termine; è invece sconsigliata per l'indicizzazione, poiché è generalmente riconosciuto che l'impiego di termini più semplici, ottenuti mediante scomposizione semantica di un termine di significato complesso, comporta una perdita di precisione nel recupero delle informazioni.

- scomposizione sintattica: questa tecnica è applicabile solo a termini composti, ossia a termini costituiti da più componenti separati, ognuno dei quali può essere accettato come termine di indicizzazione indipendente. Ad esempio: [9] Metodi di recitazione può essere espresso dalla combinazione di Recitazione e Metodi.


2.2.2. Termini che dovrebbero essere scomposti sintatticamente

Come già accennato, per la scomposizione sintattica si deve adottare il criterio generale della relazione di ruolo: se tra i componenti di un termine composto sussistono relazioni di ruolo, tale termine dovrebbe essere scomposto in componenti separati, ognuno dei quali è adottato come termine di indicizzazione indipendente. Tale criterio, tuttavia, non è da considerare come una norma vincolante né è applicabile rigorosamente in tutti i casi. Per facilitarne l'applicazione si formulano nei paragrafi seguenti tre regole specifiche, tratte dalla norma ISO 2788, definibili come regole di scomposizione. Ognuna di esse indica una condizione favorevole per la scomposizione, condizione che può essere utilizzata per identificare le classi di termini da scomporre, e una opposta, per identificare le classi di termini da mantenere nella forma composta.

a) Un termine composto sarà scomposto se il focus si riferisce a una parte o ad una proprietà (compresi i materiali) e la differenza ne rappresenta l'intero o il possessore.

Ad esempio: nei termini [9] Metodi di recitazione, [10] Adattamento del testo, [11] Generi cinematografici, i nomi che fungono da focus, cioè [9] Metodi, [10] Adattamento e [11] Generi, rappresentano parti o proprietà, mentre le differenze, cioè [9] di recitazione, [10] del testo e [11] cinematografici rappresentano i loro possessori. Questi termini, dunque, dovrebbero essere espressi con nomi separati:

[9] Metodi; Recitazione;

[10] Adattamento; Testo;

[11] Generi; Cinema;

da assegnare come chiavi di ricerca indipendenti in un sistema postcoordinato o da utilizzare come componenti di una stringa in un sistema precoordinato.4

Al contrario il nome di un intero può essere modificato dal nome delle sue parti, proprietà o materiali; tali termini non saranno scomposti. Ad esempio: [12] Giochi di parole, [13] Teatro barocco, [14] Danze popolari, [15] Sbarra a terra, [6] Libretti per musica.

b) Un termine composto sarà scomposto se il focus indica un'azione transitiva e la differenza indica il suo oggetto. Ad esempio: il termine [16] Emissione della voce sarà espresso con i nomi separati Emissione e Voce.

Non saranno scomposti i termini in cui il nome di un'entità è modificata dal nome di un'azione compiuta su di essa: [17] Scena mobile, [18] Teatro ambulante.

c) Un termine composto sarà scomposto se il focus indica un'azione intransitiva e la differenza indica il suo agente. Al contrario, il nome di un'entità può essere modificata dal nome di un'azione intransitiva da essa compiuta: [19] Attori dilettanti.

Queste tre regole individuano le principali classi di termini da scomporre sintatticamente. Tuttavia esistono altre relazioni di ruolo in un termine composto la cui scomposizione va effettuata con cautela, sia per la frequenza di locuzioni idiomatiche, sia per la presenza di termini pienamente accettati nell'uso.


2.2.3. L'ordine delle parole nei termini composti

I termini composti vanno di preferenza registrati secondo l'ordine del linguaggio naturale, evitando l'inversione delle parole. Ad esempio: [20] Teatro umanistico e non [21] Umanistico, Teatro. La forma invertita può essere introdotta come termine non preferito.


2.3. Nomi propri

I nomi propri costituiscono una parte rilevante dei punti di accesso nei cataloghi per soggetto, fino a rappresentare, in determinate discipline o in cataloghi particolari, la maggior parte della terminologia. Nonostante ciò, negli strumenti e nei sistemi di indicizzazione questo tipo di termini non ha mai ricevuto l'attenzione che merita. Si pongono, soprattutto, due problemi: il primo è relativo alla forma dei nomi propri; il secondo al loro trattamento nella stringa e nel vocabolario di indicizzazione. I due problemi spesso si sovrappongono.

Una questione alla quale verrà dedicata particolare attenzione riguarda i legami che si possono stabilire nella stringa di soggetto tra nomi comuni e nomi propri, quando si ritenga opportuna una loro contestualizzazione. Un aspetto preliminare riguarda l'esigenza di controllare l'uniformità dei nomi propri attraverso un archivio di autorità, che può essere coincidente con quello che controlla gli accessi nel catalogo per autori e titoli.


2.3.1. Tipologia dei nomi propri

I nomi propri si possono raggruppare sotto le seguenti due classi:

- nomi personali, di enti collettivi, geografici; titoli di opere anonime e di opere con autore; soggetti specifici come oggetti, idee astratte, eventi storici ecc., compresi i nomi includenti nomi propri e i nomi comuni diventati nomi propri: [22] Gropius, Walter; [2] Balletti Svedesi;

- lemmi numerabili che, usati al singolare, si riferiscono a concetti individuali (o classi di uno): [23] Gassman, Vittorio - Debutto.


2.3.2. Forma dei nomi propri

Per determinare la forma dei nomi propri si farà riferimento ai principi che governano gli archivi di controllo e si adotteranno, per quanto possibile e conveniente, gli stessi criteri e le stesse forme impiegate nei codici di catalogazione. Qui ci si limita a richiamarne alcune applicazioni particolari. I nomi propri hanno un valore referenziale e non denotativo, in quanto sono impiegati per denominare, riferirsi a entità e non per denotarle, ossia descriverne le caratteristiche. Dunque la forma scelta dovrebbe rispondere ai seguenti requisiti:

- concisione: l'aggiunta di elementi complementari è giustificata solo per evitare confusioni fra omonimi e rispettare il requisito dell'univocità;

- uso corrente: la forma preferita sarà quella che ricorre nella letteratura cui l'indicizzazione è rivolta e anche, presumibilmente, nella formulazione di espressioni di ricerca da parte dell'utente.


2.3.3. Contestualizzazione dei nomi propri

Può essere utile, talvolta indispensabile, contestualizzare il nome proprio. La contestualizzazione consiste nel corredare il nome proprio di uno o più termini contestualizzanti, che lo precedono o lo seguono nella stringa, a seconda del ruolo che il nome proprio vi occupa. Il termine contestualizzante è di solito il nome della classe o di una delle classi cui l'individuo è attribuito, ma può fungere da contestualizzazione anche un altro termine generico, che valga da elemento di raccolta per tutti i nomi propri riconducibili ad un dato ambito semantico, o una stringa di termini.


2.4. Altre questioni morfologiche

I termini di un linguaggio di indicizzazione non devono essere ambigui. In generale questa condizione risulta soddisfatta se tra i termini e i concetti che essi rappresentano vi è una relazione biunivoca, ossia se ad un termine corrisponde uno ed un solo concetto e viceversa. Occorre dunque che il linguaggio di indicizzazione si doti di mezzi idonei a rendere inequivoco il rapporto tra termini e concetti, sia nel caso in cui ad uno stesso termine siano associati nella lingua naturale due o più significati (omografia) sia nel caso in cui uno stesso significato sia associato a due o più termini (sinonimia).


2.4.1. Omografia

Il metodo più diffuso nei sistemi di indicizzazione per la disambiguazione degli omografi, ossia delle parole che hanno la stessa forma ma differenti significati, è quello di far seguire uno dei termini o ciascuno da un qualificatore in parentesi uncinate "< >". Il termine e il suo qualificatore formano un unico termine di indicizzazione. Ad esempio: [24] Studi <creazioni artistiche> e Studi <luoghi>, [25] Maschere e Maschere <manufatti>.

Nella scelta del qualificatore si dovrebbe impiegare preferibilmente un termine generico, gerarchicamente sovraordinato al termine da disambiguare, o una forma sostitutiva, piuttosto che altri tipi di termini (per esempio: il nome della disciplina o del campo di attività a cui afferisce il concetto che si vuole esprimere).

È consigliabile limitare l'uso della disambiguazione ai casi indispensabili, per evitare gli inconvenienti indicati sopra. Si suggeriscono pertanto alcune modalità per eliminare l'ambiguità dei termini senza, tuttavia, far ricorso alla tecnica della disambiguazione. La prima è quella di non disambiguare, tra due o più omografi, tutti i termini, ma solo quello/quelli che rappresentano il significato meno tipico o quello derivato rispetto a quello originario o, comunque, individuati con criteri analoghi. Un altro modo per limitare la disambiguazione è di non usarla quando è ridondante o solamente preventiva. Per esempio: non si dovrebbe disambiguare un termine potenzialmente ambiguo, se si ritiene improbabile che altri significati dello stesso termine siano rappresentati nell'indice.

Un caso tipico di disambiguazione ridondante, da evitare, è quello della disambiguazione in funzione esplicativa, usata appunto per chiarire il significato di un termine ritenuto non immediatamente chiaro o, comunque, bisognoso di spiegazione. La disambiguazione non deve svolgere questa funzione, che può essere demandata, a seconda dei casi, alla struttura del vocabolario o alla contestualizzazione nella stringa o, nel caso dei nomi propri, alla qualificazione. Un'altra soluzione è quella di usare, ove possibile, termini diversi al posto di uno o più omografi.


3. STRUTTURA

Il TT non è solo un elenco di termini controllati a livello formale, ma è costituito anche da una rete di relazioni tra le voci di indicizzazione. Tale rete ha lo scopo principale di permettere l'individuazione dei termini più adatti all'indicizzazione di un documento ed è costituita a partire dall'analisi delle relazioni esistenti tra le voci. Le principali relazioni tra i termini sono di tipo gerarchico, associativo e sinonimico.

- Le relazioni gerarchiche comportano un collegamento tra termini a partire dalla loro maggiore o minore specificità nell'ambito di un campo disciplinare o di un determinato insieme di concetti. Sono collegati da relazioni gerarchiche, ad esempio, le coppie di termini [26] Ballerini; Primi ballerini e [27] Danze popolari; Tarantella.

- Altro tipo di relazione riguarda quei termini uniti non per il loro significato ma in virtù di collegamenti derivati da associazioni di tipo linguistico o semantico. Spesso si tratta di contrari, come [28] Inferno e Paradiso, oppure di termini associati dal loro particolare campo di indagine o applicazione, come [29] Musica popolare e Teatro popolare.

- Le relazioni sinonimiche uniscono invece i termini che hanno lo stesso significato, come [30] Clown e Pagliacci o [31] Scenetta e Sketch. Poiché in un thesaurus deve esserci una relazioni biunivoca tra voci di indicizzazione e concetti, uno solo tra questi potrà essere utilizzato come termine di indicizzazione.

Ognuna delle relazioni citate è espressa dal Thesaurus con collegamenti reciproci, in modo che nell'esempio [26] il termine Ballerini sarà collegato a Primi ballerini così come Primi ballerini lo sarà a Ballerini. Ognuna di queste relazioni, inoltre, è espressa con una sigla riportata per ogni vocabolo che abbia collegamenti con altri termini:

a) BT (broader term) termine più ampio;

b) NT (narrower term) termine più ristretto;

c) RT (related term) termine correlato;

d) UF (used for) usato per

e) USE usa

È facile individuare subito due coppie particolari di indicatori: BT e NT che rendono le relazioni gerarchiche, e UF e USE che sono utilizzati per le relazioni sinonimiche. Alla luce di quanto detto gli esempi sopra riportati possono essere completati nel modo seguente:

[26] Ballerini

NT Primi ballerini

vale a dire che Primi ballerini definisce un concetto più ristretto rispetto a Ballerini

Primi ballerini

BT Ballerini

vale a dire che Ballerini definisce un concetto più ampio rispetto a Primi ballerini

[27] Danze popolari

NT Tarantella

vale a dire che Tarantella definisce un concetto più ristretto rispetto a Danze popolari

Tarantella

BT Danze popolari

vale a dire che Danze popolari definisce un concetto più ampio rispetto a Tarantella

[30] Clown

UF Pagliacci

vale a dire che Clown è il termine preferito per esprimere il concetto Pagliacci

Pagliacci

USE Clown

vale a dire che per esprimere il concetto Pagliacci occorre utilizzare il termine Clown

L'indicatore RT esprime principalmente le relazioni associative e semantiche:

[28] Inferno

RT Paradiso

Paradiso

RT Inferno

[29] Musica popolare

RT Teatro popolare

Musica popolare

RT Teatro popolare

La relazione RT è anche usata per collegare termini che definiscono concetti vicini per significato, come, ad esempio: [32] Acrobati e Saltimbanchi, [33] Tenori e Soprani, [34] Fandango e Bolero, ecc.

Occorre notare che, al contrario degli altri legami, UF e USE hanno valore prescrittivo, cioè stabiliscono quali sono i termini di indicizzazione permessi e quali, invece, non devono essere utilizzati. Ovviamente tutti i termini, sia quelli preferiti, sia quelli da non utilizzare, sono presenti nel TT e rappresentano degli accessi ai termini e ai concetti che essi esprimono.


4. CONCLUSIONI

Il TT è un vocabolario controllato costituito da un elenco di termini e dall'insieme delle relazioni che li collegano tra loro. In definitiva il TT è un elenco di parole, per ognuna delle quali viene dato il numero e il tipo di collegamento con altri termini di indicizzazione. Lo scopo è mostrare la natura delle relazioni e permettere all'indicizzatore la selezione del termine più appropriato per esprimere un determinato concetto.

Il TT è uno strumento che usa elementi del linguaggio naturale ed è ovviamente influenzato dalla normale evoluzione della lingua. Ne consegue che il TT non è un oggetto concluso, ma anzi è aperto sia a possibili aggiunte, sia alla verifica costante delle relazioni tra i termini. Ovviamente, sia nel caso di aggiunta di termini, sia nel caso di controllo dei collegamenti, occorre seguire i principi qui esposti.

 

Note

(1) I termini di un vocabolario controllato possono essere espressi, quanto al numero, in due modi diversi: 1) tutti i termini al singolare (esclusi i pluralia tantum) nella forma tipica di enciclopedie e dizionari; 2) uso di singolare o plurale in base a criteri predefiniti, riconducibili, in ultima analisi, al criterio dell'appartenenza categoriale del termine.

La prima opzione è la più semplice da implementare e gestire, in quanto, almeno in teoria, non presenta ambiguità di applicazione; tuttavia, il vantaggio della semplicità tende a ridursi quando a tale opzione si sovrappongano. come accade spesso nella pratica, altri criteri: ad esempio quello dell'uso linguistico. Inoltre gli organismi documentari che preferiscono la forma singolare vi fanno eccezione in alcuni casi, ad esempio per evitare ambiguità quando uno stesso lemma si può riferire a concetti diversi, che potrebbero essere distinti usando le due forme. La seconda opzione, al contrario, pur presentando una maggiore complessità e delle ambiguità di applicazione non sempre facili da dirimere, ha il vantaggio di poggiare su principi e criteri di tipo linguistico-classificatorio, quindi prevedibili e relativamente omogenei.

La decisione di adottare l'una o l'altra opzione dipende anche dal sistema di indicizzazione impiegato. Infatti l'uso prevalente del singolare, mentre è accettabile per i sistemi di indicizzazione postcoordinati - dove i termini sono assegnati ai documenti come chiavi di ricerca indipendenti, così che l'utente accede all'indice allo stesso modo con cui accede ad un dizionario o ad un'enciclopedia - male si adatta ai sistemi precoordinati, che organizzano i termini in stringhe e li uniscono talvolta mediante preposizioni o congiunzioni. In tali casi l'intelligibilità dell'intera stringa può essere condizionata dall'uso della forma singolare o plurale; dunque la disponibilità di un vocabolario più ampio, mediante l'uso di entrambe le forme, favorisce un più alto grado di espressività dei termini.

(2) Durante la redazione del TT ci si è trovati di fronte a diverse eccezioni al principio di numerabilità, risolte attraverso l'adozione di criteri che consentissero di interpretare tali eccezioni piuttosto come casi particolari di applicazione dello stesso principio:

Termini la cui appartenenza categoriale è plurale

Nel TT sono pochissimi, tutti riconducibili al solo caso di oggetti non considerati numerabili. Esempi:

Abbigliamento

Attrezzeria

A ben vedere non si tratta di una vera e propria eccezione, poiché la maggior parte di questi nomi non presenta il plurale. Se quindi si volesse impiegare il plurale dovremmo dire, ad esempio: Capi di abbigliamento. I singularia tantum si comportano come i pluralia tantum.

Termini la cui appartenenza categoriale è singolare

Le eccezioni al singolare sono molto più numerose e più difficilmente riconducibili ad un criterio unico. Nonostante ciò si può affermare, con una certa approssimazione, che nella maggior parte dei casi si tratta di concetti che, pur appartenendo ad una categoria non numerabile, sono tuttavia da considerare numerabili, in quanto denotano, più che un singolo fenomeno, un insieme di fenomeni, cosicché il loro significato è assorbito da questa funzione di raggruppamento.

Esempi:

attività:

Feste

Tornei

Riti pasquali

entità e fenomeni astratti

Comunicazioni di massa

Avanguardie artistiche

La norma internazionale ISO 2788 offre un'indicazione che può servire a giustificare il plurale anche per questo tipo di termini:

"se la comunità degli utenti serviti dall'indice considera una data sostanza o materiale come una classe con più di un membro, il nome della classe dovrebbe essere espresso al plurale", e "quando un concetto astratto è considerato come una classe con più di un membro, il termine che rappresenta la classe dovrebbe essere espresso al plurale".

Le eccezioni al singolare, sia nel caso dei concetti astratti (entità astratte, discipline, proprietà, ecc.) che in quello dei materiali, sono riconducibili, seppure con diversa evidenza, al criterio del ruolo classificatorio dei termini, che può essere formulato nel modo seguente:

prendono il plurale tutti quei termini appartenenti a categorie singolari (concetti astratti o materiali), che hanno solo (o prevalentemente) la funzione di raggruppare sottoclassi, la funzione cioè di "gancio", senza avere altro significato specifico al di fuori di questo.

In caso di dubbio resta comunque valida la cautela presente nella norma internazionale, là dove si indica, per esempio per i materiali, che la scelta tra singolare e plurale può essere determinata in base al giudizio degli utenti.

(3) Per utilizzare le due forme nello stesso vocabolario lo scostamento categoriale deve essere netto. In casi come Danzatore e Danzatori l'uso del singolare rappresenta l'astratto e il plurale il concreto; tuttavia astratto e concreto di un concetto non possono essere i considerati come due concetti appartenenti a categorie diverse.

(4) Il TT, pensato per un sistema precoordinato, traduce questi termini in stringhe: [9] Recitazione - Metodi, [10] Testo - Adattamento, [11] Cinema - Generi.

 

Azioni sul documento

Elenco delle riviste

    Istituto per i beni artistici culturali e naturali della Regione Emilia-Romagna - Cod. fiscale 800 812 90 373

    Via Galliera 21, 40121 Bologna - tel. +39 051 527 66 00 - fax +39 051 232 599 - direzioneibc@postacert.regione.emilia-romagna.it

    Informativa utilizzo dei cookie

    Regione Emilia-Romagna (CF 800.625.903.79) - Viale Aldo Moro 52, 40127 Bologna - Centralino: 051.5271
    Ufficio Relazioni con il Pubblico: Numero Verde URP: 800 66.22.00, urp@regione.emilia-romagna.it, urp@postacert.regione.emilia-romagna.it