Indice generale del sito  | Indice analitico 

Pagina precedente
3.12. Miscellanea   43 / 396  Pagina successiva
5. Codifica caratteri Indietro
ALEPH 500 (v. 16-18): documentazione tecnica  |  Torna alla pagina iniziale:
 4. Tab_filing e Tab_word_breaking 

Tab_filing e Tab_word_breaking

Premessa comune a regole di ordinamento e di formazione delle parole

Queste regole valgono anche per il db di autorità.

Le procedure traducono certi segni (tipicamente interpunzione etc.) in blanks (compress_blanks) e viceversa o impediscono che certi segni vengano letti (compress): questo sia per evitare che certi termini vengano spezzati, sia per non richiedere l'immissione di un punto ad es. dentro una cifra per ritrovarla.

Si possono codificare fino a 99 regole, ad es.: regola di abbreviazione che comprime i punti fra i caratteri, conversione, compressione: elimina caratteri....

In ogni caso vanno lette dall'alto nel senso che sono eseguite una prima delle altre, ad es. :

- se una regola elimina la parentesi "(" dopo non avra' peso dire di trasformare "(" in blank

- guai a dare per prima la soppressione di < >

- "numbers" deve venire prima di trasformare "." in blank e così abbreviations

Filing

la col. 5 di G/1/00 per gli IND e gli ACC definisce le regole di filing (per loro sono regole di indicizzazione degli indici ACC).

la tabella tab_filing G/1/k non si raggiunge da menu, cercala con >>dt in UPG01 e UPG10

"If no procedure is listed in col.3 of tab01, the system defaults to procedure 99. Therefore, this tab_filing table should always include procedure 99.

This table is limited to 500 lines.

A single filing procedure is made up of a number of individual procedures, which are explained following. Note that the order in which the procedures is listed is important.

For example, "numbers" (which compresses comma or dot in numbers to change 100,000 and 100.000 to 100000) must come before listing comma or dot in "change-to-blank"."

- abbreviation: elimina i punti dentro le sigle: I. B. M. = I B M, I.B.M. = IBM (deve venire prima di blanks) F W

- bbk: special procedure for Russian filing standards, in which sorting sequence is special characters, followed by Cyrillic characters, followed by Latin characters, followed by numbers F

- lc_call_no: procedura speciale per l'ordinamento corretto di LC call numbers F

- char_conv: fa una conversione di caratteri secondo la procedura indicata in col. 4. This name must match procedure identification in col.1 of /alephe/unicode/tab_character_conversion_line F e anche W ha la sua vedi infra

- get_subfields: use only the subfields, or subtract some using "-" as appear in listed in col.4 F

- expand_num: aggiunge zeri iniziali fino a 7 posizioni F

- mc_to_mac: cambia l'iniziale mc in mac F! (solo iniziale)

- non_filing: trascura quanto fra << >> F

- non_numeric: elimina i caratteri non numerici F

- pack_spaces: compresses all multiple spaces to a single space F

- suppress: suppress using <<...>> (drop all text contained within the signs, and the signs themselves) F

- to_carat: change subfield sign to ^^ (for hierarchical sorting of headings) F

- compress: elimina i caratteri elencati in colonna 4 F W

- compress_blank: elimina i blanks (ASCII 32) F W

- del_subfield: trasforma il delimitatore di sottocampo ($$x) in blank in W in F recita "delete subfield sign ($$x)"

- to_blank: trasforma i caratteri elencati in colonna 4 in blank (questo significa che ogni stringa di ricerca che contiene uno di quei caratteri non troverà nulla, (a meno che lo script Java non filtri l'input). Questo nell'OPAC è detto come 'non immettere segni di punteggiatura' F W

- subf_to_sign: trasforma "2nd and subsequent subfield signs to the single character listed in col.4" W

- blank_to_carat: trasforma blanks in (^) W

- numbers: elimina virgola e punto fra le cifre, ad es.: 100,000 e 100.000 -> 100000, 345.06 -> 34506 F W

- marc21_41: nel TAG MARC21 041 sa individuare e separare i codici di lingua W

- to_lower: per default riduce tutto a minuscolo F e W per default

UPG01 per filing gli ACC tutti usano la 01, ma i titoli usano la 11, gli IND la 21 e gli WORD 99 di default

UPG01 per word usano tutti la 01

(UPG10 tutti gli indici ACC usano la procedura 11 tranne i titoli che usano la 12, per evitare l'articolo iniziale, e i WORD usano la 99 di default)

l’analogo per gli indici WRD è TAB_WORD_BREAKING (ol. 6 della tab00.lng?) , sempre cercala con

La TAB_WORD_BREAKING stabilisce cosa e' una parola: (anche qui) è una stringa delimitata da blanks.

Per testarle: usare le UTIL F/2 F/3 molto importante: chiede una regola (valore di col. 1), un input check word building routine e le altre ottimo, da vedere p. 67-8-69

In aggiunta rammentare che char_conv_table unicode_to_word_gen (che non ho trovato) tratta ad es. i rapporti fra u ü e ue infatti Göthe e Goethe si sovrappongo (tranne 7! in cui è implicato un nome di ente, uno poi non lo vedo ...)

Per cambiamenti effettivi retroattivi, ci vuole la reindicizzazione completa. 

Precisazioni (PRB 4124):

1 la tab-filing viene richiamata sia da G/1/00 in col. 5 (viene anche richiamata da G/1/01 in colonna 3 dove ha per default 99. ma questa, risposta di Atlantis,: "la col. 3 in tab01.lng serve per operazioni di retrive eseguite da WEB Staff (b-ret-21 - Sort Catalog Records, e b-ret-01 -Retrieve Catalog Records)" 8/11/2004

2 - la tab_filing procedure (word non c'è per un indice IND) 21 per ISBN come indice di tipo I NON elimina virgole e punti fra i numeri (ma i punti li toglie il Java), comprime il trattino, elimina caratteri alfabetici, e consente che si cerchi sia con che senza, dato:

99.9999.99.A

si puo' cercare e trovare anche come:

99999999A

99999999

3 che significa: "- subf_to_sign: trasforma "2nd and subsequent subfield signs to the single character listed in col.4"?

4 va considerato il java script aggiunto da noi solo per l’OPAC (perché il GUI non lo richiede) che cattura e trattiene segni immesi nella stringa di ricerca. Q.v.

5 non filing e supress sono a ridondo?

Parole chiave Tab_filing ; Tab_word_breaking
Università degli studi di Perugia - CSB - Servizio della biblioteca digitale: Ufficio Aleph / a cura di Francesco Dell'orso 
v. 2.3 - ottobre 2010;
vai alla pagina iniziale