Skip to main content
OCLC Support

4.Structuur van titel- en thesaurusrecords

Structuur van titel- en thesaurusrecords

Titelrecords

Enkelschriftige titelrecords

Voor enkelschriftige titelrecords in niet-Latijns schrift, zoals Grieks, Hebreeuws en Arabisch, wordt sterk geadviseerd om de niet-Latijnse schriftcode aan de betreffende kmc's toe te voegen. Mede omdat Latijn het impliciete schrift is. In deze situatie wordt volgnummer 00 gebruikt. Dit volgnummer impliceert dat de kmc niet dubbel, d.w.z. met een Latijnse equivalent, wordt ingevoerd.

Voorbeeld

...
4000 [\00,ga\]<Tekst in Grieks schrift>
4020 [\00,ga\]<Tekst in Grieks schrift>
4030 [\00,ga\]<Tekst in Grieks schrift>
...
4207 <Samenvatting in het Nederlands>
of 4207 [\00,ba\]<Samenvatting in het Nederlands>
...

4207 [\00,ba\] is in principe correct. Maar als in een kmc geen schriftcode voorkomt, wordt er vanuit gegaan dat deze kmc Latijns schrift bevat.

Meerschriftige titelrecords

Een meerschriftig titelrecord betekent dat kmc's dubbel voorkomen. Om kmc's paarsgewijs bij elkaar te houden, vult men in beide kmc's hetzelfde volgnummer in. Het laagste volgnummer dat is toegestaan, is 01; het hoogste is 99. Als een kmc herhaalbaar en de Pica3 kmc identiek is, dan gebruikt men voor het eerste paar volgnummer 01, en voor het volgende paar volgnummer 02, etc.

Voorbeeld

 

...
4000 [\01,ga\]<Tekst in Grieks schrift> (equivalent van kmc 4000 in Latijns schrift)
4000 [\01,ba\]<Tekst in Latijns schrift> (equivalent van kmc 4000 in Grieks schrift)
4030 [\01,ga\]<Tekst in Grieks schrift> (equivalent van kmc 4030 in Latijns schrift)
4030 [\01,ba\]<Tekst in Latijns schrift> (equivalent van kmc 4030 in Grieks schrift)
4031 [\01,ga\]<Tekst in Grieks schrift> (equivalent van kmc 4031 in Latijns schrift)
4031 [\01,ba\]<Tekst in Latijns schrift> (equivalent van kmc 4031 in Grieks schrift)
4201 [\01,ga\]<Tekst in Grieks schrift> (equivalent van kmc 4201 - 01 in Latijns schrift)
4201 [\01,ba\]<Tekst in Latijns schrift> (equivalent van kmc 4201 - 01 in Grieks schrift)
4201 [\02,ga\]<Tekst in Grieks schrift> (equivalent van kmc 4201 - 02 in Latijns schrift)
4201 [\02,ba\]<Tekst in Latijns schrift> (equivalent van kmc 4201 - 02 in Grieks schrift)
...
4207 <Samenvatting in het Nederlands> (geen equivalent van kmc 4207 in Grieks schrift)
of 4207 [\00,ba\]<Samenvatting in het Nederlands> (geen equivalent van kmc 4207 in Grieks schrift)
....

4207 [\00,ba\] is in principe correct. Als in een kmc geen schriftcode voorkomt, wordt er vanuit gegaan dat deze kmc Latijns schrift bevat.

Thesaurusrecords

Een thesaurusrecord van een auteur of persoon, maar tevens een thesaurusrecord van bijvoorbeeld een trefwoord dient geschikt te zijn om naar te linken vanuit titelrecords (en andere thesaurusrecords van dezelfde soort) die in diverse schriften zijn ingevoerd. In al deze gevallen wordt gebruik gemaakt van een PPN-link naar een en hetzelfde thesaurusrecord. Dit impliceert dat in zon thesaurusrecord de varianten in verschillende schriftsoorten moeten kunnen worden vermeld. Qua uitgangspunten verschillen dergelijke thesaurusrecords daarom aanzienlijk van titelrecords als het gaat om volgnummers, schriftcodes, herhaalbaarheid van kmc's e.d. Dit heeft dus te maken met de functie van een thesaurusrecord.

Niet-herhaalbare kmc's

  • Als een kmc niet-herhaalbaar is als het volgnummer en de schriftcode ontbreken, dan kan deze kmc meerdere keren worden ingevoerd met volgnummer 01. Bovendien moeten de schriftcodes dan allemaal verschillend zijn.
  • Volgnummer 00 is ook toegestaan, en wordt aanbevolen voor enkelschriftige kmc's in niet-Latijns schrift.
  • Het volgnummer en de schriftcode kunnen ontbreken. Dan worden de kmc's op de oude manier ingevoerd.

Dit geldt voor de volgende kmc's:

Pica3 Betekenis
100 Persoonsnaam, meest bekende naamsvorm
110 Persoonsnaam met meest complete voornaam, voornamen of meeste voorletters
120 Meisjesnaam van gehuwde vrouw (CEN)
150 Corporatie/congres
155 Corporatie muziek
160 Trefwoord
170 (Basis)classificatie
180 Drukker/boekverkoper
190 Uniforme title
300 Geboorte- en/of sterfjaar, of werkjaren
310 Beroeps-, plaatsaanduiding, organisatie, onderwerp of vakgebied
760 Coördinaten (regio-thesaurus)

Broader en related term verwijzingen

  • Broader en related term verwijzingen zijn herhaalbare kmc's. De kmc's worden bij elkaar gehouden door in de kmc's hetzelfde volgnummer in te vullen. Het laagste volgnummer dat is toegestaan, is 01; het hoogste is 99. Omdat de volgorde en/of sortering van deze herhaalbare kmc's van belang kunnen zijn, is volgnummer 00 in deze kmc's niet toegestaan. Per volgnummer dienen de schriftcodes te verschillen. Het gebruik van volgnummer 01 e.d. betekent bij deze verwijzingen dus niet i.t.t. titelrecords - dat een equivalent van de betreffende kmc in een ander schrift moet worden ingevoerd!
  • Het volgnummer en de schriftcode kunnen ontbreken. Dan worden de kmc's op de oude manier ingevoerd.

Dit geldt voor de volgende kmc's:

Pica3 Betekenis
400 Verwijzing van pseudoniem of persoonsaanduiding naar eigennaam
410 Verwijzing van eigennaam naar pseudoniem of persoonsaanduiding, of van pseudoniem of persoonsaanduiding naar ander pseudoniem of andere persoonsaanduiding van dezelfde persoon
440 Bredere term bij corporatie/congres
450 Corporatie/congres-verwijzing
460 Broader term-verwijzing bij trefwoord
470 Related term-verwijzing bij trefwoord
475 (Chronologische) verwijzing lokaal trefwoord
480 Related term-verwijzing bij drukker
485 Related term-verwijzing bij uniforme titel

Herhaalbare kmc's (m.u.v. broader en related term verwijzingen)

  • Als een kmc wel herhaalbaar is als het volgnummer en de schriftcode ontbreken, en geen broader of related term verwijzing is, dan kan men kmc's paarsgewijs bij elkaar houden door in beide kmc's hetzelfde volgnummer in te vullen. Het laagste volgnummer dat is toegestaan, is 01; het hoogste is 99.
  • Bovendien is het mogelijk om volgnummer 00 meerdere keren te gebruiken. Let op: de kmc's met volgnummer 00 staan op zichzelf en vormen geen paar met andere kmc's met hetzelfde volgnummer!
  • Het volgnummer en de schriftcode kunnen ontbreken. Dan worden de kmc's op de oude manier ingevoerd.

Dit geldt voor de volgende kmc's:

Pica3 Betekenis
200 Naamsvariant persoonsnaam
250 Naamsvariant bij corporatie/congres
260 Synoniem/extra ingang bij trefwoord
265 Extra verwijzing bij trefwoord
270 Is-verwijzing bij (basis)classificatie
280 Naamsvariant bij drukker/boekverkoper
290 Titelvariant bij uniforme titel
50X Omschrijving van classificatie
51X Synonieme omschrijving van classificatie
53X Vrije omschrijving (basis)classificatie
540 Afzonderlijke onderwerpen bij een code
55X Trefwoord bij classificatie
56X Synoniem trefwoord bij classificatie
600 Tekstuele verwijzing bij trefwoord/classificatie
640 Classificatie-code bij trefwoord, geïndexeerd
650 Classificatie-code bij trefwoord
655 SISO-code bij trefwoord
660 UDC-code bij trefwoord
665 Geschiedenis noot (regio-thesaurus)
666 Algemene toepassingsnoot (regio-thesaurus)
667 Overige noten (regio-thesaurus)
710 Standaard beroepsaanduiding (CEN)
720 Naam echtgenoot bij vrouwen (CEN)
730 Adresgegevens bij corporatie
740 Plaats en jaar bij drukker
741 Beroep van drukker/boekverkoper
742 Adres van drukker/boekverkoper
743 Uithangbord van drukker/boekverkoper
9XX Scope notes/toelichtingen

Enkelschriftige thesaurusrecords

Hieronder zijn enkele voorbeelden opgenomen van enkelschriftige thesaurusrecords. Deze records zijn (deels) fictief.

Voorbeelden enkelschriftige thesaurusrecords

005 Tpx
100 Jan@Jansen
300 1930-1990

 

005 Tlv
009 0ZZ
160 Weimaraners
260 Weimarse staande honden
265 Honden
460 !081379811!Staande honden

 

005 Tpx
100 [\00,cr\]<Cornelis@Jansen Cyrillisch (Russisch)>
110 [\00,cr\]<C.P.T.M.@Jansen Cyrillisch (Russisch)>
200 [\00,cr\]<Kees@Jansen Cyrillisch (Russisch)>
300 [\00,cr\]<1972- Cyrillisch (Russisch)>
400 [\01,cr\]<pseud. van: Peter/de@Vries Cyrillisch (Russisch)>
400 [\02,cr\]<en: Liesbeth/de@Vries Cyrillisch (Russisch)>

Voor enkelschriftige thesaurusrecords in niet-Latijns schrift, zoals Grieks, Hebreeuws en Arabisch, wordt sterk geadviseerd om de schriftcode aan de betreffende kmc's toe te voegen.

In thesaurusrecords van persoonsnamen (Tp) wordt in dergelijke situaties volgnummer 00 gebruikt in de kmc's 100, 110, 200 en 300. Dit volgnummer impliceert dat de betreffende kmc niet dubbel, d.w.z. met een Latijnse equivalent, wordt ingevoerd. Een bijzondere kmc in dit verband is kmc 400, omdat de volgorde (en sortering) van deze herhaalbare kmc van essentieel belang is. Vandaar dat volgnummer 00 in deze kmc niet is toegestaan.

Teksten als 'pseud. van', 'en' e.d. dienen in principe nietgetranslitereerd te worden, maar de begrippen dienen vertaald te worden, in dit geval in het Cyrillisch, mede met het oog op een correcte expansie.

Meerschriftige thesaurusrecords

Hieronder zijn enkele voorbeelden opgenomen van meerschriftige thesaurusrecords. Een meerschriftig thesaurusrecord betekent dat bepaalde kmc's meerdere keren voorkomen. Deze records zijn (deels) fictief.

Voorbeelden meerschriftige thesaurusrecords

005 Tpx
100 [\01,ba\]<H.@Brandt Corstius Latijn>
100 [\01,ca\]<H.@Brandt Corstius Cyrillisch>
100 [\01,ga\]<H.@Brandt Corstius Grieks>
100 [\01,ha\]<H.@Brandt Corstius Hebreeuws>
110 [\01,ba\]<Hugo@Brandt Corstius Latijn>
110 [\01,ca\]<Hugo@Brandt Corstius Cyrillisch>
110 [\01,ga\]<Hugo@Brandt Corstius Grieks>
110 [\01,ha\]<Hugo@Brandt Corstius Hebreeuws>
200 [\00,ca\]<P. Brandt@Corstius alleen Cyrillisch>
200 [\00,fa\]<L. Brandt@Corstius alleen Arabisch>
200 [\01,ba\]<H. Brandt@Corstius Latijn>
200 [\01,ca\]<H. Brandt@Corstius Cyrillisch>
200 [\02,ba\]<H.P. Brandt@Corstius Latijn>
200 [\02,ha\]<H.P. Brandt@Corstius Hebreeuws>
300 [\01,ba\]<ca. 1935- Latijn>
300 [\01,ca\]<ca. 1935- Cyrillisch>
300 [\01,ga\]<ca. 1935- Grieks>
300 [\01,ha\]<ca. 1935- Hebreeuws>
410 zie ook: !072473908!Dolf Cohen
410 [\01,ba\]<zie ook: !068547579!Piet Grijs Latijn>
410 [\01,ca\]<zie ook: !068547579!Piet Grijs Cyrillisch>
410 [\01,ga\]<zie ook: !068547579!Piet Grijs Grieks>
410 [\01,ha\]<zie ook: !068547579!Piet Grijs Hebreeuws>
410 [\02,ba\]<zie ook: !069075646!Raoul Chapkis Latijn>
410 [\02,ca\]<zie ook: !069075646!Raoul Chapkis Cyrillisch>
410 [\02,ga\]<zie ook: !069075646!Raoul Chapkis Grieks>
410 [\02,ha\]<zie ook: !069075646!Raoul Chapkis Hebreeuws>
410 [\03,ba\]<zie ook: !069075204!Stoker alleen Latijn>
410 [\04,ca\]<zie ook: !068547307!Battus alleen Cyrillisch>
410 [\05,ba\]<zie ook: !071737871!Victor Baarn alleen Latijn>

 

005 Tpv
100 [\01,ba\]<Nicci@French Latijn>
100 [\01,ca\]<Nicci@French Cyrillisch>
100 [\01,ga\]<Nicci@French Grieks>
100 [\01,ha\]<Nicci@French Hebreeuws>
400 [\01,ba\]<pseud. van: !074415026!Nicci Gerrard Latijn>
400 [\01,ca\]<pseud. van: !074415026!Nicci Gerrard Cyrillisch>
400 [\01,ga\]<pseud. van: !074415026!Nicci Gerrard Grieks>
400 [\01,ha\]<pseud. van: !074415026!Nicci Gerrard Hebreeuws>
400 [\02,ba\]<en: !105426032!Sean French Latijn>
400 [\02,ca\]<en: !105426032!Sean French Cyrillisch>
400 [\02,ga\]<en: !105426032!Sean French Grieks>
400 [\02,ha\]<en: !105426032!Sean French Hebreeuws>

Een afkorting als 'ca.' (circa) en teksten als 'zie ook', 'pseud. van' en 'en' dienen in principe niet getranslitereerd te worden, maar deze begrippen dienen vertaald te worden, in dit geval in het Cyrillisch, Grieks en Hebreeuws, mede met het oog op een (eventuele) correcte expansie.

005 Tlv
160 [\01,ba\]<Dialecten Latijn>
160 [\01,ca\]<Dialecten Cyrillisch>
160 [\01,ga\]<Dialecten Grieks>
160 [\01,ha\]<Dialecten Hebreeuws>
260 [\00,fa\]<Streektalen alleen Arabisch>
260 [\00,ha\]<Streektalen alleen Hebreeuws>
260 [\01,ba\]<Streektaal Latijn>
260 [\01,ca\]<Streektaal Cyrillisch>
260 [\02,ba\]<Streektalen Latijn>
260 [\02,ga\]<Streektalen Grieks>
460 [\01,ba\]<!078075254!Taalgebruik Latijn>
460 [\01,ca\]<!078075254!Taalgebruik Cyrillisch>
460 [\01,ga\]<!078075254!Taalgebruik Grieks>
460 [\01,ha\]<!078075254!Taalgebruik Hebreeuws>
470 [\01,ba\]<!147858100!Talen Latijn>
470 [\01,ca\]<!147858100!Talen Cyrillisch>
470 [\01,ga\]<!147858100!Talen Grieks>
470 [\01,ha\]<!147858100!Talen Hebreeuws>
470 [\02,ba\]<!077999274!Dialectologie Latijn>
470 [\02,ca\]<!077999274!Dialectologie Cyrillisch>
470 [\02,ga\]<!077999274!Dialectologie Grieks>
470 [\02,ha\]<!077999274!Dialectologie Hebreeuws>

Links-rechts en rechts-links schrift

Algemene uitgangspunten

De meeste schriften worden evenals het westerse (Latijnse) schrift van links naar rechts geschreven, gelezen e.d. Er zijn enkele uitzonderingen. De bekendste zijn Hebreeuws en Arabisch, die van rechts naar links worden geschreven, gelezen e.d.

De IFLA heeft zich over dit onderwerp uitgesproken. In Appendix B Bi-directional records van https://www.ifla.org/VII/s13/pubs/isbdcr-final.pdf staat het volgende: Bi-directional records are multi-script records in scripts written from left to right and scripts written from right to left.

Unless the direction of the script changes within an element, each change of script begins on a new line of the description at the appropriate margin. Prescribed punctuation is given at the start of the new element in the style required by the script, except for the prescribed point, comma or semi-colon, which are given at the end of the previous element in the style required by the script (see also 0.4 Punctuation). Thus, the point of the point, space, dash space (. ) ends the previous element and the dash begins the following element on a new line at the appropriate margin.

Uit bovenstaand citaat kunnen de volgende conclusies getrokken worden:

  1. Ieder karakter in een record heeft een richting.

  2. Presentaties worden opgedeeld in elementen.

  3. Ieder element van een presentatie wordt afhankelijk het schrift links of rechts (op het scherm) gepresenteerd. Of beter geformuleerd, een schrift dient te worden uitgelijnd in de leesrichting die bij het betreffende schrift hoort. Hebreeuwse en Arabische elementen dienen dus rechts te beginnen. Voor onder meer Latijnse elementen geldt het omgekeerde.

  4. Om een element op de juiste wijze te kunnen presenteren dient per element vastgesteld te worden welk schrift dit element voornamelijk bevat. Het is immers mogelijk dat een element karakters met verschillende schriftrichtingen bevat.

  5. Bij wisseling van schriftrichting dient het element op een nieuwe regel te worden geplaatst met de correcte uitlijning.

  6. Opeenvolgende elementen met het zelfde schrift qua richting worden in de leesrichting achter elkaar geplaatst op dezelfde regel.

Idealiter zou een element samenvallen met een kmc. Echter, de werkelijkheid is veel gecompliceerder. Immers, binnen een en dezelfde kmc kunnen verschillende schriftsoorten voorkomen waaronder links-rechts en rechts-links schriften. Dit geldt niet alleen voor het titel-auteursveld, maar ook voor andere kmc's. Dit impliceert dat de schriftcode die voor de gehele kmc geldt, ongeschikt is om het schrift van de elementen te bepalen. Je kunt hooguit zeggen dat een (aanzienlijk) deel van de elementen en misschien wel alle elementen van de kmc het schrift zullen bevatten dat in dat subveld is gedefinieerd.

E.e.a. betekent dat als algemeen principe op subveldniveau dient te worden ingezoomd om de data in de verschillende presentaties correct weer te kunnen geven. Dit uitgangspunt impliceert dat een element als zodanig als een geheel wordt beschouwd, en niet in kleinere onderdelen wordt opgesplitst als de schriftrichting binnen een element wisselt.

In bepaalde gevallen dient een aantal subvelden bij elkaar gehouden te worden, d.w.z. als een enkel element te worden behandeld, ondanks het feit dat het schrift qua richting kan wisselen. Kortom, een element kan in specifieke gevallen uit meerdere subvelden bestaan.

Voorbeelden hiervan zijn de ingangen van persoonlijke en corporatieve auteurs (kmc 3000, kmc 321X e.d.) en congressen (kmc 316X e.d.). Hetzelfde geldt voor kmc's zoals 7120 (holding) en 710X (signatuur).

Bibliografische interpunctie

Deze paragraaf gaat over bibliografische interpunctie en niet over de interpunctie die binnen een subveld voorkomt.

De IFLA heeft zich over dit onderwerp gebogen. Om te beginnen twee citaten uit https://www.ifla.org/VII/s13/pubs/isbdcr-final.pdf. Het eerste citaat is hierboven ook opgenomen, maar voor de helderheid hier nogmaals weergegeven.

Unless the direction of the script changes within an element, each change of script begins on a new line of the description at the appropriate margin. Prescribed punctuation is given at the start of the new element in the style required by the script, except for the prescribed point, comma or semi-colon, which are given at the end of the previous element in the style required by the script (see also 0.4 Punctuation). Thus, the point of the point, space, dash space (. ) ends the previous element and the dash begins the following element on a new line at the appropriate margin.

Het tweede citaat luidt:

0.4.11 When information is given in scripts written from right to left, commas and semi-colons used as prescribed punctuation are reversed when that is the style of the script. Similarly, the point, space, dash, space combination of prescribed punctuation reads from right to left and the meanings of open and closed parentheses and square brackets are reversed. The diagonal slash and groups of Western arabic numerals that are not reversed in such scripts are not reversed when given.

Uit bovenstaande citaten kunnen de volgende conclusies getrokken worden t.a.v. de bibliografische interpunctie:

  1. De punt-spatie-streep-spatie (. - ) die staat tussen twee (sub)velden met een verschillende schriftrichting wordt verdeeld over twee elementen. De punt-spatie staat in het ene element, en de streep-spatie in het volgende. De scheiding ligt in dit geval tussen de punt en de streep.
  2. De punt (.), de komma (,) en de puntkomma (;) worden beschouwd als de afsluitende interpunctie van een element. OCLC beschouwt ook als afsluitende interpunctie: de afsluitende ronde haak ()), de afsluitende vierkante haak (]) en de afsluitende dubbele quote ().
  3. Overige bibliografische interpunctie, zoals de dubbele punt (:), het is-gelijk-teken (=), de slash (/), worden beschouwd als de start interpunctie van een element.

OCLC beschouwt ook als startinterpunctie: de start ronde haak((), de start vierkante haak ([), de start dubbele quote (), het plusteken (+) en het liggende streepje (-).

Online expansie

Titelrecords en thesaurusrecords kunnen meerschriftig zijn. Records kunnen met elkaar via een PPN-link verbonden zijn. Dit kunnen links tussen titels en thesauri, tussen titels onderling en tussen thesaurusrecords onderling zijn. De geëxpandeerde gegevens dienen qua schrift in principe overeen te komen met de schriftcode in de kmc waarin de PPN-link staat.

Voorbeeld

In onderstaand thesaurusrecord komen de naam en het geboortejaar zowel in Latijns schrift (ba) als in het Cyrillisch, in dit geval Russisch (cr) voor.

005 Tpx
110 [\01,ba\]Reinier Pieter@Tuinzaad
110 [\01,cr\]РеиниерПиетер@Туинзаад
300 [\01,ba\]1953-
300 [\01,cr\]1953-

In onderstaand titelrecord is de expansie in kmc 3000 afhankelijk van de schriftcode in deze kmc. In het eerste geval wordt gekeken of in het gelinkte thesaurusrecord cr (Russisch schrift) varianten van kmc's voorkomen. Dit is het geval bij kmc 110 en kmc 300 die beide tot de expansie behoren. Hetzelfde geldt voor de Latijnse (ba) variant van kmc 3000.

Voorbeeld

0500 Aax
...
3000 [\01,cr\]Реиниер@Туинзаад!<PPN>!РеиниерПиетер@Туинзаад (1953-)
3000 [\01,ba\]Reinier@Tuinzaad!<PPN>!Reinier Pieter Tuinzaad (1953-)
...
4000 [\01,cr\]Тител-енаутеурсвелд
4000 [\01,ba\]Titel- en auteursveld
....

Maar als in kmc 3000 een schriftcode wordt gehanteerd waarvan in het gelinkte thesaurusrecord geen equivalent bestaat, wordt er niets geëxpandeerd. In onderstaand voorbeeld bevat de eerste kmc 3000 de Arabische schriftcode fa. In het thesaurusrecord komt echter geen Arabische variant van de kmc's 110 en 300 voor.

Voorbeeld

...
3000 [\01,fa\]رِِنِِر@تُِنزََد!<PPN>!
3000 [\01,ba\]Reinier@Tuinzaad!<PPN>!Reinier Pieter Tuinzaad (1953-)
...

 

Wil men een correcte expansie van de auteursnaam e.d. in het Arabisch hebben, dan dient men deze toe te voegen aan het thesaurusrecord.

Als in een kmc geen volgnummer en schriftcode worden ingevuld, wordt ervan uitgegaan dat de betreffende kmc Latijns schrift bevat. Voor de expansie betekent dit dan dat de Latijnse variant wordt getoond.

In onderstaand thesaurusrecord komen de naam zowel in Latijns schrift (ba) als in het Cyrillisch (Russisch) (cr) voor. Maar bij het geboortejaar is geen schriftcode aangegeven.

In onderstaand titelrecord wordt het geboortejaar alleen getoond in de expansie in Latijns schrift (ba), omdat in de expansie ervan wordt uitgegaan dat als de schriftcode in een kmc ontbreekt, de betreffende kmc Latijns schrift bevat. Vandaar dat in de Cyrillische (Russische) expansie van kmc 3000 het geboortejaar ontbreekt.

Ook voor kmc 300 zijn het volgnummer en de schriftcode relevant. Kmc 300 bevat immers vrije tekst. Dit impliceert dat de leef-, geboorte-, sterf- en werkjaren in verschillende schriften kunnen worden ingevuld, zoals Europees Arabisch, Arabisch-Indisch en Chinees. Maar ook andere schriften zijn in principe mogelijk.

Verder is het zo dat deze kmc niet alleen cijfers kan bevatten, maar ook afkortingen als 'ca.' (circa) en 'fl.' (floruit). Dit zijn afkortingen in Latijns schrift.

Voorbeeld

005 Tpx
110 [\01,ba\]Reinier Pieter@Tuinzaad
110 [\01,cr\]РеиниерПиетер@Туинзаад
300 1953-
...
3000 [\01,cr\]Реиниер@Туинзаад!<PPN>!РеиниерПиетер@Туинзаад
3000 [\01,ba\]Reinier@Tuinzaad!<PPN>!Reinier Pieter Tuinzaad (1953-)
...

of

...
3000 [\00,cr\] Реиниер@Туинзаад!<PPN>!Реиниер Пиетер@Туинзаад
...

Voorbeeld thesaurusrecord, koepeltitel en titelrecord met expansies

Hieronder staat een voorbeeld van een Russische persoonsnaam. In het record zijn de meest bekende naamsvorm (kmc 100), de meest uitgebreide naamsvorm (kmc 110) en het geboorte- en sterftejaar zowel in het Cyrillisch (Russisch) als in het Latijnse schrift ingevoerd. De eerste kmc 100, 110 en 300 bevat Cyrillisch schrift, omdat de persoon van Russische oorsprong is. In de tweede kmc 100 en 110 staat de Latijnse transliteratie, en in de tweede kmc 300 staat niet de Latijnse transliteratie, maar de afkorting in het Nederlands!

005 Tpx
007 /1ru
100 [\01,cr\]Ф.М.@Достоевски
100 [\01,ba\]F.M.@Dostoevskij
110 [\01,cr\]ФёдорМихайлович@Достоевски
110 [\01,ba\]Fëdor Michajlovič@Dostoevskij
300 [\01,cr\]ok. 1821-ok. 1881
300 [\01,ba\]c. 1821-c. 1881

Hieronder staat een koepeltitel waarin kmc 4000, 4030 en 4062 in het Cyrillisch en het Latijnse schrift zijn opgenomen.

0500 Abx
1100 1998 $ 1998-
1500 /1rus
1700 /1ru
4000 [\01,cr\]@Библиотека мировой литературы
4000 [\01,ba\]@Biblioteka mirovoj literatury
4030 [\02,cr\]Москва : Художественнаялитература
4030 [\02,ba\]Moskva : Chudoestvennaja literatura
4062 [\03,cr\]24 см
4062 [\03,ba\]24 sm

Hieronder staat een titelrecord met diverse PPN-links. In de eerste kmc 3000 staat de naam in Cyrillisch schrift. Deze kmc is gecodeerd met de taalcode 'cr' voor Russisch. Omdat in het thesaurusrecord ook Cyrillische naamsvormen voorkomen, staat in de eerste kmc 3000 een expansie in Cyrillisch schrift.

In de tweede kmc 3000 staat de Latijnse transliteratie (ba). De bijbehorende expansie wordt getoond.

In de kmc's 4180 staan achtereenvolgens het Cyrillisch en de Latijnse expansie. De eerste kmc 4180 heeft de taalcode 'cr' (Russisch) en de tweede 'ba' (Latijn). In de koepeltitel dienen eveneens beide schriften te zijn opgenomen, elk in een aparte kmc 4000 met de bijbehorende schriftcode.

2000 [\01,cr\]5280032026*пер
2000 [\01,ba\]5280032026*per
3000 [\01,cr\]Ф.М.@Достоевски!318312387!Фёдор Михайлович Достоевски (ok.1821-ok. 1881)
3000 [\01,ba\]F.M.@Dostoevski!318312387Fëdor Michajlovič Dostoevskij (c. 1821-c. 1881)
4000 [\01,cr\]@Идиот : роман / Ф.М. Достоевски
4000 [\01,ba\]@Idiot: roman / F.M. Dostoevski
4030 [\01,cr\]Москва : Художественная литература
4030 [\01,ba\]Moskva: Chudoestvennaja literatura
4060 [\01,cr\]413с
4060 [\01,ba\]413 s
4061 [\01,cr\]илл
4061 [\01,ba\]ill
4062 [\01,cr\]24 см
4062 [\01,ba\]24 sm
4170 [\01,cr\]@Библиотека мировой литературы
4170 [\01,ba\]@Biblioteka mirovoj literatury
4180 [\01,cr\]!317966308!@Библиотека мировой литературы
4180 [\01,ba\]!317966308@Biblioteka mirovoj literatury

Karaktersets e.d.

Pica karakterset in Unicode

Er bestaat inmiddels een overzicht van de Pica karakterset in Unicode. Pica karakterset in Unicode (pdf)

Griekse karakters, Latijnse transliteratie en indexering

Er bestaat inmiddels een overzicht van de Griekse karakterset in Unicode. Griekse karakters, Latijnse transliteratie en indexering (pdf)

Cyrillische karakters, Latijnse transliteratie en indexering

Er bestaat inmiddels een overzicht van de Cyrillische karakterset in Unicode. Cyrillische karakters, Latijnse transliteratie en indexering (pdf)

Europese Arabische cijfers versus Arabisch-Indische cijfers

Het Pica formaat kent diverse kmc's waarin cijfers voorkomen en die streng worden gevalideerd op inhoud. Dit geldt voor kmc 1100 (jaar van uitgave), kmc 2000 e.d. (ISBN), 2010 e.d. (ISSN), maar ook voor het ISSN in reeksvelden e.d.

Echter, naast Europese Arabische cijfers bestaan er Arabisch-Indische cijfers.

Voor de duidelijkheid staat hieronder een overzichtje met beide varianten.

Europees 0 1 2 3 4 5 6 7 8 9
Arabisch-Indisch ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩

In de binnen WinIBW gebruikte standaard Unicode transliteratietabel van Latijn naar Arabisch (en van Arabisch naar Latijn) hebben we e.e.a. zodanig aangepast dat Europese Arabische cijfers niet worden omgezet in Arabisch-Indische cijfers. De Arabisch-Indische cijfers worden omgezet naar Europese Arabische cijfers.

Controlecijfer X in ISBNs, ISSNs e.d.

Tot nu toe is het gebruikelijk (geweest) om voor het controlecijfer X in een ISBN, ISSN e.d. de hoofdletter X te gebruiken. Bij het translitereren van een ISBN e.d. met een dergelijk controlecijfer naar het Arabisch, Grieks, Cyrillisch e.d. dient bedacht te worden dat de hoofdletter X als zodanig wordt getranslitereerd, dus naar het Arabische, Griekse, Cyrillische e.d. schrift.

Als catalogiseerder hebt u diverse opties om dit probleem op te lossen:

  • Na de transliteratie kunt u e.e.a. corrigeren, d.w.z. de hoofdletter X in Latijns schrift toevoegen.
  • Bij de invoer kan het aparte Unicode karakter voor de Romeinse Ⅹ (U+2169; Roman Numeral Ten) gebruikt worden. Deze behoudt zijn waarde bij het translitereren.

Aandachts- en discussiepunten

De volgende punten zijn onderwerpen waarover nog verder nagedacht dient te worden, maar die in het kader van het werken met Unicode in een steeds internationaler wordende context van belang zijn.

Taal en schrift van het record

Volgens de bestaande ISBD regels dienen het collatieveld, de annotaties e.d. gesteld te worden in de taal en het schrift van het bibliografisch bureau. Omdat er steeds meer in een internationale context wordt geopereerd, dient dit uitgangspunt waarschijnlijk opnieuw overdacht te worden. In het bijzonder speelt deze kwestie bij publicaties in niet-Latijnse schriften.

Een concreet voorbeeld: in hoeverre neem je Nederlandse formuleringen e.d. op in een titelrecord van een volledig in Grieks schrift gepubliceerde uitgave? Is het niet logischer om in principe het record volledig in het Grieks te maken, zeker omdat dergelijke records in principe (alleen) door specialisten worden ingevoerd en gelezen?

Onderscheid vertalen en translitereren

Een ander belangrijk punt is het onderscheid tussen translitereren en vertalen.

In een titelrecord kan een samenvatting (bijv. in kmc 4207) in het Russisch voorkomen bij een in het Russisch verschenen publicatie. Deze kmc kan getranslitereerd worden in Latijns schrift. Dat is echter iets anders dan een samenvatting in het Nederlands of Engels van dezelfde publicatie. Deze samenvattting kan een vertaling van de Russische tekst of onder meer een zelf geformuleerde tekst zijn.

De geraadpleegde specialisten in de diverse niet-Latijnse schriften hebben unaniem aangegeven dat men het onderscheid tussen translitereren en vertalen essentieel vindt.

Maar ook als het gaat om thesaurusrecords bijv. van trefwoorden, dient men het onderscheid tussen vertalen en translitereren scherp in de gaten te houden.

Stel dat men besluit om Griekse of Russische varianten van trefwoorden in te voeren. Technisch gezien is dit geen probleem. We nemen als voorbeeld het trefwoord Economie. De bijbehorende Griekse en Russische varianten zijn in dit geval geen transliteratie van het woord Economie, maar het begrip Economie in de Griekse en Russische taal!

Onderscheid schrift en taal

Een bijkomende kwestie is in hoeverre het nodig c.q. wenselijk is om binnen een schriftsoort diverse talen te kunnen aangeven. Voorbeeld: de code ba betekent Latijns schrift. Maar dit kan Nederlands, Engels, Italiaans e.d. zijn. Voor een dergelijke verfijning is momenteel (nog) niet gekozen. In de praktijk zal moeten blijken in hoeverre een dergelijke nuancering wenselijk is.