Skip to main content
OCLC Support

7.Karaktersets e.d.

Karaktersets e.d.

Pica karakterset in Unicode

Er bestaat inmiddels een overzicht van de Pica karakterset in Unicode. Pica karakterset in Unicode (pdf)

Griekse karakters, Latijnse transliteratie en indexering

Er bestaat inmiddels een overzicht van de Griekse karakterset in Unicode. Griekse karakters, Latijnse transliteratie en indexering (pdf)

Cyrillische karakters, Latijnse transliteratie en indexering

Er bestaat inmiddels een overzicht van de Cyrillische karakterset in Unicode. Cyrillische karakters, Latijnse transliteratie en indexering (pdf)

Europese Arabische cijfers versus Arabisch-Indische cijfers

Het Pica formaat kent diverse kmc's waarin cijfers voorkomen en die streng worden gevalideerd op inhoud. Dit geldt voor kmc 1100 (jaar van uitgave), kmc 2000 e.d. (ISBN), 2010 e.d. (ISSN), maar ook voor het ISSN in reeksvelden e.d.

Echter, naast Europese Arabische cijfers bestaan er Arabisch-Indische cijfers.

Voor de duidelijkheid staat hieronder een overzichtje met beide varianten.

Europees 0 1 2 3 4 5 6 7 8 9
Arabisch-Indisch ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩

In de binnen WinIBW gebruikte standaard Unicode transliteratietabel van Latijn naar Arabisch (en van Arabisch naar Latijn) hebben we e.e.a. zodanig aangepast dat Europese Arabische cijfers niet worden omgezet in Arabisch-Indische cijfers. De Arabisch-Indische cijfers worden omgezet naar Europese Arabische cijfers.

Controlecijfer X in ISBNs, ISSNs e.d.

Tot nu toe is het gebruikelijk (geweest) om voor het controlecijfer X in een ISBN, ISSN e.d. de hoofdletter X te gebruiken. Bij het translitereren van een ISBN e.d. met een dergelijk controlecijfer naar het Arabisch, Grieks, Cyrillisch e.d. dient bedacht te worden dat de hoofdletter X als zodanig wordt getranslitereerd, dus naar het Arabische, Griekse, Cyrillische e.d. schrift.

Als catalogiseerder hebt u diverse opties om dit probleem op te lossen:

  • Na de transliteratie kunt u e.e.a. corrigeren, d.w.z. de hoofdletter X in Latijns schrift toevoegen.
  • Bij de invoer kan het aparte Unicode karakter voor de Romeinse Ⅹ (U+2169; Roman Numeral Ten) gebruikt worden. Deze behoudt zijn waarde bij het translitereren.