Biblioteka 2.0 on Facebook
Biblioteka 2.0 Strona Główna

Biblioteka 2.0
Forum społeczności czytelników i bibliotekarzy cyfrowych

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  AlbumAlbum  DownloadDownload

Poprzedni temat «» Następny temat
stare druki - transkrypcja w opisach
Autor Wiadomość
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2013-09-16, 07:55   stare druki - transkrypcja w opisach

Czy ktoś uczony mógłby wytłumaczyć, dlaczego "Polonia siue de sitv, popvlis, moribvs, magistratibvs et Repvblica", a nie "Polonia sive de situ, populis, moribus, magistratibus et Republica"?

Nie chodzi mi szczególnie o ten konkretny przykład (łatwo o inny, także z innych bibliotek cyfrowych), ale o zasady, które rządzą przygotowaniem opisów starych druków. Kiedy "v", kiedy "u"? I dlaczego?

Nie mam pod ręką polskiej normy PN-N-01152-8 Opis bibliograficzny: stare druki, która może by coś wyjaśniła, znalazłem natomiast dokument Międzynarodowy Znormalizowany Opis Bibliograficzny, gdzie można przeczytać:

Cytat:
Zachowuje się pisownię słów przejętych z zasobu, ale jeżeli instytucja katalogująca nie ma dostępu do ligatur i innych dawniej stosowanych form liter oraz znaków diakrytycznych, to można zapisać je za pomocą współcześnie stosowanych znaków.

I dalej:

Cytat:
Wczesne czcionki drukarskie zawierały tylko jedną literę dla wielkich liter I i J oraz jedną dla U i V. (Małe litery i/j i u/v również stosowano zamiennie, różnice wynikały raczej ze stosowanych czcionek i konwencji graficznych, niż z ortografii, ale obie litery występowały w większości czcionek drukarskich). Wielkie litery U i V zaczęto rozróżniać na początku XVI wieku, rozróżnienie I i J oraz i i j, u i v nastąpiło później w tym samym stuleciu.

W międzynarodowym środowisku katalogujących stosuje się kilka nieznacznie różniących się od siebie zasad transkrypcji dla I i J oraz U i V. Różnice wahają się od zapisu wielkich liter zgodnie z oryginałem do przekształcania w większości przypadków V w u. Należy stosować jedną spójną metodę konwersji wybraną przez instytucję katalogującą.

Pożytek z tego jednak umiarkowany, bo nie jest jasne, czy "zachowanie pisowni" z pierwszego akapitu powinno dotyczyć ortografii, czy także "konwencji graficznych", wspomnianych w drugim akapicie. No a zalety stosowania "jednej spójnej metody" przez instytucję katalogującą można sobie w buty wsadzić, kiedy w grę wchodzą bazy powstałe w wyniku agregacji opisów z różnych instytucji.

Zerknąłem jak to wygląda w FBC. Jedni stosują transkrypcję do wartości fonetycznej (sive, situ), inni trzymają się wzorca graficznego zachowując kształt znaków. Niektórzy dają wariant tytułu, inni nie. Tam, gdzie opis, jak się wydaje, chce dokładnie naśladować stronę tytułową egzemplarza, wierność często nie obywa się bez kopromisów, bo wprawdzie v jest oddawane jako v, ale np. ligatury (æ, œ) albo długie s zamieniane są na "ae", "oe" czy zwykłe "s", choć przecież znaków w unikodzie nie brakuje. Z p. widzenia użytkownika wyszukiwarki szczególnie niewdzięczne są przypadki, kiedy oryginał stosuje konwencję typograficzną: "V" w wersalikach, "u" w minuskułach. W opisach wersalik zwykle znika (w wyszukiwaniu wielkość znaków nie ma zresztą znaczenia), ale dwojaki zapis fonetycznego "u" często pozostaje, zatem wyszukujący musi zgadywać, czy lepsze będzie zapytanie "polonia siue de sitv", czy "polonia sive de sitv", czy może "polonia sive de situ"... Mówiąc krótko, mały dramat.

Jakieś propozycje uporządkowania tego interesu i ułatwienia życia czytelnikom?
Ostatnio zmieniony przez sk 2013-09-17, 07:37, w całości zmieniany 1 raz  
 
     
sefora 

Dołączyła: 01 Paź 2007
Posty: 41
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 3/13
 23%
Wysłany: 2013-09-16, 15:41   

(oczyma mej wyobrazni widze mine jednego kolegi, z ktorym toczylam dyskusje o "v" i "u" :) )

Sadze, ze nie ma jednolitego rozwiazania. Niestety co biblioteka to inne podejscie do problemu. Osobiscie bylabym za tym by pisownie uwspolczeniona? ujednolicona? wkladac to "innego tytulu"... ale ja osobiscie nie znam laciny i nie podejme sie "uwspolczeniania" pisowni...

U nas pobieramy opisy straych drukow z OPACa, opisy przekazywane sa do baz miedzynarodowych wiec chce wierzyc ze robione sa jak trzeba...
http://centrum.nukat.edu....ruki_130711.pdf
_________________
A. Wróbel
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2013-09-18, 12:07   

sefora napisał/a:
Sadze, ze nie ma jednolitego rozwiazania. Niestety co biblioteka to inne podejscie do problemu.

To brzmi, niestety, aż nadto realistycznie...

sefora napisał/a:
Osobiscie bylabym za tym by pisownie uwspolczeniona? ujednolicona? wkladac to "innego tytulu"...

Być może to jedyny możliwy kompromis, który umożliwiałby normalne funkcjonowanie wyszukiwania. Chciałbym tylko jeszcze zauważyć, że problem dotyczy nie tylko tytułu, podobne rozbieżności pojawiają się również np. w atrybucie Wydawca/Miejsce wydania.
 
     
sefora 

Dołączyła: 01 Paź 2007
Posty: 41
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 3/13
 23%
Wysłany: 2013-09-18, 15:57   

sk napisał/a:
Chciałbym tylko jeszcze zauważyć, że problem dotyczy nie tylko tytułu, podobne rozbieżności pojawiają się również np. w atrybucie Wydawca/Miejsce wydania.


Tez sie nad tym zastanawialam...
W sumie moznaby w "slowniku" podczepiac rozne zapisy. Pod Kraków dodac, Krakou, Krakov itd. Ale zatrzymalam sie na mysli: "a co gdy ktos chce "ksiazki" z tylko "Wroclaw", a nie chce "Breslau"?"... itp., itd.

W przypadku wydawcy moznaby robic podobnie, ale pamietam, ze byl jakis problem z wyszukiwaniem wieloczlonowych nazw "podczepionych".
Dodatkowo pojawia sie pytanie, w NUKAT zaczeto tworzyc KHW (kartoteke) wydawcow, wiec moze zamiast "wydawcy z ksiazki" wklejac ujednolicona nazwe wydawcy...?

AW
_________________
A. Wróbel
 
     
Grzegorz B. 
Grzesiek

Wiek: 54
Dołączył: 23 Lis 2007
Posty: 44
Skąd: Zabrze
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 6/13
 46%
Wysłany: 2014-02-11, 21:48   

sefora napisał/a:
(oczyma mej wyobrazni widze mine jednego kolegi, z ktorym toczylam dyskusje o "v" i "u" :) )

Sadze, ze nie ma jednolitego rozwiazania. ...
ujednolicona? wkladac to "innego tytulu"...
ale ja osobiscie nie znam laciny i nie podejme sie "uwspolczeniania" pisowni...
U nas pobieramy opisy straych drukow z OPACa, opisy przekazywane sa do baz miedzynarodowych wiec chce wierzyc ze robione sa jak trzeba...


sk napisał/a:
... Chciałbym tylko jeszcze zauważyć, że problem dotyczy nie tylko tytułu, podobne rozbieżności pojawiają się również np. w atrybucie Wydawca/Miejsce wydania.


No tak. Łacina jak i transliteracja sformułowań zapisanych cyrylicą to dwa poważne problemy, które bardzo często utrudniają przygotowanie w przyzwoity sposób metadanych.

To, że na chwilę obecną brak jest jednolitego rozwiązania, nie oznacza, że takie rozwiązanie nie może powstać, czy też być zaproponowane i opisane w szczegółowy sposób. Korzyść byłaby ogromna (i to nie tylko dla bibliotekarzy, dyski twarde też by się ucieszyły ;-) ).
W jednym tylko opisie obiektu e-bUW można było doszukać się zwrotów "Cracow", Cracouie", "Kraków". No i OK, jak wspomniała Sephora, tak jest w OPACu, więc załóżmy, że święte. Bardzo słusznie zauważył Skarbimir, ze kłopotliwe zwroty łacińskie dotyczą nie tylko tytułu, więc zastosowanie atrybutu typu alternateTitle problemu nie rozwiąże.
Jeżeli bazę danych będzie się uzupełniać raz od strony "fonetycznej" (np. Cracovie") raz zgodnie z wzorcem graficznym (np. "Cracouie"), to w skrajnym przypadku obciążymy dyski naszego serwera nie przykładowo pojemnością 2 TB danych opisowych, ale 4 TB, a może i 6 TB (jeżeli trzecia i czwarta forma czy też wariant tego samego wyrażenia będzie zachowywany). Dyski oczywiście to wytrzymają, czas wyszukiwania informacji o pewien interwał się wydłuży, ale zadowolona będzie ta część bibliotekarzy biblioteki, która jest zwolennikiem transkrypcji fonetycznej jak i ta część bibliotekarzy, dla których wzorzec graficzny jest wzorcem nie do naruszenia. Na pewno taka baza czy też katalog lokalny nie będzie "tworem" jednorodnym, budowanym optymalnie, i już to spostrzeżenie może inspirować do pewnych poszukiwań czy też dalszej dyskusji.
Nie raz dowiadywałem się, że lepiej metadanych w ogóle nie wprowadzać, niż wprowadzać takie, które zawierają "uchybienia". Ta bibliotekarska wskazówka nie całkiem idzie w parze z "wstępną propozycją", która padła w tej dyskusji, by poszukiwać kompromisów, które wg mnie problem rozwiążą ale, ... albo w pewnym zakresie, albo jedynie w pewnym okresie.
Przyjrzałem się jeszcze raz metodom, jakie wypracowano w United Archives (UK). Abstrahując od tego, że stosują metadane opisowe odpowiadające standardowi MODS (zatem w kontenerze METS) a nie Dublin Core, to metadane, które opisują ich obiekty można weryfikować wzdłuż i wszerz. Innymi słowy, obiekt cyfrowy jest nie tylko opisany określoną "porcją" informacji, ale każdą z elementarnych wartości takiego opisu można poddać weryfikacji czy też autoryzacji. I tu zaczyna się ten problem, na który natknął się Skarbimir. Można - opisując przykładowo lokalizację oryginału czy też miejsce wydania - wpisać CRACOUIE. Można, ale na tym koniec. Żadnego relatora baz zewnętrznych czy też kodu autoryzacyjnego dla takiego "wynalazku słownego" nie uda nam się z tym wynalazkiem skojarzyć. A to ograniczy widoczność naszego obiektu w sieci. Skoro jesteśmy w e-bUW, może przykład. Skłaniając ku - wg mnie jedynej słusznej - propozycji "uwspółcześniena" (przez co rozumiem transkrypcji fonetycznej), miejsce wydania - w tym wypadku - Kodexu Łaskiego można opisać:

<mods:originInfo eventType="publication">
<mods:place supplied="yes">
<mods:placeTerm type="text" authority="marccountry">Poland</mods:placeTerm>
<mods:placeTerm type="code" authority="marccountry">pl</mods:placeTerm>
</mods:place>
<mods:place>
<mods:placeTerm type="text" authorityURI="http://lccn.loc.gov/n79125145" valueURI="http://id.loc.gov/authorities/names/n79125145.html">Cracovie</mods:placeTerm>
</mods:place>
<mods:publisher>in edibus Joha[n]nis Haller [...] imp[re]ssum</mods:publisher>
<mods:dateOther encoding="marc">1506</mods:dateOther>
<mods:issuance>single unit</mods:issuance>
</mods:originInfo>

Tym sposobem każdy użytkownik, system, wyszukiwarka nie ma najmniejszego problemu, by korzystając z wariantów "poprawnego" wyrażenia odszukać w sieci "krakowskie" cudeńka (pomimo, iż zapisane łaciną!). Wystarczy, że skorzysta z powyższych linków valueURI lub authorityURI. Każdy z tych linków nie tylko potwierdzi fakt, że istnieje na tej planecie miejscowość Cracovie, ale dodatkowo udostępni szereg wariantów jej brzmienia w różnych językach. Zatem - jeden link i brak dodatkowej pracy bibliotekarza, by wszystkie warianty słowa stały się dostępne (np. wyszukiwarkom). I na odwrót, gdybym - jak to określiła Sephora - po dyskusji, zbudował opis oparty o zwrot CRACOUIE, nie byłby on do niczego przydatny. Ani weryfikacji, ani autoryzacji, ani wariantów. Ot i wot, jakaś tam miejscowość w jakimś kraju. Nikt nie wie o co chodzi. Chociaż trzeba przyznać, że wpis taki w pełni oddawałby to, co na okładce tego Kodexu, ktoś namalował ponad 500 lat temu. Tylko, że dziś nikt tego by w sieci nie odszukał.
I może w tym miejscu należy zapytać wprost: "Co jest ważniejsze - czy to, by czytelnicy bibliotek mogli odszukać interesujący ich obiekt, czy też to, jak kilkaset lat temu autor/wydawca/drukarz prywatnie interpretował wygląd literek U-V, f-S itd, itp. Systemy informatyczne są bezduszne, operują bez emocji. To, co zostanie wprowadzone, będzie przetworzone. Za to, jak "to coś" będzie wprowadzone odpowiada już osoba wykonująca opis. I od tego wprowadzenia zależy również wyszukiwanie.
Przy okazji starodruków e-bUW i identycznych kłopotów opisanych przez Skarbimira. Męczyłem się z opisami nutek do lutni (tabulatur) wydanych bodaj w Grüssav. Pierwsze skojarzenie - to gdzieś w Niemczech. Po poprawnym opisie miejsca wydania wyszło nieco inaczej :

<mods:subject>
<mods:hierarchicalGeographic authority="lcsh" authorityURI="http://lccn.loc.gov/n97091081" valueURI="http://id.loc.gov/authorities/names/n97091081.html">
<mods:city xml:lang="gw">Grüssau</mods:city>
</mods:hierarchicalGeographic>
</mods:subject>
<mods:subject>
<mods:hierarchicalGeographic authority="lcsh" authorityURI="http://lccn.loc.gov/n97091081" valueURI="http://id.loc.gov/authorities/names/n97091081.html">
<mods:country>Poland</mods:country>
<mods:province>dolnośląskie</mods:province>
<mods:city xml:lang="pl">Krzeszów</mods:city>
</mods:hierarchicalGeographic>
</mods:subject>

Podsumowując, jeżeli jednym z zadań jakie "powierza" się metadanym deskryptywnym jest to, by ułatwiły lub wręcz odszukały w sieci obiekt o określonych przez czytelnika cechach, transkrypcja fonetyczna sformułowań łacińskich (do poprawnego ich zapisu) jest najlepszym do osiągnięcia tego celu środkiem.
Trudno tez nie zgodzić się z opinią Sephory, że biegła znajomość łaciny nie jest normą, bo tak po prostu nie jest. Ale są i takie zwroty, np. Varsovie-Varsouie, które nawet gdyby ktoś nie chciał to i tak zauważy, że coś "tu nie gra". I dla chociażby takich sytuacji optowałbym bezwzględnie za zastosowaniem transkrypcji, nawet kosztem zanegowania przytoczonej opinii "pobieramy opisy starych druków z OPACa ... chce wierzyć ze robione są jak trzeba". Mógłbym "z własnego podwórka" przytoczyć inną opinię : "każdy działający program jest przestarzały".
Na pewno - w bibliotekach - sposoby wykonywania opisów obiektów cyfrowych zmieniają się z czasem. Przykładem może być przywołany tu - ebUW. Dawniej, tytuły rosyjskich czasopism dostępne były wyłącznie jako transliteracja wg określonej normy. Obecnie, odnaleźć można tytuły zapisane - po ludzku - cyrylicą. Skoro taką zmianę udało się wprowadzić, przed kolejnymi (bardziej współczesnymi :-? ) - drzwi stoją otworem.
_________________
"Wszystko jest trudne do czasu, gdy stanie się proste"
 
     
sefora 

Dołączyła: 01 Paź 2007
Posty: 41
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 3/13
 23%
Wysłany: 2014-03-24, 13:25   

Jakis czas temu zadano mi pytanie, na ktore odpowiem rowniez na formum, moze sie komus przyda - o ile moja wiedza jest sluszna :)
Pytanie brzmialo: "czemu w normie ISO 639-2 kilka jezykow opisywanych jest dwoma trojliterowymi kodami i przy jakich publikacjach nalezy stosowac odpowiednia "trojke",? W normie na stronie LoC widnieje: "There are 21 languages that have alternative codes for bibliographic or terminology purposes."
1) obecnie jest juz ponad 25 jezykow o podwojnej "trojce" tyle ma polskie tlumaczenie PN ISO 639-2
2) kwestia nie jest do jakich publikacji stosowany jest odpowiedni kod w przypadku wspomnianych 25 jezykow, a raczej do jakich aplikacji sa te kody uzywane (i przez kogo) :) W aplikacjach bibliotecznych i bibliotekarze maja stosowac ISO 639-2/B (pierwsza kolumna), a w aplikacjach technicznych ISO 639-2/T (druga kolumna) stosowac moga np. lingwisci ;)...
3) czysto teoretycznie, w przypadku osob niezobligowanych pobieraniem danych z NUKAT, moze stosowac ISO 639-3 lista kodow jest dluzsza, obejmuje chyba z 7 tys. kodow jezykow :). Poza tym "2" chyba nie jest rozwijana... "3" nie znalazlam w PKN, ale nie znaczy ze jej tam nie ma :)

A.Wrobel
_________________
A. Wróbel
 
     
Wyświetl posty z ostatnich:   
Ten temat jest zablokowany bez możliwości zmiany postów lub pisania odpowiedzi
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
Biblioteka 2.0 : Forum społeczności czytelników i bibliotekarzy cyfrowych [Dokument elektroniczny] - Tryb dostępu http://forum.biblioteka20.pl
Korzystanie z portalu oznacza akceptację naszej polityki prywatności.
Strona wygenerowana w 0.08 sekundy. Zapytań do SQL: 10