Biblioteka 2.0 on Facebook
Biblioteka 2.0 Strona Główna

Biblioteka 2.0
Forum społeczności czytelników i bibliotekarzy cyfrowych

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  AlbumAlbum  DownloadDownload

Poprzedni temat «» Następny temat
Kilka spraw do rozważenia
Autor Wiadomość
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2013-02-20, 21:11   

Bartłomiej Siedlarz napisał/a:

Jak najbardziej podkreśliłem, iż kwestia formatu nie jest najważniejsza.

No właśnie, cieszę się na to stwierdzenie i wątki które do niego prowadzą. Przyjmuję, że jego konsekwencją jest przekonanie o potrzebie rzetelnego ważenia decyzji o stosowaniu takiego czy innego formatu do prezentacji danych. I że w wyniku testów, eksperymentów może okazać się że tu sprawdza się DjVu, tam PDF, a gdzie indziej np. JPG, etc. Może nawet da się opracować jakieś prawidłowości i zalecenia, podobnie jak w przypadku rozdzielczości, głębi bitowych dla różnych typów dokumentów? Gorąco liczę na współpracę w tym zakresie. Ona jest najlepszym probierzem intencji.
Bartłomiej Siedlarz napisał/a:
Natomiast w kwestii podejścia do użytkowników spróbuję tym razem użyć metafory: jeżeli do biblioteki przyjdzie użytkownik, który czytać nie umie — bibliotekarz książek czytać mu nie będzie. Jedynie udostępni w takiej formie, w jakiej dokument jest — nie forma dzieła, lecz nieumiejętność czytania użytkownikowi przeszkadza, ogranicza, a nawet zniechęcić może.

Próbuję docenić ten wysiłek, lecz przykro mi, to kolejna niezbyt trafna analogia, w dodatku niezgodna z faktami. Po pierwsze nie przypuszczam by problemem użytkowników BC była nieumiejętność czytania publikacji (i dobrze o tym wiemy). To kwestia organizacji dostępu (vide: satyrycznie U. Eco -" O bibliotece", poniżej).
Po drugie - nie dość że obecnie bibliotekarze prowadzą różne programy typu literacy (media, information), to wówczas gdy analfabetyzm był problemem społecznym, robili i to. Nie wspomnę o wielu programach bibliotekarskich dla dzieci (nie umiejących czytać), które są wspierane przy nauce czytania i rozumienia tekstów. Zasada jest prosta - biblioteka (i jej" analogowy interfejs" do świata tekstów i innych mediów) jak najbardziej na miarę potrzeb i umiejętności użytkowników. Inna jest niepotrzebna.

Może już nie posługujmy się analogiami, bo chociaż ich dekonstrukcja to fajna zabawa, szkoda na to czasu.

W świecie gdzie bibliotekarze mają mocne poczucie za czyje pieniądze i dla kogo pracują - nie zauważyłem w ich kulturze zawodowej stosowania względem użytkowników bibliotek takiego pojęcie jak "ignorancja". W żadnym kontekście. I nie ma to związku z żadną polityczną poprawnością.

Co do owej "taniości" (i "drożyzny") polecam uwadze wzmiankowaną wyżej kwestię ekonomii uwagi.

A co do tego:
Bartłomiej Siedlarz napisał/a:
podejrzewałem już wcześniej czym mogłem go zszokować (dlatego, że teza dość kontrowersyjna i mało politycznie poprawna, niemniej warta omówienia).

oraz tego (Facebook)
Bartłomiej Siedlarz napisał/a:
Bardzo się cieszę z prowokacji, a nawet ze zszokowania.
o! ;-) - to proszę nie popadać w nadmierną euforię. Uderzyło mnie nie tyle nowatorstwo, innowacyjność, czy niepoprawność tezy. Pogląd o eksperckości bibliotecznych (i innych) fachowców do których sztuki i produktów muszą (jak chcą skorzystać) "doskoczyć" użytkownicy-ignoranci nie jest ani nowy i ani odkrywczy.
Bartłomiej Siedlarz napisał/a:
Remigiusz Lis napisał/a:
tak naprawdę chodzi o usability zasobów BC oraz o ich komunikacyjność (w tym indeksowanie).

Dokładnie. Moją intencją było skierowanie tego rozważania właśnie na to.
.
No to kierujmy!
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2013-02-20, 21:24   

U. Eco, O bibliotece:

(a właściwie antybibliotece - tradycyjnej)

"A. Katalogi winny zawierać jak najwięcej działów; trzeba bardzo pieczołowicie oddzielić katalog książek od katalogu czasopism, a oba od katalogu rzeczowego, jak również książki ostatnio nabyte od książek nabytych dawniej. Jeśli to tylko możliwe, ortografia w obu tych katalogach (nabytków nowych i dawnych) winna być odmienna [...]

C. Sygnatury winny być niemożliwe do przepisania, w miarę możliwości rozbudowane, aby ten, kto wypełnia rewers, nie miał nigdy dość miejsca na wpisanie ostatnich symboli i uznał je za nieważne, a dzięki temu obsługujący mógł zwrócic rewers z żądaniem uzupełnienia.

D. Czas między zamówieniem a dostarczeniem książki winien być bardzo długi.[...]

G. W miarę możliwości winno nie być w ogóle ani jednej fotokopiarki; jeśli jednak jakaś już się znajdzie, dostęp do niej winien być bardzo czasochłonny i kłopotliwy, cena wyższa niż na mieście, limity kopii bardzo niskie, nieprzewyższające dwóch albo trzech stroniczek.

H. Bibliotekarz winien uważać czytelnika za wroga, nieroba (w przeciwnym razie byłby przecież w pracy), za potencjalnego złodzieja.[...]

J. Dział informacji winien być nieosiągalny.

K. Należy zniechęcać do wypożyczania.

L. Wypożyczenia międzybiblioteczne winny być niemożliwe, a w każdym razie trwać całymi miesiącami. Najlepiej jednak zagwarantować sobie niemożliwość zapoznania się ze stanem posiadania innych bibliotek. [...]

N. Winno być całkowicie niemożliwe zjedzenie czegokolowiek w obrębie biblioteki i w żadnym razie nie powinno być mowy o posilaniu się poza biblioteką bez odłożenia wszystkich książek, z których się korzysta, tak by po wypiciu kawy trzeba było zamówić je od nowa.

O. Niemożliwe winno być odzyskanie czytanej książki następnego dnia.

P. Niemożliwe winno być uzyskanie informacji, kto pożyczył brakującą książkę. [...]" ;-)
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2013-02-21, 10:09   

anetadr napisał/a:
Owszem działalność edukacyjna jest bardzo ważna i jeśli użytkownik się do mnie zgłosi, to ja mu bardzo chętnie wytłumaczę co musi zainstalować, żeby plik się wyświetlał poprawnie i dlaczego do tej wersji użyliśmy djvu, a nie innego formatu. Zresztą na zajęciach ze studentami też ten problem dokładnie omawiam i tłumaczę co i jak. Sęk w tym, że większość użytkowników nie trafia ani do mnie, ani do innej biblioteki, ani nawet nie zadaje sobie trudu, żeby odpowiedzi na swoje pytanie szukać w sieci. I co wtedy? Ano różnie: albo próbują poradzić sobie sami, albo rezygnują. Obawiam się, że tych rezygnujących jest sporo. Dodam jeszcze takie kwiatki: jeden sprytniejszy czytelnik po otwarciu publikacji robi printscreeny, zapisuje je jako PDF i "puszcza" w sieć. Niektórzy przychodzą do biblioteki i skanują daną rzecz od nowa, a na zwróconą uwagę, że coś jest już w sieci, mówią, że wiedzą, ale się zniechęcili. Jeszcze inni przysyłają email do biblioteki z prośbą o przesłanie pliku w "dogodnym" formacie itd. Żebyśmy więc nie wylali dziecka z kąpielą.Aneta


Niestety, mam dokładnie takie same doświadczenia w związku ze "wsparciem" użytkowników via formularz kontaktowy. Ostatnio nawet robiłem za callcenter, prowadząc użytkownika telefonicznie po interfejsie. Życzenia przesłania w jakimś "wygodniejszym" formacie są nagminne. Czy to nie jest tak, że jeśli musimy tłumaczyć użytkownikowi dlaczego użyliśmy takiego a nie innego formatu dla danej publikacji, oznacza to, że użyliśmy złego formatu?

anetadr napisał/a:
Jest jeszcze inny aspekt bibliotek cyfrowych. Mam tu na myśli głównie publikacje naukowe. Problem ten dotyczy nie tylko djvu, ale także pdfów. Mianowicie publikacje z bibliotek cyfrowych są słabo widoczne (albo wcale) w Google Scholar. Mało tego, bibliografia załącznikowa z tych publikacji nie jest liczona w postaci cytowań przez Publish or Perish (sprawdziłam na kilkunastu naszych pracach naukowych). W ostatnim czasie problem ten stał się bardzo gorący, wręcz palący.Nasi naukowcy wciąż o to dopytują i zaczynają zastanawiać się nad stworzeniem instytucjonalnego repozytorium (takiego jak np. AMUR), które pod tym względem dobrze indeksuje publikacje.
To jest również ważny problem, o którym warto dyskutować.Aneta


No i to jest problem, który czeka na swoich erudytów i wynalazców.
I dobry przykład działania ekonomii uwagi w wymiarze podstawowym - system informacyjny nie spełniający oczekiwań użytkowników przegrywa z tym, który je spełnia. Podobnie przegrywa system informacyjny przerzucający koszty (konieczność nauki dostępu, jego złożoność) dostępu do informacji na użytkownika z takim, który je minimalizuje.
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
Grzegorz B. 
Grzesiek

Wiek: 54
Dołączył: 23 Lis 2007
Posty: 44
Skąd: Zabrze
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 6/13
 46%
Wysłany: 2013-02-21, 19:27   

Próbowałem odgadnąć, co też miał na myśli p. Remigiusz, pisząc:
Cytat:
Nie chcę wchodzić w dyskusję o wyższości jednego formatu nad drugim. Uważam to za trzeciorzędne, o ile nie przeszkadza, nie ogranicza i nie zniechęca użytkowników do korzystania z treści serwisu. W świecie są chyba zasoby cyfrowe prezentujące np. gazety nie oparte na DjVu? I inne zbiory też? I mają dobry OCR i pokazują się sprawnie w sieci? Być może nie stać nas na takie i może DjVu jedynie dostępne, ale czemu się zamykać na próby i eksperymenty? Jest mnóstwo innych typów zbiorów.

W świecie, to odwiedziłem kilka witryn bibliotek w USA, Australii, Europie (np. Francja, Norwegia, Luksemburg, ...) i "jakąś" (bo doczytać nie sposób) w Kairze. Albo trafiałem tylko na takie, albo też wszystkie biblioteki w tych krajach stosują zgoła odmienną politykę względem udostępniania publikacji (załóżmy bezpiecznie, że takich bibliotek jest dużo). Dominującym jest tam plik/dokument jednostronicowy. W Polsce - poza Poloną - dominują dokumenty wielostronicowe w formatach DjVu oraz pdf. Już ta różnica (od strony technicznej) powoduje np., że pojedyncza strona, jaką by ona nie była - ładuje się w czasie akceptowanym przez wszystkich lub zdecydowaną większość czytelników. To plusik w stronę tego, że ma być tak, jak oczekują udostępniania publikacji czytelnicy. Kolejnym spostrzeżeniem jest to, że praktycznie każda z tych witryn różni się zdecydowanie wyglądem, jedne wyświetlają listy obiektów, inne grupy tematyczne, które prowadzą do list obiektów, pojawiają się też całe strony miniaturek itd. itp. W polskich BC (stosujących dLibrę) szata graficzna, nawigacja, itd. jest jednorodna (pomijając drobiazgi techniczne typu kolorystyka, czcionki czy wyświetlone pliki graficzne). Producent wbudował określone mechanizmy, tym samym zwolnił z tej czynności biblioteki używające dLibrę. Dlaczego lub jak to działa w świecie? Otóż, w tych bibliotekach przez produkt digitalizacji nie jest rozumiana kolekcja obrazków "master files" oraz kolekcja publikacji w wybranym formacie prezentacyjnym, tylko do obu tych kolekcji tworów informatycznych dochodzi i to na zasadzie obligatoryjności kolekcja plików metadanych odpowiadających wymogom standardu METS. W ślad za tym, w bibliotekach (lub dla nich) powstają przeróżne arkusze stylów (na ogół twory bardzo dopracowane i zgodne z xslt) i tak naprawdę kolejne obiekty udostępniają czytelnikom ... metadane wespół z arkuszem stylu (w dużym uproszczeniu), które przetwarzane są dynamicznie przez mniej lub bardziej wyrafinowaną przeglądarkę. A dlaczego jednostronicowe pliczki bezbłędnie potrafią odnaleźć się dla czytelnika jako publikacja wielostronicowa? A to dzięki metadanym METS, w których musi wystąpić pełny opis struktury fizycznej oraz struktury logicznej każdego obiektu cyfrowego, przy czym format, który będzie formatem prezentacyjnym nie jest zdefiniowanym w ogóle (nie jest zatem potrzebna dyskusja, który format plików wybrać). Można zapoznawać się zarówno z plikami macierzystymi jak i plikami prezentacyjnymi (w niektórych bibliotekach w USA pliki macierzyste udostępniane są jedynie komputerom zalogowanym na terenie "kampusu" uczelni). Niektóre biblioteki udostępniają więcej niż jeden format prezentacyjny. Brak też wyraźnego wskazania (w samych plikach metadanych METS), co to takiego plik macierzysty, a co to takiego publikacja w formacie prezentacyjnym. Owszem, są (bo trzeba nadać) nagłówki dla kolejnych formatów plików (.tiff, .jpg, pdf, djvu, xml, ...) a dotyczących tego samego obiektu typu "MasterFiles" "ReferenceCopy", "LeightWeightCopy" itd., itp. Ale to tylko z punktu widzenia xml - jedynie estetyka wykonania pliku metadanych.
Największą atrakcją takiego rozwiązania może być "widoczność" takiego tworu w sieci. Zasada jest prosta. Im prostszy dla silnika indeksującego format plików, tym łatwiej poindeksować zawarty w publikacji tekst. OCR w takich publikacjach przygotowuje się w postaci tekstowych plików xml zgodnych ze standardem ALTO i całkowicie podległych metadanym zawartych w plikach METS. Ba, "usability", o której wspomina nie tylko Remigiusz lub zakładki, o których nie raz już pisał Tomek Kalota, jest wtedy najwyższych lotów i dostępna niczym "pstryknięcie palcem". Podświetlenie (np. na żółto z odpowiednią przeźroczystością) całego artykułu na stronie czasopisma, w którym znaleziona została fraza określona przez przeszukującego zasoby czytelnika, to bardzo często - norma.
W tych bibliotekach stosowanie formatów pdf i DjVu - to szary koniec kolejki, ale i nie brak ich obecności w ogóle. Zatem trzeciorzędny priorytet jaki wyborowi formatów plików przypisał Remigiusz, w pełni się tu potwierdza.
Skoro takie rozwiązanie jest efektywne, dlaczego niewiele mówi się o nim w Polsce? Nie śledzę na bieżąco publikacji operatora programu "WPR Kultura+", czyli od obecnego roku - NIMOZu, zatem może też być i tak, że w tej kwestii się mylę. Uczestniczące w tym programie biblioteki, powinny wykonywać digitalizację w oparciu właśnie o powyższe wymogi, w tym tworzyć metadane METS oraz ALTO. Pewnie niedługo dowiemy się (lub już zostało to opublikowane), co z tymi powstałymi metadanymi zamierza zrobić NIMOZ i jakim będą one wsparciem dla czytelników (choćby w widoczności zdigitalizowanych w ramach tego projektu obiektów).

A teraz kuchnia. Polecam załącznik do luksemburskiego przetargu sprzed około 3 miesięcy.
W polskich przetargach opis zasobu, który przeznacza się do zdigitalizowania, sprowadza się do 5-10 linijek opisu i ew. informacji ile procentowo stron jest większych od formatu A4, a ile większych od formatu A3. Polecany dokument to 4-ty i nie ostatni załącznik do przetargu. Liczy sobie 246 stron. Jest ciekawym przykładem ilustrującym współpracę świata "ludzi słów" i ludzi "świata liczb" skupionych wokół digitalizacji o bardzo wysokiej funkcjonalności, wiarygodności samego wykonania, usability a i jakości stron obiektów przy okazji. Dotyczy on tylko jednego malusiego fragmentu procesu digitalizacji : jak wykonać strukturę logiczną digitalizowanych czasopism. Bibliotekarze podeszli tu do sprawy bardzo praktycznie. Wydrukowali skany, których zawartość ich interesowała. Mazakami zamalowali obszary, które uważają, że muszą być opisane (a zatem stającymi się informatycznymi obiektami wspótworzącymi zawartość pojedynczej strony) zrobili z tych malowanek pdf-a i wręczyli informatykom. Jasne, proste choć jednocześnie wymagające ogromu pracy, wiedzy i skupienia, czyli zgodnie z porzekadłem "jak sobie pościelesz, tak będziesz w sieci widoczny".
Być może właśnie takie kwestie jak opisałem powyżej, p. Remigiusz określił kwestiami kompetencyjnymi, chyba, że to były jedynie niektóre spośród tych, które rozważał w ogóle.
Ale to nie koniec ukłonów w stronę czytelników. Otóż, gdy posiadamy już OCR w postaci plików ALTO "sprzężonych" ze strukturami (fizyczną i logiczną), niektóre biblioteki oferują również "wielostronicowego pdf"-a, którego konstrukcja przyprawia o ból głowy. Jego istotą są zakładki. Poza tym, że są spisem treści, również pojedyncze artykuły, "obiekty na stronie takie jak dla przykładu zdjęcia, również wśród tych zakładek występują. I to na tyle ciekawie, że po wyborze takiej zakładki wyświetla się nie strona, na której takie zdjęcie wystąpiło, ale takie powiększenie tej strony, które powoduje, ze owo zdjęcie wyświetla się w całym obszarze okna przeglądarki. No, można powiedzieć, niczym młody czytelnik - miodzio. Ale praca, praca, która jest potrzebna, by to stworzyć, to już nie jest "miodzio".
Krótkie dwa przykładziki. Niestety, jedynie czasopisma. Chciałem odszukać jakieś wydawnictwa naukowe lub chociażby jakiś zbiór zadań z analizy matematycznej, aby można taki wynalazek potestować i odnieść się do badań p. Pulikowskiego, ale nie udało się:

Luxemburger Wort für Wahrheit und Recht no. 103 20.07.1950
oraz
КОММЕРСАНТЪ no. 1263 02.01.1914

Panel zakładek nie otwiera się w widoku początkowym (w nowym/obecnym - dla mnie okropnym - Adobe Reader trzeba : wyświetlić menu, wybrać "Pokaż przyciski panelu nawigacji", po czym wskazać przycisk przypominający rolkę papieru), ale jest co oglądać.

Podsumowując. Na ten fragment cytatu p. Remigiusza: "Być może nie stać nas na takie i może DjVu jedynie dostępne, ale czemu się zamykać na próby i eksperymenty?", odpowiedzieć nie potrafię.
Czy obiekty zarządzane za pośrednictwem metadanych METS (deskryptywne + administracyjne + techniczne + 2* struktura + OCR + prawa do obiektu) wyświetlają się sprawnie, są w sieci dobrze widoczne? Tak.
Ale to ogromny wysiłek skłaniający mnie do uzupełnienia poglądu o tym, że digitalizacja to przeplatanie się dwóch światów. Teraz powinienem dodać "oraz sponsora, który żądając określonej jakości, określonego poziomu technologicznego i uwzględnienia oczekiwań czytelników, rozumie czego żąda i odpowiednio zabezpieczy daną bibliotekę w niezbędne środki.
_________________
"Wszystko jest trudne do czasu, gdy stanie się proste"
 
     
jsbien 
jsbien

Dołączył: 13 Sie 2008
Posty: 35
Poziom: 4
HP: 0/61
 0%
MP: 29/29
 100%
EXP: 8/11
 72%
Wysłany: 2013-02-21, 20:09   zakładki

Grzegorz B. napisał/a:

Ale to nie koniec ukłonów w stronę czytelników. Otóż, gdy posiadamy już OCR w postaci plików ALTO "sprzężonych" ze strukturami (fizyczną i logiczną), niektóre biblioteki oferują również "wielostronicowego pdf"-a, którego konstrukcja przyprawia o ból głowy. Jego istotą są zakładki. Poza tym, że są spisem treści, również pojedyncze artykuły, "obiekty na stronie takie jak dla przykładu zdjęcia, również wśród tych zakładek występują. I to na tyle ciekawie, że po wyborze takiej zakładki wyświetla się nie strona, na której takie zdjęcie wystąpiło, ale takie powiększenie tej strony, które powoduje, ze owo zdjęcie wyświetla się w całym obszarze okna przeglądarki. No, można powiedzieć, niczym młody czytelnik - miodzio. Ale praca, praca, która jest potrzebna, by to stworzyć, to już nie jest "miodzio".
Krótkie dwa przykładziki. Niestety, jedynie czasopisma. Chciałem odszukać jakieś wydawnictwa naukowe lub chociażby jakiś zbiór zadań z analizy matematycznej, aby można taki wynalazek potestować i odnieść się do badań p. Pulikowskiego, ale nie udało się:

Luxemburger Wort für Wahrheit und Recht no. 103 20.07.1950
oraz
КОММЕРСАНТЪ no. 1263 02.01.1914



W załączniku można zobaczyć, jak jeden ze wspomnianych dokumentów wygląda po konwersji na DjVu (za pomocą pdf2djvu Jakuba Wilka). Czy dobrze mi się wydaje, że dostępne są wszystkie funkcje oryginału?

4biblioteka20.png
Plik ściągnięto 123 raz(y) 1.58 MB

 
     
jsbien 
jsbien

Dołączył: 13 Sie 2008
Posty: 35
Poziom: 4
HP: 0/61
 0%
MP: 29/29
 100%
EXP: 8/11
 72%
Wysłany: 2013-02-21, 20:30   Re: zakładki

jsbien napisał/a:

W załączniku można zobaczyć, jak jeden ze wspomnianych dokumentów wygląda po konwersji na DjVu (za pomocą pdf2djvu Jakuba Wilka). Czy dobrze mi się wydaje, że dostępne są wszystkie funkcje oryginału?


Zakładki faktycznie działają gorzej - w tej chwili nie wiem, czy to ograniczenie konwertera czy formatu...
 
     
Grzegorz B. 
Grzesiek

Wiek: 54
Dołączył: 23 Lis 2007
Posty: 44
Skąd: Zabrze
Poziom: 5
HP: 0/81
 0%
MP: 38/38
 100%
EXP: 6/13
 46%
Wysłany: 2013-02-21, 20:40   

Cytat:
Czy dobrze mi się wydaje, że dostępne są wszystkie funkcje oryginału?

Niemal tak jest.
Nie jest to dla mnie nowością, że podczas konwersji pliku w formacie pdf do pliku DjVu. za pomocą pdf2djvu lub za pomocą DocumentExpress Enterprise, w powstałym pliku przeniesione będą automatem : zakładki, hiperłącza, OCR, a w przypadku pdf2djvu, również kontener metadanych XMP. Ja, w Luksemburgu znalazłem tylko takie przykłady (pochodzące z roku 2007), więc tylko te przytoczyłem.
Natomiast, jeżeli można słówko w temacie panelu zakładek, czy też hierarchicznych spisów treści. Uważam, że opcje tego panelu w formacie pdf są bogatsze. Poza tym, że danej zakładce można przypisać określony kolor, atrybuty (bold, italic ...) bodaj i ikonkę, to dodatkowo również : PagePosition oraz PageZoom. Jeżeli dokonał Pan konwersji, proszę sobie to sprawdzić, gdyż sądzę, że "tych bajerów" (powiększenie tylko danego zdjęcia, a nie wyświetlenie strony jako takiej), w odpowiedniku DjVu Pan nie znajdzie.
Proszę też zauważyć, że dziś całkowicie pominąłem to, że są w ogóle różne formaty plików, że posiadają zróżnicowany obszar zastosowań, itp. I dlatego nie zamieściłem żadnych obserwacji o przytoczonych przykładach czasopism. Skupiłem się nad innym podejściem do udostępniania obiektów czytelnikom. Udostępniania wspartego metadanymi METS.

Pozdrawiam serdecznie,
Grzegorz Bednarek
_________________
"Wszystko jest trudne do czasu, gdy stanie się proste"
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2013-03-05, 18:26   

Grzegorz B. napisał/a:
Dlaczego lub jak to działa w świecie? Otóż, w tych bibliotekach przez produkt digitalizacji nie jest rozumiana kolekcja obrazków "master files" oraz kolekcja publikacji w wybranym formacie prezentacyjnym, tylko do obu tych kolekcji tworów informatycznych dochodzi i to na zasadzie obligatoryjności kolekcja plików metadanych odpowiadających wymogom standardu METS. W ślad za tym, w bibliotekach (lub dla nich) powstają przeróżne arkusze stylów (na ogół twory bardzo dopracowane i zgodne z xslt) i tak naprawdę kolejne obiekty udostępniają czytelnikom ... metadane wespół z arkuszem stylu (w dużym uproszczeniu), które przetwarzane są dynamicznie przez mniej lub bardziej wyrafinowaną przeglądarkę. A dlaczego jednostronicowe pliczki bezbłędnie potrafią odnaleźć się dla czytelnika jako publikacja wielostronicowa? A to dzięki metadanym METS, w których musi wystąpić pełny opis struktury fizycznej oraz struktury logicznej każdego obiektu cyfrowego, przy czym format, który będzie formatem prezentacyjnym nie jest zdefiniowanym w ogóle (nie jest zatem potrzebna dyskusja, który format plików wybrać). [...]
Największą atrakcją takiego rozwiązania może być "widoczność" takiego tworu w sieci. Zasada jest prosta. Im prostszy dla silnika indeksującego format plików, tym łatwiej poindeksować zawarty w publikacji tekst. OCR w takich publikacjach przygotowuje się w postaci tekstowych plików xml zgodnych ze standardem ALTO i całkowicie podległych metadanym zawartych w plikach METS. Ba, "usability", o której wspomina nie tylko Remigiusz lub zakładki, o których nie raz już pisał Tomek Kalota, jest wtedy najwyższych lotów i dostępna niczym "pstryknięcie palcem". Podświetlenie (np. na żółto z odpowiednią przeźroczystością) całego artykułu na stronie czasopisma, w którym znaleziona została fraza określona przez przeszukującego zasoby czytelnika, to bardzo często - norma.
W tych bibliotekach stosowanie formatów pdf i DjVu - to szary koniec kolejki, ale i nie brak ich obecności w ogóle.
Skoro takie rozwiązanie jest efektywne, dlaczego niewiele mówi się o nim w Polsce?


No to jest chyba istota sprawy. To kompleksowe podejście do digitalizacji (czyli też zbudowania bazy publikacji, udostępniania) jest możliwe wówczas gdy myśli się o sprawie całościowo, tu zarówno np. wyposażając pliki ze skanowania w różne "zaczepy" i "haczyki" (zawarte w metadanych) oraz wypruty z obrazów (ale powiązany z nimi gdzie można) OCR - dla oprogramowania indeksującego , a potem formatującego sposób prezentacji obiektów. Takie "zgranulowanie" tworzonego zasobu, przyprawienie mu różnych "pokręteł", "perspektyw" i "uchwytów" umożliwia bardziej elastyczne oprogramowanie całego systemu. Oczywiście to zakłada dość rewolucyjne podejście do kształtu platformy BC.
A dlaczego niewiele się mówi w Polsce? Może się mówi, ale praktykuje się to, co stosunkowo łatwo jest osiągalne w "najpopularniejszym systemie w Polsce do budowy BC". A jest to jeden "haczyk" do zawieszenia jednego kontenera z treścią, który niezwłocznie rodzi dylemat - w jakim formacie go zrobić? A skoro system jest najpopularniejszy (tak, u nas też jest popularny ;) ), to nie ma sensu robić (czy kontraktować ) droższej digitalizacji z dużą ilością metadanych, skoro i tak one potem do niczego niczego specjalnego nie posłużą. Ale pal to licho, załóżmy że soft się rozwija i nagle może coś takiego robić. Co wówczas z kompatybilnością wsteczną względem poprzedniej wersji obsługi prezentacji? To szerszy problem polskich BC, bowiem dotyczy też jakości plików, istnienia i trafności OCR, etc.


Grzegorz B. napisał/a:
Podsumowując. Na ten fragment cytatu p. Remigiusza: "Być może nie stać nas na takie i może DjVu jedynie dostępne, ale czemu się zamykać na próby i eksperymenty?", odpowiedzieć nie potrafię.
Czy obiekty zarządzane za pośrednictwem metadanych METS (deskryptywne + administracyjne + techniczne + 2* struktura + OCR + prawa do obiektu) wyświetlają się sprawnie, są w sieci dobrze widoczne? Tak.


Myślę, że to kwestia gruntownej zmiany perspektywy - od systemu który jest czymś w rodzaju elektronicznego regału, na którym my stawiamy przygotowane wcześniej cyfrowe obiekty i różnie one przez ten system są obsługiwane - do systemu który w najgłębszej warstwie pracuje po prostu na tekstach (metadanych, nazwach, treściach, arkuszach stylów), wyświetlając jedynie tu i ówdzie obrazki.
Zaprojektowanie takiego czegoś byłoby na pewno pasjonujące. A zrobienie - nawet czegoś malutkiego, testowego, ale działającego (np. po 10 publikacji z 10 klas zbiorów = 100 publikacji), może nie takie koszmarnie drogie.
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
olekt 

Wiek: 43
Dołączył: 06 Mar 2013
Posty: 1
Poziom: 1
HP: 0/18
 0%
MP: 8/8
 100%
EXP: 0/9
 0%
Wysłany: 2013-03-06, 12:10   

Właśnie taki "zachodni" model został przedstawiony w publikacji Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. Większa część została poświęcona właśnie metadanym (innym niż opisowe). Najbardziej (dla mnie) niesamowitą cechą takiego rozwiązania jest samokompletowanie się kolekcji cyfrowych. Czyli np. numery danego wydawnictwa ciągłego rozsiane po wielu BC dynamicznie łączą się w jednolitą kolekcję, znakomicie ułatwiając użytkownikowi życie. Oto potęga metadanych w działaniu!

Rozwiązanie takie pozwala również w teorii całkowicie odejść od wersji prezentacyjnych i operować wyłącznie na masterach (sytuacja oczywiście nie dotyczy zbiorów wielkoformatowych) - dokument jest ad hoc tworzony z pojedynczych stron - i to z parametrami zadeklarowanymi przez użytkownika.

Ten model BC ma niesamowity potencjał, ale - nie czarujmy się - wiązałby się praktycznie z "wyzerowaniem" naszego aktualnego BC-dorobku i rozpoczęciu od zera (no, prawie - mastery już mamy). Szaleństwo? Oczywiście, że tak, ale jestem w 100% za.
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2013-10-29, 08:30   

Pobawiłem się nieco w "powrót do przeszłości" i zmieniłem domyślna konfigurację Chrome dla obsługi PDF. Wbudowana wtyczka Chromowa jest dość prymitywna, natomiast wtyczka Adobowa otwiera pełnotekstowy sezam. Po włączeniu paska narzędziowego można łatwo nawigować po miejscach gdzie znajduje się fraza, bo jest ich podręczny, hipertekstowy wykaz. Jeśli OCR jest trafny, to z tekstem zupełnie inaczej się pracuje.

Idealnie byłoby gdyby dLibra była w stanie po zaindeksowaniu treści obiektu wytworzyć takie wyświetlane obok "menu fraz" niezależnie od formatu pliku z treścią. Zdaje się że wszystkie klocki do tego są - jest tekst, jest on zindeksowany.


Publikacja: http://www.sbc.org.pl/dlibra/docmetadata?id=79826

skrin2-pdf.jpg
Plik ściągnięto 83 raz(y) 227.22 KB

skrin3.jpg
Plik ściągnięto 86 raz(y) 358.53 KB

skrin-pdf.jpg
Plik ściągnięto 100 raz(y) 376.06 KB

_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
Wyświetl posty z ostatnich:   
Ten temat jest zablokowany bez możliwości zmiany postów lub pisania odpowiedzi
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
Biblioteka 2.0 : Forum społeczności czytelników i bibliotekarzy cyfrowych [Dokument elektroniczny] - Tryb dostępu http://forum.biblioteka20.pl
Korzystanie z portalu oznacza akceptację naszej polityki prywatności.
Strona wygenerowana w 0.1 sekundy. Zapytań do SQL: 10