Biblioteka 2.0 on Facebook
Biblioteka 2.0 Strona Główna

Biblioteka 2.0
Forum społeczności czytelników i bibliotekarzy cyfrowych

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  AlbumAlbum  DownloadDownload

Poprzedni temat «» Następny temat
czemu brak *.txt w Bibliotekach Cyfrowych
Autor Wiadomość
arek 
arek


Dołączył: 23 Lis 2008
Posty: 10
Skąd: Warszawa
Poziom: 2
HP: 0/30
 0%
MP: 14/14
 100%
EXP: 0/8
 0%
Wysłany: 2012-01-05, 09:04   czemu brak *.txt w Bibliotekach Cyfrowych

co prawda spytałem już na facebooku ale tu chyba bardziej dopasowane grono :>

Z czego wypływa że praktycznie nie udostępniacie w swoich bibliotekach poza djvu czy pdf alternatywnych do nich plików zawierających samą warstwę tekstową?

Treść jest przecież gotowa i aż się prosi o wystawienie na świat. Nie dopominam się już o takie ekstrawagancje jak epub czy mobi bo to wymaga zachodu, ale o zwykły draft txt, nawet ze śmieciami ale dający się czytać np. w kindlu.

Myślałem że to wyłącznie mój niszowy problem ale skoro zaczyna się pojawiać na blogach to chyba jednak warto go poruszyć. Ludzie się strasznie gimnastykują żeby skorzystać z przyjaznych bibliotek.

przykład gimnastyki
_________________
jeszcze pracuję nad nową stopką :/
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2012-01-05, 14:07   Re: czemu brak *.txt w Bibliotekach Cyfrowych

arek napisał/a:

Z czego wypływa że praktycznie nie udostępniacie w swoich bibliotekach poza djvu czy pdf alternatywnych do nich plików zawierających samą warstwę tekstową?
Ludzie się strasznie gimnastykują żeby skorzystać z przyjaznych bibliotek.
przykład gimnastyki

Najkrócej mówiąc wynika to z tego, że oprogramowanie dLibra, w którym tworzone są w większości polskie BC, nie pozwala na proste "podczepienie" pod jeden identyfikator publikacji plików w różnych formatach. Przygotowanie ich nie stanowi większego, technicznego problemu.

Temat był sygnalizowany wielokrotnie od dłuższego czasu producentowi dLibry PCSS-owi, choć też może nie być prosty do realizacji. Nie sprawdzałem w ver. 5.0 dLibry, ale też chyba nie można stosować wielu formatów.

Póki co prośby, petycje, błagania i protesty w tej sprawie można kierować do tych przemiłych, młodych i obiecujących ludzi. Oni koduja ten cały interes i może Was posłuchają.
O i do profilu tez można się im wpisać: http://www.facebook.com/F...liotekCyfrowych - zawsze są bardzo wdzięczni za uwagi ;-) .
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
Wojtek 
Wojciech Kowalewski


Dołączył: 28 Lis 2007
Posty: 89
Skąd: WBP Kraków
Poziom: 8
HP: 0/159
 0%
MP: 76/76
 100%
EXP: 8/19
 42%
Wysłany: 2012-01-05, 20:13   

Sądzę, że to kwestia czasu i w niedalekiej przyszłości dLibra poradzi sobie z tym problemem.

BTW odebrałem ostatnio prośbę od Appla ws. udostępnienia starych gazet na iPada. Póki co cisza... przed burzą?
_________________
http://mbc.malopolska.pl/
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2012-01-06, 21:36   

Wojtek napisał/a:
przykład gimnastyki

Pani, która się gimnastykuje, robi to z wdziękiem i budzącym sympatię uporem, ale na niewłaściwym trapezie. Zamiast kopiować po kawałku do Worda, lepiej zrzucić cały tekst do pliku narzędziem djvutxt z DjVuLibre. Potem już z górki.

relis napisał/a:
Najkrócej mówiąc wynika to z tego, że oprogramowanie dLibra...

Nie do końca. Jeśli chodzi o gołą warstwę tekstową, to dlibra sobie radzi, OCR z plików DjVu jest przecież w zasięgu ręki, Ograniczenia co do rozmiaru i ukrywanie przed czytelnikami są przeszkodami bardzo łatwymi do usunięcia - obie zostały wprowadzone świadomie.

Pozostaje do rozważenia główna przyczyna ich wprowadzenia, tj. brudny OCR. Czasem taki, że wstyd go pokazać nawet u lekarza ;-) I na to dlibra nic nie poradzi. Ani wieszanie psów na jej twórcach. Gdyby tekst był zawsze "nadający się", to dorobienie linku do niego i zdjęcie ograniczeń byłoby małym pryszczem.

Tak czy owak, dobrze, że ludzie pytają o inne formaty i możliwość konwersji; może to przyczyni się do upowszechnienia poglądu, że liczy się nie tylko to, ile mamy obiektów w bibliotekach cyfrowych, ale ile mamy obiektów nadających się z marszu do przetworzenia np. na epub. Bo, mówiąc krótko, dobry OCR otwiera zupełnie nowe możliwości.

relis napisał/a:
O i do profilu tez można się im wpisać: http://www.facebook.com/F...liotekCyfrowych

No, żeż, Remigiuszu, może lepiej od razu przekierować cały ruch z forum na facebook? ;-) Tam, za miesiąc albo rok, na pewno łatwiej będzie znaleźć odpowiedzi na pytania. Szczególnie tym, którzy nie mają ochoty zapisywać się do owczarni Zuckerberga.
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2012-01-07, 02:36   

sk napisał/a:
Ani wieszanie psów na jej twórcach. Gdyby tekst był zawsze "nadający się", to dorobienie linku do niego i zdjęcie ograniczeń byłoby małym pryszczem.


Wieszanie psów? A gdzież to było?
Temat możliwości wieloformatowej prezentacji treści był podnoszony nie raz i jak dotąd nie był traktowany jako myślozbrodnia. ;-) I niewiele ma wspólnego z "czystym" OCR. Kto sobie go potrafi zrobić, to mógłby sobie go zawiesić. Podobnie z równoległym PDF, czy formatami mobilnymi. Dotyczy to zresztą tylko części publikacji tekstowych. Nie sądzę by ktoś na Kindla ładował i czytał książki adresowe.
Skoro to mały pryszcz to tylko się cieszyć, że łatwo i szybko da się zrobić.

post - sk ;).zip
Póki co dla czytelniczki - .mobi z dyskusji
Pobierz Plik ściągnięto 594 raz(y) 1.73 KB

_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2012-01-07, 14:05   

relis napisał/a:
Wieszanie psów? A gdzież to było?

Nie znam się zbyt dobrze na salonowych rasach, więc może coś źle zrozumiałem. Jeśli tak, to przepraszam. W każdym razie tłumaczenia w rodzaju "my jesteśmy gotowi i mielibyśmy to już dawno, gdyby przemili, młodzi i obiecujący programiści nas posłuchali" uważam za niezbyt przekonujące.

relis napisał/a:
Temat możliwości wieloformatowej prezentacji treści był podnoszony nie raz [...] I niewiele ma wspólnego z "czystym" OCR.

Tytuł wątku brzmi "czemu brak *.txt w Bibliotekach Cyfrowych", więc starałem się zmieścić w temacie, pokazując, że tekst jest, tylko trochę schowany, i wyjaśniając przyczynę takiego rozwiązania.

relis napisał/a:
Kto sobie go potrafi zrobić, to mógłby sobie go zawiesić.

Jak ktoś już jest taki sprawny, że potrafi zrobić i dobry OCR, i epub, i mobi, to owszem, mógłby też zawiesić nawet bez oglądania się na dlibrę. Na wiele różnych sposobów. Może link do formularza "prześlijcie mi w formacie mobilnym"? Albo uruchomienie jakiegoś thttpd ze statyczną zawartością i linkowanie w opisie? A może - dla bardziej ambitnych - przepisywanie adresów z regułką kierującą z www.sbc.org.pl/epub/NR_EDID prosto na plik? Albo wręcz dodatkowa mała aplikacja na www.sbc.org/mobile? Może kawałek kodu sprawdzający dostępne formaty na podobnej zasadzie jak "Zobacz także" przy opisach w WBC?

Zgoda, to prowizorka, ale dobre i działające prowizorki bywają nieraz lepsze niż wszystkorobiące aplikacje.
 
     
mwerla 
Marcin Werla


Wiek: 36
Dołączył: 13 Lut 2007
Posty: 251
Skąd: Poznań, PCSS
Poziom: 14
HP: 0/426
 0%
MP: 203/203
 100%
EXP: 27/33
 81%
Wysłany: 2012-01-09, 09:16   

Witam wszystkich.

Faktycznie część ruchu, przynajmniej tego związanego z podrzucaniem sobie newsów i komentowaniem ich, zdecydowanie przeniosła się na FB. A co do głównej treści tego wątku, to SK w dużej mierze ubiegł mnie w odpowiedzi - dzięki :)

Dodam jeszcze jedno - jeżeli jest biblioteka cyfrowa, która faktycznie chciałaby na większą skalę udostępniać obiekty w kilku równoległych formatach, to proszę o kontakt. Po pierwsze mamy w dLibrze możliwości dodania automatycznego przetwarzania obiektów pomiędzy formatami (na zasadzie zbliżonej do automatycznej konwersji DjVu -> JPG i DjVu -> TXT, które są w dLibrze już w tej chwili). Po drugie, jeżeli ktoś faktycznie podejmie się trudu przygotowywania publikacji na czytniki w postaci najadącej się do czytania, to pomożemy wykorzystać mechanizm publikacji grupowych do zamodelowania w dLibrze obiektów posiadających kilka równoległych formatów podpiętych pod jeden rekord metadanych.
_________________
Marcin Werla
Zespół Bibliotek Cyfrowych PCSS
 
 
     
relis 


Wiek: 50
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 29/1490
 2%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2012-01-09, 11:01   

sk napisał/a:
Nie znam się zbyt dobrze na salonowych rasach, więc może coś źle zrozumiałem. Jeśli tak, to przepraszam. W każdym razie tłumaczenia w rodzaju "my jesteśmy gotowi i mielibyśmy to już dawno, gdyby przemili, młodzi i obiecujący programiści nas posłuchali" uważam za niezbyt przekonujące.

Nie ma sprawy, choć przeprosiny nie usprawiedliwiają kolejnej nadinterpretacji tu zawartej. ;-)

sk napisał/a:
Zgoda, to prowizorka, ale dobre i działające prowizorki bywają nieraz lepsze niż wszystkorobiące aplikacje.

Interesowałoby mnie rozwiązanie, które nie jest prowizorką, które nie polegałoby na indywidualnym grzebaniu w dLibrach, przez poszczególnych administratorów i które byłoby rozwiązaniem dla systemu BC, a nie tylko partykularnym dla jednej biblioteki. Poza tym nie chodzi o to by to dLibra produkowała jakieś dodatkowe formaty, tylko by ułatwiała podczepienie redaktorom, prócz głównego pliku prezentacyjnego, innych alternatywnych formatów, przygotowanych uprzednio i pokazanie ich w sensownym miejscu interfejsu z możliwością prostego pobrania. Jeśli są to propozycje nazbyt wygórowane i wykraczają poza planowany nurt rozwoju dLibry - to oczywiście ja przepraszam.

No i sorry, ale porady wobec użytkowników, że "gimnastykują się nie na tym trapezie", są jak dla mnie trochę niedzisiejsze.
Tyle w temacie.

mwerla napisał/a:
Po pierwsze mamy w dLibrze możliwości dodania automatycznego przetwarzania obiektów pomiędzy formatami (na zasadzie zbliżonej do automatycznej konwersji DjVu -> JPG i DjVu -> TXT, które są w dLibrze już w tej chwili). Po drugie, jeżeli ktoś faktycznie podejmie się trudu przygotowywania publikacji na czytniki w postaci najadącej się do czytania, to pomożemy wykorzystać mechanizm publikacji grupowych do zamodelowania w dLibrze obiektów posiadających kilka równoległych formatów podpiętych pod jeden rekord metadanych.

To drugie rozwiązanie wydaje mi się bardziej interesujące, dlatego że pozwoliłoby na przygotowanie treści takiej wieloformatowej publikacji na etapie przedredaktorskim i w dodatku pozwalałoby na uzupełnianie publikacji o kolejne formaty, gdyby były potrzebne, bez względu na istnienie automatów.
Choć chyba nie ma sensu by te alternatywne pliki były np. indeksowane.
Myślę, że testowo warto będzie spróbować, by ocenić pracochłonność takiej publikacji na wszystkich etapach.

I niezależnie już od wieloformatowości ale w związku z automatami - dość ciekawy soft do zarządzania e-bookami, włącznie z produkcją mobilnych formatów:

"calibre is a free and open source e-book library management application developed by users of e-books for users of e-books. It has a cornucopia of features divided into the following main categories:
Library Management
E-book conversion
Syncing to e-book reader devices
Downloading news from the web and converting it into e-book form
Comprehensive e-book viewer
Content server for online access to your book collection"
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
mwerla 
Marcin Werla


Wiek: 36
Dołączył: 13 Lut 2007
Posty: 251
Skąd: Poznań, PCSS
Poziom: 14
HP: 0/426
 0%
MP: 203/203
 100%
EXP: 27/33
 81%
Wysłany: 2012-01-09, 15:36   

Cytat:
Myślę, że testowo warto będzie spróbować, by ocenić pracochłonność takiej publikacji na wszystkich etapach.


No to jak będziecie po testach i będzie wiadomo że jesteście w stanie produkować alternatywne formaty równolegle z DjVu, to proszę o info - wtedy wspólnie dopracujemy satysfakcjonujące rozwiązanie do prezentacji tego w dLibrze.
_________________
Marcin Werla
Zespół Bibliotek Cyfrowych PCSS
 
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2012-01-09, 21:29   

mwerla napisał/a:
jeżeli ktoś faktycznie podejmie się trudu przygotowywania publikacji na czytniki w postaci najadącej się do czytania, to pomożemy wykorzystać mechanizm publikacji grupowych do zamodelowania w dLibrze obiektów posiadających kilka równoległych formatów podpiętych pod jeden rekord metadanych.

A czy planujecie jakieś bardziej fundamentalne zmiany na czasy "mobilnej rewolucji"? Bo to raczej nie jest tylko kwestia znalezienia miejsca dla mobilnych formatów w dotychczasowym interfejsie projektowanym na biurkowe monitory i klawiatury.
 
     
mwerla 
Marcin Werla


Wiek: 36
Dołączył: 13 Lut 2007
Posty: 251
Skąd: Poznań, PCSS
Poziom: 14
HP: 0/426
 0%
MP: 203/203
 100%
EXP: 27/33
 81%
Wysłany: 2012-01-09, 23:13   

Pierwsze przymiarki mamy już za sobą przy okazji dMuseionu:

http://dl.psnc.pl/2011/10/28/qr-kody-w-krolikarni/

Czyli mamy generator QR kodów, które linkują do zoptymalizowanej na urządzenia mobilne strony z metadanymi. Całego interfejsu systemu na urządzenia mobilne jeszcze nie robiliśmy. Tylko... z moich osobistych doświadczeń problemem podstawowym jest mimo wszystko format DjVu. Mam smartfona z dość dużym ekranem i tablet - jedno i drugie na Androidzie. Na obydwóch urządzeniach, z systemową przeglądarką z tego co pamiętam, byłem w stanie bez problemu skorzystać z funkcji standardowego interfejsu WWW typu wyszukiwanie czy przeglądanie, ale problem pojawiał się przy próbie wyświetlenia treści. Używałem przycisku otwierania treści w nowym oknie i PDFy czy HTMLe nie robiły problemu, ale żeby dobrać się do wieloplikowego DjVu musiałem pobrać całą publikację jako ZIP, rozpakować i otworzyć. Brakuje przeglądarki DjVu wspierającej czytanie wieloplikowych DjVu on-line. Analogicznie miałem sporo temu na iPhonie.

Tak więc to co byłoby pewnie najciekawszym rozwiązaniem, to aplikacja Androidowa korzystająca z interfejsu OpenSearch FBC i pozwalająca na przeszukiwanie zbiorów a następnie będąca w stanie wyświetlić on-line lub pobrać do czytania później PDFy, DjVu itp. Ktoś chętny na start-up? ;)

A może macie jakąś inną wizję tego co mogłoby być potrzebne użytkownikom urządzeń mobilnych? No bo raczej nie wersja WAP serwisu ;)
_________________
Marcin Werla
Zespół Bibliotek Cyfrowych PCSS
 
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2012-01-10, 01:44   

mwerla napisał/a:
Tak więc to co byłoby pewnie najciekawszym rozwiązaniem, to aplikacja Androidowa korzystająca z interfejsu OpenSearch FBC i pozwalająca na przeszukiwanie zbiorów a następnie będąca w stanie wyświetlić on-line lub pobrać do czytania później PDFy, DjVu itp.

Brzmi rzeczywiście interesująco, choć wiąże się z tym kwestia, która budzi u mnie całkiem sprzeczne uczucia: przeglądarka www czy specjalna aplikacja. Z jednej strony, trudno nie przyznać, że w tej chwili korzystanie z aplikacji dostępnej na zawołanie i wyposażonej w dodatkowe funkcje jest bardziej komfortowe niż "web browser experience" (czekanie aż się ok. 700-800 kilobajtów strony ściągnie i wyświetli, żmudne przedzieranie się przez gąszcz trudnych do zmacania linków...)

Z drugiej strony widzę w tych wyspecjalizowanych aplikacjach zaprzeczenie idei leżących u podstaw sukcesu globalnej Sieci. Osobny program trzeba instalować do czytania gazety X, osobny do czytania tygodnika Y, jeden tylko na iOS, inny tylko na Android, tu tylko Amazon, tam wyłącznie Barnes & Noble.

Gdyby jednak taka aplikacja rzeczywiście dawała dostęp do istniejących już zasobów bibliotek cyfrowych, z przeglądaniem włącznie (ach, to nieszczęsne DjVu), to pewnie szybko pozbyłbym się wątpliwości :-)
 
     
mwerla 
Marcin Werla


Wiek: 36
Dołączył: 13 Lut 2007
Posty: 251
Skąd: Poznań, PCSS
Poziom: 14
HP: 0/426
 0%
MP: 203/203
 100%
EXP: 27/33
 81%
Wysłany: 2012-01-10, 09:12   

Pewnym krokiem w kierunku dostosowania się do istniejących aplikacji może być wykorzystanie OPDS (http://opds-spec.org/). Są aplikacje takie jak https://market.android.com/details?id=com.flyersoft.moonreader do których można podłączyć dowolny katalog zgodny OPDS, ale problemem nadal pozostaje DjVu. Czyli albo dogadać się z twórcami takiej aplikacji żeby dopisali coś do DjVu i to jeszcze otwieranego on-line i zrobić OPDS. Albo czekać aż pojawią się epuby w bibliotekach cyfrowych i ograniczyć się na razie tylko do OPDS.
_________________
Marcin Werla
Zespół Bibliotek Cyfrowych PCSS
 
 
     
Tomasz Kalota 
Tomasz Kalota


Wiek: 45
Dołączył: 13 Lut 2007
Posty: 322
Skąd: Wrocław
Poziom: 16
HP: 0/556
 0%
MP: 265/265
 100%
EXP: 30/39
 76%
Wysłany: 2012-01-10, 13:15   

mwerla napisał/a:
(...)Albo czekać aż pojawią się epuby w bibliotekach cyfrowych i ograniczyć się na razie tylko do OPDS.

Ja niebawem przygotuję coś w wersji epub i będzie można potestować.
_________________
Myśl więziona w księdze jest hańbą dla księgi.

Tomasz Kalota | Digitalizacja.pl | eBooki.com.pl
 
 
     
sk 
sk

Dołączył: 19 Lut 2007
Posty: 292
Skąd: KPBC, Toruń
Poziom: 15
HP: 0/488
 0%
MP: 233/233
 100%
EXP: 35/35
 100%
Wysłany: 2012-01-10, 13:57   

mwerla napisał/a:
Pewnym krokiem w kierunku dostosowania się do istniejących aplikacji może być wykorzystanie OPDS (http://opds-spec.org/). Są aplikacje takie jak https://market.android.com/details?id=com.flyersoft.moonreader do których można podłączyć dowolny katalog zgodny OPDS, ale problemem nadal pozostaje DjVu. Czyli albo dogadać się z twórcami takiej aplikacji żeby dopisali coś do DjVu i to jeszcze otwieranego on-line i zrobić OPDS. Albo czekać aż pojawią się epuby w bibliotekach cyfrowych i ograniczyć się na razie tylko do OPDS.

Moon+ Reader jest niezły, ale raczej zorientowany na formaty oparte na tekście, dające większą elastyczność jeśli chodzi o dopasowanie do niewielkich wyświetlaczy i inne funkcje (np. zakładki). Podobnie zresztą jak np. Cool Reader. Skoro twórcy nie decydują się na dodanie obsługi PDF, to DjVu wydaje się tym bardziej wątpliwe. Hasło "DjVu" to w Markecie głęboka nisza.
 
     
Wyświetl posty z ostatnich:   
Ten temat jest zablokowany bez możliwości zmiany postów lub pisania odpowiedzi
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
Biblioteka 2.0 : Forum społeczności czytelników i bibliotekarzy cyfrowych [Dokument elektroniczny] - Tryb dostępu http://forum.biblioteka20.pl
Korzystanie z portalu oznacza akceptację naszej polityki prywatności.
Strona wygenerowana w 0.09 sekundy. Zapytań do SQL: 10