Biblioteka 2.0 on Facebook
Biblioteka 2.0 Strona Główna

Biblioteka 2.0
Forum społeczności czytelników i bibliotekarzy cyfrowych

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  AlbumAlbum  DownloadDownload

Poprzedni temat «» Następny temat
Tesaurus dla bibliotek cyfrowych
Autor Wiadomość
Bozena Michalska 
Bożena Michalska

Dołączyła: 29 Mar 2007
Posty: 140
Skąd: Toruń
Poziom: 10
HP: 0/230
 0%
MP: 110/110
 100%
EXP: 20/22
 90%
Wysłany: 2008-05-08, 13:48   Tesaurus dla bibliotek cyfrowych

Pilnie potrzebujemy kontrolowanego slownictwa dla naszych bibliotek cyfrowych, do pola slowa kluczowe, czy wg was ten multijezyczny slownik by sie nam nadał:
http://europa.eu/eurovoc/...!MENU?langue=PL

Wyslalam tez to pytanie do fachowcow Jadwigi Wozniak i Jolanty szewczak, jesli opinie bedze pozytywne, to moze dLibra nam to wrzuci na poczatek, a potem bedziemy go rozwijac???



Czy dLibra bedzie rozdziela pole temat, slowa kluczowe na dwa? Czy wiecie cos o tym, bo w takiej postaci jest nie do przyjecia.

Slowa klucze musza byc oddzielone od tematow, tematy mozna kopiowac z KABY, a slowa kludcze musza byc swobodnie dodawane.
 
     
relis 


Wiek: 53
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 14/1490
 1%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2008-05-21, 19:57   

W kwestii słów kluczowych, warto by się zastanowić, w jaki sposób wykorzystać słowa zapytań kierowanych do BC przez użytkowników. Wiadomo, że niektóre BC zbierają, a nawet zliczają częstość występowania w zapytaniach - no i tyle. Zrobienie z tego jakiegoś słownika na piechotę pewnie byłoby żmudne, jeśli w ogóle wykonalne.

Jakiś czas temu robiłem kampanie w Google Adwords i wydaje mi się, że w sporym zakresie można by wykorzystać do doboru słów kluczowych dla publikacji z BC coś identycznego jak googlowy mechanizm umieszczania reklam w wynikach wyszukiwania.

Jeśli chcemy, by reklama dotycząca czegoś pojawiła się w wynikach wyszukiwania w Google, musimy "dowiązać" do niej odpowiednie słowa kluczowe, co do których spodziewamy się, że odpowiadają frazom wyszukiwawczym użytkowników. Zapytanie przez użytkownika takim dowiązanym" słowem kluczowym Google - wyświetli naszą reklamę w wynikach wyszukiwania.
Ale to nie wszystko - bo Google może przy wymyślaniu słów kluczowych podpowiedzieć, jakie dodatkowe słowa warto do reklamy dowiązać i robi to w oparciu o zbierane frazy zapytań użytkowników.

Dla tych co nie znają - wygląda to tak:
1. Robimy i formatujemy tekstową reklamę dotyczącą jakiejś usługi/produktu.
2. Dobieramy z głowy słowa kluczowe i możemy je wprowadzić do tzw. "Narzędzia propozycji słów kluczowych"
3. Wybieramy opcje dopasowania - zbliżone, fraza, dokładne, wykluczające.
4. Po użyciu przycisku "Propozycje słów kluczowych" pojawia się lista słów kluczowych zawierająca słowa lub frazy (powiązanych z naszą propozycją), którymi wyszukiwarkę odpytują użytkownicy - z zaznaczeniem ich popularności, tj. konkurencyjności (ilu tworzących reklamy używa danego słowa jako kluczowe), miesięcznej liczby wyszukiwań oraz średniej liczby wyszukiwań. Można po tym rozpoznać, jakimi frazami/słowami warto opisywać reklamę, by była często wyświetlana.
5. Można następnie z tej listy pobrać dowolne słowa/frazy i dołączyć do własnego zestawu słów - łącznie z formami błędnymi, które też mają wiele zapytań.

Przy określonym zasobie nagromadzonych zapytań czytelniczych w BC taki mechanizm mógłby zostać zastosowany w BC do generowania słów kluczowych dla publikacji w oparciu o te zapytania, z uwzględnieniem form błędnych, które można by umieszczać w synonimach. Gdyby zastosować mechanizm centralnego zbierania wszystkich zapytań z wszystkich instalacji (a to można by zrobić automatem), byłby to szybko rosnący zasób, z którego słowa można by dobierać.
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
ws 
ws

Dołączył: 15 Lut 2007
Posty: 89
Skąd: KPBC, Toruń
Poziom: 8
HP: 0/159
 0%
MP: 76/76
 100%
EXP: 8/19
 42%
Wysłany: 2008-05-21, 21:16   

relis napisał/a:
W kwestii słów kluczowych, warto by się zastanowić, w jaki sposób wykorzystać słowa zapytań kierowanych do BC przez użytkowników.

Teoretycznie rzecz bardzo słuszna, ale w statystykach serwera widać raczej małą inwencję (pierwsza liczba to ilość pytań w maju, druga to procent w całości). Warto by jeszcze wiedzieć, które słowa doprowadziły do trafienia na poszukiwany dokument.

Dla fraz, od najczęstszych:
biblioteka cyfrowa 281 5 %
kujawsko-pomorska biblioteka cyfrowa 206 3.7 %
kujawsko pomorska biblioteka cyfrowa 205 3.7 %
kpbc 124 2.2 %
umowa licencyjna niewyłączna 87 1.5 %
znaki kolejowe 71 1.2 %
kujawsko pomorska biblioteka 66 1.1 %
mapa kujawsko pomorska 62 1.1 %
kujawsko-pomorska biblioteka 41 0.7 %
kpbc.umk.pl 38 0.6 %
pomorska biblioteka cyfrowa 35 0.6 %
kujawsko pomorska 35 0.6 %
biblioteki cyfrowe 34 0.6 %
mapa kujawsko-pomorska 32 0.5 %
bibliotekarz 27 0.4 %
monumenta poloniae historica 26 0.4 %
internetowa biblioteka 26 0.4 %
gazeta toruńska 24 0.4 %
bydgoska biblioteka cyfrowa 24 0.4 %
kujawsko-pomorska biblioteka cyfrowa 21 0.3 %
pommersches urkundenbuch 21 0.3 %
biblioteka kujawsko-pomorska 18 0.3 %
słownik języka polskiego 17 0.3 %
poradnik bibliotekarza 16 0.2 %
gazeta bydgoska 15 0.2 %
kujawsko- pomorska biblioteka cyfrowa 14 0.2 %
kujawsko - pomorska biblioteka cyfrowa 14 0.2 %
mapa pomorza wschodniego 14 0.2 %
kujawska biblioteka 13 0.2 %
kujawsko pomorska cyfrowa 13 0.2 %
...

Słowa, od najczęstszych:
biblioteka 1207 8.4 %
cyfrowa 1010 7.1 %
pomorska 560 3.9 %
kujawsko 516 3.6 %
identifier 446 3.1 %
kujawsko-pomorska 346 2.4 %
w 237 1.6 %
mapa 182 1.2 %
kpbc 127 0.8 %
umowa 94 0.6 %
i 93 0.6 %
licencyjna 90 0.6 %
niewyłączna 87 0.6 %
słownik 83 0.5 %
kolejowe 72 0.5 %
znaki 72 0.5 %
- 70 0.4 %
polskiego 68 0.4 %
biblioteki 62 0.4 %
gazeta 58 0.4 %
z 53 0.3 %
bydgoska 52 0.3 %
o 51 0.3 %
języka 49 0.3 %
wilnie 47 0.3 %
monumenta 47 0.3 %
cyfrowe 47 0.3 %
...
_________________
--
WS
 
     
relis 


Wiek: 53
Dołączył: 13 Lut 2007
Posty: 790
Skąd: Biblioteka Śląska
Poziom: 25
HP: 14/1490
 1%
MP: 711/711
 100%
EXP: 24/73
 32%
Wysłany: 2008-05-21, 21:45   

Ale to są chyba słowa kluczowe Google z Google Analytics, które doprowadziły do KPBC?
Jeśli tak, to nie o nie mi chodzi.
Mówiąc o słowach kluczowych dla BC mówiłem o tych wpisywanych w pole wyszukiwawcze dLibry, kiedy czytelnicy szukają konkretnych publikacji. Je można zbierać i mogłyby one być wykorzystywane ("podsuwane") na podobieństwo tego, jak to robi Google Adwords, kiedy reklamodawca ma jakiś pomysł na słowo kluczowe ale chce je uzupełnić frazami/słowami zadawanymi przez użytkowników wyszukiwarce.
Jeśli mętnie tłumaczę, a nie używacie Google Adwords - mogę zrobić parę zrzutów z ekranu, by zilustrować ten mechanizm.

W tym wypadku fakt, że w BC nie ma publikacji, która spełnia jakąś frazę nie ma znaczenia - i tak bowiem dowiadujemy się o co pytają użytkownicy i te frazy redaktorzy mogliby przy okazji następnych publikacji stosować.
_________________
Given enough eyeballs, all bugs are shallow.
ESR
It is not necessary to change; survival is not mandatory. ;-)
Edward Deming

http://relis-blog.blogspot.com
 
 
     
Bozena Michalska 
Bożena Michalska

Dołączyła: 29 Mar 2007
Posty: 140
Skąd: Toruń
Poziom: 10
HP: 0/230
 0%
MP: 110/110
 100%
EXP: 20/22
 90%
Wysłany: 2008-05-30, 13:39   

a ja mysle o porzadnym slownictwie, ktore opisuje dokument. Nie chodzi mi o każde słowo czy wyrażenie, ktore padnie "z ust" naszego czytalnika, tylko o takie, które optymalnie opiszą zawartośc treści dokumentu. Na to musimy miec tezaurusy i to w kilku jezykach, zeby zapytania mogly byc zadawane po ang. niem i moze po hiszpańsku.

Dlatego pytam o ten slownik wielojezyczny, bo on takie przeklady ma. Gdyby go rozbudowywac, takze o te słowa padajace ze strony naszych czytelnikow, ale przez nas sprawdzane, to mozna by juz miec zasob i z niego dodawac wpisy do lwasciwego pola w opisie bibliograficznym.

tagowanie moze nam pomoc, ale bylabym tu ostrozna, bo moga padac niewłaściwe dookreślenia, synonimiczne, wtedy moznaby stosowac system odsylaczy.

Ale to jest robota dla fachowcow - od czegos jednak trzeba zaczac.

mamy juz Konsorcjum to bedzie mozna oficjalnie zaczac budowac taki zespol.
 
     
Monika J. 


Dołączyła: 13 Lut 2007
Posty: 181
Skąd: Z króliczej nory...
Poziom: 12
HP: 0/319
 0%
MP: 152/152
 100%
EXP: 14/27
 51%
Wysłany: 2008-05-30, 22:11   

Myślę, że przed zaimplementowaniem jakiegoś tezaurusa trzeba rozważyć, czy robimy to dla bibliotekarzy czy dla czytelników. Jeśli jako pomoc dla bibliotekarzy, podczas opisywania wprowadzanych dokumentów (bo dla czytelników zawartość tezaurusa pewnie nie będzie widoczna), to ten powyższy słownik jest - przynajmniej dla publikacji wprowadzanych przeze mnie - mało adekwatny. Dodawanie publikacji wiązałoby się z ciągłym dodawaniem terminów oddających dokładnie tematykę np. artykułu naukowego, więc w gruncie rzeczy zewnętrzne źródło tych terminów nie byłoby konieczne. Istotne stałoby się przede wszystkim wiązanie synonimów przez redaktora.

Jeśli słowa kluczowe miałyby dobrze służyć czytelnikom, dobrze by było, gdyby system podpowiadał czytelnikowi kategorie, do jakich termin wyszukiwawczy należy (np. Czy chodziło ci o zamek-budowlę czy zamek-urządzenie?), a do kategorii tych publikacje przydzielałby redaktor. Redaktorzy musieliby mieć większe uprawnienia. by móc pracować na wartościach atrybutów dla słów kluczowych, które dostępne są w aplikacji administratora. Redaktor łączyłby synonimy i przydzielał takie kategorie (łączenie wartości to rzecz mało kłopotliwa, którą i tak juz stosujemy np. gdy autorka wyszła w międzyczasie za mąż i przedłużyła nazwisko). A te nowe wartości słów kluczowych można by było pobierać właśnie z listy zapytań użytkowników, które byłyby "zalecaną ściągą" dla redaktorów (i gdy np. okaże się, że w 90% przypadków szukają przez np. zarządzanie firmą a nie zarządzanie przedsiębiorstwem, to jasne jest jaki synonim dodać do zarz. przedsiębiorstwem), albo z jakichś statystyk wyrazów występujących w tekście.

Więc wydaje mi się, że kontrolowane słownictwo zdecydowanie w kryteriach takich jak np. typ dokumentu i język, ale w przypadku słów kluczowych raczej rozbudowa synonimami - możliwości wyszukiwawcze będą większe.
 
     
rosz_mar 

Dołączył: 18 Lut 2007
Posty: 3
Poziom: 1
HP: 0/18
 0%
MP: 8/8
 100%
EXP: 2/9
 22%
Wysłany: 2008-05-31, 10:33   

Zastosowanie słownictwa kontrolowanego w jakimkolwiek systemie to zgoda na kontrolę zarówno podczas indeksowania jak i wyszukiwania. O ile podczas katalogowania dążymy do zachowania spójności terminologicznej używanych terminów, to w przypadku wyszukiwania warto byłoby wykorzystać również potencjał intelektualny naszych użytkowników. ;-)
Nie ma żadnej przeszkody, aby powiązać kontrolowany system leksykalny z wyszukiwarką. Tak jest w Intute:
http://www.intute.ac.uk/s...set&term=floods

Moim zadaniem zapytania użytkowników mogą pełnić wyłącznie funkcję pomocniczą czy to w wiązaniu synonimów, czy też w poszukiwaniu terminów dla pojęć przez nich poszukiwanych (tzw. zasada user warrant).

Trzeba też mieć na uwadze zakres tematyczny kolekcji. Najbardziej praktycznym rozwiązaniem byłby system leksykalny o zakresie uniwersalnym.

Na koniec dodam, że nie jestem "wielkim fanem" indeksów słów kluczowych rozproszonych w w sekcjach odpowiadającym literom alfabetu. Nie mam wiedzy co do ich wykorzystania przez użytkowników, więc piszę wyłącznie ze swoich doświadczeń. Ale, ale! Zastosowanie słownictwa kontrolowanego z rozbudowaną paradygmatyką to już pierwszy krok do konstrukcji struktur taksonomicznych, co moim zdaniem jest o wiele bardziej efektywne.

Obok wprowadzenia "porządku" w zasobie leksykalnym stosowanym w indeksowaniu tutaj upatruję dużej szansy na tworzenie narzędzi dostępowych opartych na przeglądaniu (browsing)
 
     
Bozena Michalska 
Bożena Michalska

Dołączyła: 29 Mar 2007
Posty: 140
Skąd: Toruń
Poziom: 10
HP: 0/230
 0%
MP: 110/110
 100%
EXP: 20/22
 90%
Wysłany: 2008-06-05, 11:44   

czy struktury taksonomiczne nie sa przypadkiem istotne dla wyszukiwania semantycznego?
 
     
Wyświetl posty z ostatnich:   
Ten temat jest zablokowany bez możliwości zmiany postów lub pisania odpowiedzi
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
Biblioteka 2.0 : Forum społeczności czytelników i bibliotekarzy cyfrowych [Dokument elektroniczny] - Tryb dostępu http://forum.biblioteka20.pl
Korzystanie z portalu oznacza akceptację naszej polityki prywatności.
Strona wygenerowana w 0.1 sekundy. Zapytań do SQL: 9