środa, 24 października 2012
Nowe narzędzie przetwarzania danych w przemyśle książkowym
CzasopismoBiblioteka Analiz
Tekst pochodzi z numeru339
International Standard Text Code – międzynarodowy system identyfikacji i rejestracji tekstów, w skrócie ISTC, to nowy system identyfikacyjny w przemyśle księgarskim. Podczas gdy ISBN (International Standard Book Number) opisuje każdy indywidualny format produktu, czyli zarówno książkę w postaci fizycznej, np. w twardej czy miękkiej oprawie, jak i wersję cyfrową, np. audiobook, e-book o rozszerzeniu .pdf czy innym - ISTC określa tekst, który kryje się za każdą z tych manifestacji. Utwory podlegające identyfikacji za pomocą ISTC są precyzyjnie określone. Muszą być wyrazem pracy o charakterze intelektualnym lub twórczym, mieć formę tekstu (ciąg słów uszeregowanych w odpowiednim porządku) i być przeznaczone do publikacji. Hamlet oraz Duma i uprzedzenie są w tym kontekście całkowicie abstrakcyjnymi całościami, niezależnymi od ich fizycznych czy cyfrowych „opakowań”, w których mogą być przekazane czytelnikowi. Unikalny numer ISTC stosuje się zatem do wszystkich edycji i wersji tego samego tekstu bazowego. ISTC identyfikuje i grupuje w ten sposób wszystkie formaty lub przejawy podstawowego tekstu. ISTC jest zaawansowanym i elastycznym standardem, choć jego potencjalna wielowarstwowość i kompleksowość może trochę onieśmielać. Z początku negowano szerokie zastosowanie ISTC dla przemysłu wydawniczego. Celem tego artykułu jest wyjście poza oficjalną dokumentację dotyczącą standardu i zmierzenie się z wątpliwościami i zarzutami, jakie kierowano pod adresem tego systemu identyfikacyjnego. Niniejsze opracowanie dostarcza podstawowej wiedzy na temat ISTC, jak również przedstawia konkretne przykłady, krok po kroku wyjaśniające wydawcom i innym zainteresowanym stronom, które nie zetknęły się jeszcze z ISTC, zasady działania tego standardu identyfikacyjnego. Sukces we wprowadzaniu standardu zależy od wspólnego zaangażowania wydawców i agencji rejestracyjnych w celu precyzyjnego powiązania tekstów bazowych i ich pochodnych. Jednocześnie zarówno agencje, jak i użytkownicy powinni mieć świadomość, że struktura kodująca systemu składa się z elementów otwartych i elastycznych, pozwalających na dokonanie wyboru, ale także z elementów obligatoryjnych. ISTC – jak to działa? ISTC jest międzynarodowym Standardem ISO (ISO 21047), opublikowanym w marcu 2009. Standard – podobnie do standardu ISBN – jest zarządzany przez Międzynarodową Agencję ISTC, która udziela licencji podległym jej agencjom rejestracyjnym nadającym numery ISTC. Żadna z takich agencji nie ma wyłączności terytorialnej (chociaż np. Nielsen Book i Bowker prowadzą agencje rejestracyjne odpowiednio w Wielkiej Brytanii i Stanach Zjednoczonych, MVB z kolei w Niemczech). Oprócz Standardu ISO Międzynarodowa Agencja ISTC wydała dokument wspierający implementację ISTC, który ma charakter podręcznika i razem ze specyfikacją dla programu ONIX dla Rejestracji ISTC (ciąg wiadomości XML) stanowi instrukcję dla wprowadzających dane do nowej, globalnej bazy danych – Standard Text Registration System (STRS) – i rejestrujących teksty w systemie ISTC. Baza STRS jest wspólna dla wszystkich agencji ISTC. Oczywiście elektroniczne wprowadzanie danych do bazy jest najbardziej odpowiednią metodą uzupełniania tejże bazy, na życzenie rejestrujących mogą jednak również zostać udostępnione inne metody. ISTC identyfikuje utwór odrębny, o charakterze intelektualnym bądź twórczym, wyrażony w formie tekstu (np. utwór prozatorski, poetycki, tekst piosenki, scenopis, dialogi z filmu). Taki utwór może zawierać ilustracje czy zdjęcia, ale nie mogą one stanowić przeważającej jego części. Dlatego album ze zdjęciami, w którym tekst stanowi jedynie niewielki komentarz, nie może zostać umieszczony w bazie STRS i nie można mu nadać numeru ISTC. Graficznym wersjom powieści, komiksów, mang itp. można nadawać numery ISTC, ale w tym przypadku ISTC identyfikuje jedynie część tekstową, nie rysunki. Każdy, a mianowicie: autor, wydawca, przedstawiciel autora, bibliotekarz, organizacja zbiorowego zarządzania, instytucje zbierające dane, może zarejestrować nowy utwór, zgłaszając się do agencji rejestracyjnej. Jedynym wymogiem jest dostatecznie szeroka wiedza na temat rejestrowanego utworu. Wybrana agencja rejestracyjna przeprowadza komputerowy test oparty na algorytmie i na podstawie wprowadzonych danych ustala, czy dany tekst został już wcześniej umieszczony w bazie przez inną agencję, czy też nie. Wszystkie numery ISTC są umieszczane w jednej, globalnej bazie o wymienionej już nazwie Standard Text Registration System (STRS) – Ustandaryzowany System Rejestrujący Teksty. Numer ISTC składa się z 16 znaków, stanowiących cztery komponenty, oddzielone od siebie kreskami lub spacjami, np.: ISTC A02-2010-31F4CB2C-B Pierwszy i trzeci element opierają się na systemie szesnastkowym i umożliwiają użycie cyfr od 0 do 9 oraz liter od A do F. Pierwszy element, np. A02, oznacza numer agencji rejestracyjnej, za pośrednictwem której nadano numer ISTC. Następny element to rok rejestracji. Trzeci to aktualny i jednoznaczny identyfikator tekstu. Ostatni znak jest cyfrą kontrolną. Ten szesnastkowy system generowania pozwala na zarejestrowanie 4 294 967 296 odrębnych utworów rocznie. ISTC dostarcza mechanizmu, który umożliwia pogrupowanie utworów o tej samej zawartości (lub też – w niektórych przypadkach – o różnej zawartości, pochodzącej z tego samego źródła), natomiast sam numer nie posiada żadnego elementu, który wskazywałby na to, kto zarejestrował tekst. Numer ISTC nie stanowi niczyjej własności, jest przypisany do tekstu, który identyfikuje. Pan Tadeusz Adama Mickiewicza może być publikowany w nieograniczonej liczbie formatów czy języków, a także przez wielu wydawców, ale może być zarejestrowany w bazie ISTC tylko jako jeden, oryginalny tekst. Numer ISTC można nadać jedynie utworowi o charakterze intelektualnym bądź artystycznym, posiadającemu formę tekstu i takiemu, który zostanie lub został opublikowany (książka w twardej lub miękkiej oprawie, audiobook, e-book itp.), czyli takiemu, który posiada numer ISBN, a także przypisany mu zestaw metadanych (np. w formacie Onix). Z bibliograficznego punktu widzenia ISTC jest atrybutem powiązanym z metadanymi, jakie kryją się za jednym lub kilkoma numerami ISBN. ISBN, który odwołuje się do tego samego ISTC, nie jest widoczny w wyszukiwarce bazy danych numerów ISTC. Nie jest to identyfikator służący do wylistowania utworów, które można kupić. Jest to narzędzie funkcjonujące w połączeniu z bazami danych w formie katalogów, z systemami zarządzania danymi (CMS) i innymi wyszukiwarkami publikacji oraz internetowymi platformami sprzedażowymi. ISTC ułatwia wyszukiwanie danych znacznie bardziej precyzyjnie niż dotychczas. W przypadku odpytania bazy według tytułu użytkownik, żeby wyszukać wszystkie wydania, nie musi już znać wszystkich tytułów, pod jakimi ukazał się dany utwór. Wystarczy, że będzie znał tytuł jednego wydania, do którego przypisano numer ISTC, żeby za pomocą wyszukiwarki ISTC dotrzeć do innych wydań utworu. Jeden utwór z przypisanym mu numerem ISTC (np. Stephenie Meyer, Zmierzch) może mieć zatem nieograniczoną ilość wydań w różnych formatach, każde z przypisanym numerem ISBN, np. ISBN 1 twarda oprawa ISBN 2 miękka oprawa ISBN 3 broszura promująca film ISBN 4 książka wydana dużą czcionką ISBN 5 wydanie biblioteczne ISBN 6 e-book w formacie PDF do pobrania ISBN 7 e-book Kindle ISBN 8 e-book Sony ISBN 9 audiobook w pełnej wersji do pobrania ISBN 10 audiobook w pełnej wersji na płycie CD Należy podkreślić, że bazą dla wszystkich tych wydań jest ten sam tekst – ta sama kolejność słów, znaków, spacji, przedstawiona jedynie w różnej postaci. W kontekście ISTC nie jest istotne, że odbiorca, nawet jeśli słowa utworu są takie same, może nie uznać wersji audio utworu i wydania w twardej oprawie za równorzędne albo że aktor czy autor odczytuje tekst. Poprzez ISTC wszystkie z dziesięciu wymienionych wydań mogą zostać powiązane ze sobą jako „ta sama rzecz” i można je połączyć w jedną całość dla różnych celów. W odwrotny i również użyteczny sposób ISTC może odróżnić tę całość od innych utworów o tym samym lub podobnym tytule bądź zestawie metadanych, które mogą wydawać się z pozoru takie same, ale u podstaw których nie leży ten sam tekst i które mają wobec tego przypisany inny numer ISTC. Trzeba przy tym podkreślić, że struktura ISTC pozwala na to, aby poszczególne wydania tekstu posiadały więcej niż jeden ISTC, jeśli utwór posiada więcej niż jeden możliwy do wyodrębnienia i unikalny element tekstowy. Protokół ISTC wymaga, żeby każdy zarejestrowany utwór zawierał określenie, czy jest to utwór oryginalny czy też pochodny (derywat). W zestawie metadanych systemu ISTC opisujących utwór pochodny należy zawsze podać numer ISTC tekstu źródłowego, na bazie którego powstał tekst pochodny, a także rodzaj derywacji (np. kompilacja, tłumaczenie). W ten sposób możliwe jest połączenie dwóch utworów (tekstu oryginalnego i pochodnego). Istotny jest również fakt, że korzyści dla środowiska książki i prasy wynikające z wykorzystania systemu ISTC zależą od stopnia precyzji metadanych wprowadzanych do bazy ISTC. Agencje Bibliograficzne Nielsen i Bowker udostępniły wyszukiwarkę internetową pod adresem: www.istc- -search-beta.peppertag.com/ptproc/ IstcSearch, dzięki której można przeszukiwać bazę STRS (bazę systemu rejestracyjnego ISTC). Wydawcy, autorzy, bibliotekarze i użytkownicy prywatni mogą w niej wyszukać numer ISTC, wpisując autora lub tytuł utworu interesującej ich publikacji. Potencjalni rejestrujący nowe utwory mogą sprawdzić, czy utwór, któremu chcą nadać numer ISTC, został już wcześniej zarejestrowany w bazie. Baza nie umożliwia jeszcze wyszukiwania wszystkich utworów skorelowanych z danym tekstem i nie daje możliwości wyszukiwania utworów po numerze ISBN. Podanie numerów ISBN podczas rejestracji w systemie ISTC wspiera proces wyodrębniania rejestrowanego tekstu od innych jemu podobnych, dlatego też formularz ISTC zawiera pola, gdzie należy podać pełny numer ISBN (ISBN dziesięcio- lub trzynastocyfrowy). Zestaw metadanych niezbędnych do zarejestrowania tekstu we wspomnianym już systemie rejestrującym STRS (Standard Text Registration System) składa się z możliwie najmniejszej ilości danych niezbędnych do uniknięcia podwójnej rejestracji tego samego tekstu. W chwili wprowadzania danych do bazy nie jest możliwe podanie wszystkich istniejących reprezentacji tekstu źródłowego (bazowego). Rejestrujący tekst po raz pierwszy może w każdej chwili dodać nowe utwory, również inni – agenci, inni wydawcy lub posiadacze praw do utworu, czy ich pełnomocnicy – mogą wprowadzić później teksty pochodne, np. tłumaczenia. Taki mechanizm zapewnia dynamiczną korektę (jeśli to niezbędne) oraz wzbogacenie bazy ISTC i powiązanych z nią baz danych. Warto podkreślić, że w chwili utworzenia wpisu w bazie ISTC nikt nie staje się „właścicielem” numeru ISTC. Zarządzanie powiązaniami ISTC–ISBN i odwrotnie, ISBN–ISTC, znajduje się w rękach serwisów bibliograficznych, stowarzyszeń licencjonujących i zarządzających prawami autorskimi, a także wydawców (w zakresie ograniczonym do publikacji, które do nich należą). System ISTC – korzyści i beneficjenci ISTC jest systemem, który jest przydatny dla autorów, ich przedstawicieli i organizacji ich zrzeszających, jak również dla wydawców, posiadaczy praw autorskich, dystrybutorów, bibliotek, a także instytucji zbierających dane i nimi zarządzających, agencji bibliograficznych, licencjonujących i prowadzących rejestry posiadaczy praw. Może być wykorzystany w następujący sposób: 1. Wyszukiwanie, grupowanie i rozróżnianie danych niezbędne dla precyzyjnego wyszukiwania ISTC, jako identyfikator stosowany dla wszystkich przejawów utworu (niezależnie od rodzaju wydania, formatu czy formy) opierających się na tym samym tekście bazowym, pozwala na pogrupowanie i wyfiltrowanie podczas wyszukiwania istniejących manifestacji tego tekstu (por. przytoczony wcześniej przykład utworu Zmierzch). Osoba szukająca danych musi zlokalizować w bazie tylko jedną reprezentację utworu, którego szuka, a następnie sprawdzić powiązane z nim numery ISTC po to, aby dotrzeć do innych wydań tego samego tekstu. Jednocześnie ma ona …
Wyświetlono 25% materiału - 1673 słów. Całość materiału zawiera 6694 słów
Pełny materiał objęty płatnym dostępem
Wybierz odpowiadającą Tobie formę dostępu:
1A. Dostęp czasowy 15 minut
Szybkie płatności przez internet
Aby otrzymać dostęp kliknij w przycisk poniżej i wykup produkt dostępu czasowego dla Twojego konta (możesz się zalogować lub zarejestrować).
Koszt 9 zł netto. Dostęp czasowy zostanie przyznany z chwilą zaksięgowania wpłaty - w tym momencie zostanie wysłana odpowiednia wiadomość e-mail na wskazany przy zakupie adres e-mail. Czas dostępu będzie odliczany od momentu wejścia na stronę płatnego artykułu. Dostęp czasowy wymaga konta w serwisie i logowania.
1B. Dostęp czasowy 15 minut
Płatność za pośrednictwem usługi SMS
Aby otrzymać kod dostępu, należy wysłać SMS o treści koddm1 pod numer: 79880. Otrzymany kod zwotny wpisz w pole poniżej.
Opłata za SMS wynosi 9.00 zł netto (10.98 PLN brutto) i pozwala na dostęp przez 15 minut (bądź do czasu zamknięcia okna przeglądarki). Przeglądarka musi mieć włączoną obsługę plików "Cookie".
2. Dostęp terminowy
Szybkie płatności przez internet
Dostęp terminowy zostanie przyznany z chwilą zaksięgowania wpłaty - w tym momencie zostanie wysłana odpowiednia wiadomość e-mail na wskazany przy zakupie adres e-mail. Dostęp terminowy wymaga konta w serwisie i logowania.
3. Abonenci Biblioteki analiz Sp. z o.o.
Jeśli jesteś już prenumeratorem dwutygodnika Biblioteka Analiz lub masz wykupiony dostęp terminowy.
Zaloguj się