Přeskočit na hlavní obsah

O formátu EPUB

Formát EPUB je v současné době nejrozšířenější a nejpodporovanější formát pro e-knihy, proto mu budu věnovat nejvíce prostoru. EPUB (Electronic PUBlication) otevřený formát vytvořený speciálně pro e-knihy podle standardu organizace International Digital Publishing Forum (IDPF). Přípona souboru je .epub a ve skutečnosti se jedná o přejmenovaný soubor .zip se specifickou adresářovou a souborovou strukturou.

EPUB využívá jazy XHTML včetně stylování a vkládání multimediálních souborů.

Verze formátu EPUB:

  • EOB (Open eBook) - 1999
  • EPUB 2 - 2007
  • EPUB 2.0.1 - 2010
  • EPUB 3 - 2011
  • EPUB 3.0.1 - 2014
  • EPUB 3.1 - 2017

Základní struktura

Soubor EPUB "sbaluje" několik souborů uložených ve složkách jako formát *.zip. Základní struktura sbalených souborů pak pro EPUB 2 vypadá takto:

Pojďme si nyní uvedený strom projít trochu podrobněji.

Soubor minitype

Jedná se malý soubor v kořenovém adresáři. Soubor obsahuje jediný řádek v tomto tvaru:

application/epub+zip

Adresář META-INF

V tomto adresáři je primárně soubor container.xml, který odkazuje na soubor content.opf v adresáři OEBSP. Zkrojový kód souboru tedy vypadá takto:

application/epub+zip

Adresář META-INF

V tomto adresáři je primárně soubor container.xml, který odkazuje na soubor content.opf v adresáři OEBSP. Zdrojový kód souboru tedy vypadá takto:

<?xml version="1.0" encoding="UTF-8"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OEBPS/content.opf" media-type="application/oebps-package+xml"/>
</rootfiles>
</container>

Ve složce může zde být i například soubor encryption.xhtml, který nese informace o kódování - v případě používání kódovaných fontů.

Adresář OEPS

V tomto adresáři jsou veškerá data e-knihy. Adresář obsahuje další složky - Images, Styles, Text a dva soubory. první z nich, soubor content.opf, je jakýmsi adresářem celé struktury, který obsahuje veškerá metadata knihy a také na datové soubory i na navigační soubor toc.ncx. Soubor toc.ncx je zásadní pro orientaci v publikaci. NCX tvoří obsah knihy a řazení kapitol (je napsaný ve XML). Odkazuje se buď na celý soubor nebo na jeho části. Ukázka kódu pro řazení jednotlivých souborů:

<navPoint id="cokoliv" playOrder="pořadové číslo">
<navLabel><text>zobrazovaný název</text></navLabel>
<content src="přílušný soubor.html" />
</navPoint>

Adresář Text

V této složce jsou umístěny jednotlivé stránky (XHTML či jiné soubory) knihy. Jak už jsem psal, XHTML umožňuje hypertextové odkazy mezi jednotlivými soubory a je tedy možné pomocí odkazů jednotlivé soubory propojit.

Adresář Styles

Do složky Styles se ukládají jednotlivé soubory kaskádových stylů. Jde o soubory s koncovkou .css, které definují vzhled jednotlivých prvků dokumentu.

Adresář Images

Do této složky patří veškeré obrázky použité v knize. Podpora formátu se může lišit na typy zařízení. Určitým standardem jsou soubory JPG/JPEG, PNG, GIF, SVG.

Adresář Fonts

Tento adresář není povinný. Pokud však v knize použijete přiložené soubory písem, patří tyto soubory (OTF, TTF, SVG) do této složky.

K písmům si dovolím malou související odbočku: Dlouhou dobu byl postoj českých distributorů značně rozdílný. Zatímco někteří distributoři od nakladatelů zásadně vyžadovali vložené české fonty, jiní naopak vložená písma zakazovali. Jedním argumentem byl fakt, že na trhu byla spousta čteček, které neobsahovaly vlastní české písma. Druhým naopak neustálená podpora písem na jednotlivých platformách a požadavky uživatelů na jednotný styl vzhledu. Dnes už je přístup benevolentní a vlastní písma být v souboru mohou ale nemusí.

Komentáře

Populární příspěvky z tohoto blogu

Jak číst e-knihy

Už jsme si probrali, co je e-kniha, jaké mohou být formáty i jaké jsou  výhody elektronického čtení . V tomto textu projdeme možnosti čtení e-knih. Čtečka Čtečka je specializované zařízení pro čtení e-knih. Největší rozmach čteček byl současně s techlogií e-ink (též e-papír, digitální inkoust). Díky této technologii je čtení e-knih velmi podobné čtení knihám papírovým. Ač je čtečka díky e-ink většinou s černobílým displejem, má v porovnání oproti tabletům určité čtenářské výhody - malá hmotnost, dlouhá výdrž baterie i lepší čitelnost na slunci. Pro náročnější čtenáře je čtečka nadále ideální variantou. Na světovém trhu jsou však tyto zařízení na pomalém ústupu - přesto, že se vyvíjí nové modely s dalšími funkcemi, nemají uživatelé tendenci své zařízení často obnovovat. I přes dotykový displej, wi-fi, internetový prohlížeč, hry a další funkce, stále jde o zařízení specializované a mnoho čtenářů dává dnes přednost zařízením multifunkčním. Tablet, mobil Právě rozvoj tabletů a chytrých tel

Historie e-knih

Myšlenka elektronických knih se objevila v roce 1971, kdy Michael S. Hart založil Projekt Gutenberg ( www.gutenberg.org ). Počátek vývoje byl velmi roztříštěný a většinou souvisel s počítačovými obory, kde se e-kniha uchytila například pro různé příručky a návody. Určitý přelom nastal konce 20. století, kdy se e-knihy dostaly do zájmu širšího množství čtenářů a vydavatelé díky tomu podnikali první nesmělé kroky do světa elektronické literatury. Ač se jednalo o určité hledání cesty a narážení do slepých uliček, bylo objeveno několik fungujících řešení. Na trhu však nebyl žádný velký hráč, který by určil nějaký standard a tak se současně vyvíjelo nepřeberné množství formátů.

Specifika XHTML

Pokud máte základní znalosti HTML jazyka, dovolím upozornit na nejdůležitělší rozdíly: Uvozovky pro atributy Oproti HTML musí být všechny hodnoty atributů v uvozovkách. Uvozovky je vhodné používat i v HTML, ale jejich nepoužití není chyba. Například HTML kód pro obrázek může být zapsán takto: <img src=tojsemja.png width=150 height=400> V XHTML musí být vždy použity uvozovky (eventuálně apostrofy): <img src="tojsemja.png" width="150" height="400" /> nebo také: <img src='tojsemja.png' width='150' height='400' /> Zákaz křížení tagů Toto vlastně není změna, křížení tagů se nesmí ani v HTML. Zatímco ale většina internetových prohlížečů křížený zápis HTML přečtou a poradí si s ním, v XHTML je to striktně zakázáno a validátory epub souborů zahlásí chybu. špatně: <b><i>tučná kurzíva</b></i> správně: <