Jan 272012
 

Ich komme nun zu dem vorerst letzten Artikel in meiner kleinen Serie über Sigil, einem Programm, mit dem man aus beliebigen Text EBooks im EPUB-Format erzeugen kann.

Das EPUB-Format ermöglicht es, Inhaltsverzeichnisse in EBooks einzubinden. Ein solches Inhaltsverzeichnis bietet nicht nur die Möglichkeit, eine Liste aller Kapitel und (wenn gewünscht) Unterkapitel anzuzeigen, sondern verlinkt gleichzeitig zur entsprechenden Stelle im EBook. Wenn also ein Leser vom Inhaltsverzeichnis direkt auf Kapitel 3 springen möchte, braucht er nur den Link anzuklicken. Ein Inhaltsverzeichnis erleichtert also die Navigation in einem Buch.

Eine Voraussetzung zur Erstellung eines Inhaltsverzeichnisses ist, dass man Textüberschriften entsprechend gekennzeichnet hat. Wie man das macht, wurde im Artikel zur Textformatierung bereits besprochen.

Die Funktion ein Inhaltsverzeichnis zu erstellen findet sich im Menü “View” unter “Table of Contents”:

Es öffnet sich ein separates Fenster mit dem Titel “Table of Contents”.

Unten gibt es einen Button “Generate TOC from headings”. Übersetzt heißt es: “Erstelle ein Inhaltsverzeichnis von den Überschriften”. Durch den Klick auf den Button wird ein weiteres Fenster geöffnet, in dem alle Überschriften aufgelistet werden.

Da in unserem Beispiel nicht nur die einzelnen Akte, sondern auch jede Sektion als eine Überschrift gekennzeichnet wurde (so wurde es aus dem ursprünglichen HTML übernommen), ist die Liste recht lang. Neben jeder Überschrift ist ein Kästchen, in dass man ein Häkchen platzieren kann, wenn man wünscht, diese Überschrift in das Inhaltsverzeichnis aufzunehmen. Wenn man mit seiner Auswahl zufrieden ist, klickt man auf “OK”. Nun ist das Inhaltsverzeichnis erstellt und in das EBook eingebunden. Dem Leser nutzt es zur Navigation im Buch selbst.

Hiermit beende ich meine Serie von Artikeln über Sigil. Das so erzeugte EBook habe ich auf diese Website hochgeladen, und kann von jedem, der möchte in seinen EBook-Reader geladen und gelesen werden.

Empfehlen/Bookmark
Jan 252012
 

In einem vorigen Artikel über Sigil habe ich bereits das Wort “Metadaten” benutzt. Hier möchte ich nun auf die Wichtigkeit dieser Daten eingehen und beschreiben, wie sie mit Sigil in ein EBook im EPUB-Format eingefügt werden können.

“Metadaten” ist ein weiteres Wort, das Bibliothekare gerne benutzen und womit viele Nicht-Bibliothekare wenig anfangen können. Metadaten sind “Daten über Daten”, in diesem Fall “Daten über das Buch”. Früher, bevor das hippe Wort “Metadaten” in Mode kam, sprachen Bibliothekare auch von “bibliografischen Daten”. Es handelt sich dabei um Daten wie Autor, Titel, Herausgeber, Publikationsdatum, Umfang des Buches, usw. Im Abschnitt über das Titelblatt wurden diese Daten bereits erwähnt.

Warum sind Metadaten wichtig? Wenn man in seinem EBook-Reader, geladen mit tausenden Büchern, ein bestimmtes Buch sucht, so braucht man Metadaten. So würde man unser Beispielbuch z.B. in einer Autorensuche nach Shakespeare oder Titelsuche nach “All’s well that ends well” suchen. Die Suchfunktion des EBook-Readers sucht nicht in den Texten selbst, sondern in den Metadaten nach dieser Information. Die Titelseite, die wir also erstellt haben hilft uns Menschen zwar, das Buch mit einem Blick zu erkennen, aber wenn man eine Suche nach dem Buch ermöglichen möchte, muss man ihm Metadaten hinzufügen.

Im Menü “Tools” versteckt sich der sogenannte “Meta Editor”, mit dem man die Metadaten erstellen kann.

Beim Aufruf dieser Funktion öffnet sich ein kleines Fenster:

Die beiden wichtigsten Metadaten, nämlich Autor und Titel, sowie die Sprache kann man problemlos eingeben. Mit einem Klick auf “Add Basic” oder “Add Advanced” kann man der Datei weitere Metadaten hinzufügen. So wurden z.B. für den Beispieltext folgende Metadaten hinzugefügt:

Bei “Source” wurde die URL zur Quelle des Textes gegeben. Unter “Rights” wurde gesagt, dass sich das Buch im Public Domain befindet. Es ist nicht wirklich nötig das Format anzugeben, aber wenn man es tut, sollte man den MIME-Type des Formats nennen. Es folgen ein paar Schlagworte aus einem Bibliothekskatalog und eine Beschreibung des Inhalts des Textes aus der Wikipedia.

Ich halte das Publikationsdatum für ein sehr wichtiges Metadatum. Allerdings ist es mir nicht gelungen ein Jahr vor 1749 einzugeben. Da, nach der Wikipedia, das Drama um 1623 publiziert wurde wäre jede Angabe falsch gewesen. Daher habe ich es erstmal gelassen. Vielleicht wird es mir mit der Metadatenbearbeitungsfunktion von Calibre gelingen, das korrekte Datum hinzuzufügen. Es ist zu hoffen, dass dieser Bug in weiteren Versionen von Sigil behoben wird.

Jan 232012
 

In diesem Artikel in meiner kleinen Serie über das Programm Sigil möchte ich über Umschlagbilder sprechen. Ein Umschlagbild ist nicht wirklich nötig, aber es hilft, ein Buch im Bücherregal des EBook-Readers schneller zu erkennen.

Dazu muss eine Bilddatei erstellt werden. Im Sigil-Tutorial werden folgende Maße für das Bild empfohlen: Breite 590 Pixel, Länge 750 Pixel. Diese Bilddatei kann nicht in Sigil selbst erstellt werden, sondern in einem Bildbearbeitungsprogramm wie z.B. das frei verfügbare GIMP. Es würde des Rahmen dieses Artikels sprengen zu erklären, wie man ein Umschlagbild in GIMP oder einem anderen Bildbearbeitungsprogramm erzeugt. Der Kreativität sind natürlich kaum Grenzen gesetzt. Für das Beispiel habe ich ein eher schlichtes Bild kreiert, das wie folgt aussieht:

Wie bindet man nun dieses Bild mit Sigil in die EPUB-Datei ein?

Als erstes erzeugt man wieder eine leere Seite vor der Titelseite, indem man den bereits beschriebenen Chapter Break benutzt.

Auf diese leere erste Seite muss man nun das Umschlagbild einfügen. Gleich neben dem Chapter-Break-Button in der Button-Leiste von Sigil ist ein Button namens “Insert Image”.

Mit einem Klick darauf bekommt man die Möglichkeit ein Bild hochzuladen. Das Ergebnis sieht wie folgt aus:

Es fällt auf, dass sich links, bei den Ordnern, die in Sigil dargestellt werden, etwas getan hat. In dem Ordner “Images” ist nun eine Datei vorhanden, nämlich das Umschlagbild, das man gerade hochgeladen hat.

Bilder können natürlich überall mit dem soeben beschriebenen Verfahren in eine EPUB-Datei eingefügt werden.

Jan 212012
 

In meiner kleinen Serie über das Programm Sigil möchte ich heute beschreiben, wie man eine Titelseite in ein EPUB-EBook einfügt. Zum besseren Verständnis ist es empfehlenswert, zuerst den vorigen Artikel über Kapitelumbrüche zu lesen.

Da ich oft ganz unbewusst bibliothekarische Ausdrücke um mich werfe, die Nicht-Bibliothekaren nicht unbedingt geläufig sind, möchte ich eine kurze Definition des Begriffes “Titelseite” geben. Die Titelseite eines Buches ist nicht der Umschlag, sondern die Seite ganz vorne im Buch (oft die erste bedruckte Seite), auf der Titel, Autor, Herausgeber, Publikationsdatum, etc. genannt werden. Titelseiten dienen der Orientierung – der Leser kann mit einem Blick sehen, welches Buch er in der Hand hat. Unser Beispiel hat keine solche Titelseite und wenn man es so benutzen möchte, so gibt es keinen Hinweis, dass es sich bei dem Text um William Shakespeares “All’s well that ends well” handelt. Deshalb macht es Sinn, eine Titelseite zu erstellen.

Als erstes geht man ganz an den Anfang des ersten Kapitels und fügt einen Zeilenumbruch ein. Dieser Zeilenumbruch ist wegen der im vorigen Artikel geschilderten etwas merkwürdigen Betriebsweise des Chapter Breaks in Sigil nötig.

Als nächstes setzt man den Cursor auf die leere erste Zeile und klickt auf Chapter Break:

Das hat zur Folge, dass vor dem ersten Kapitel eine weitere, leere Section oder Seite erzeugt wird. Man braucht sich keine Sorgen über die Benennung der einzelnen Sektionen in Sigil machen. In unserem Beispiel weiß das Programm, dass Section0006.xhtml (Kapitel 1 bzw. Akt I) zwischen Section0001.xhtml (Titelseite) und Section0002.xhtml (Kapitel 2 bzw. Akt II) stehen muss.

Wenn man zu der leeren allerersten Seite geht, kann man sie mit der typischen Information einer Titelseite füllen. Empfohlen werden zumindest Titel und Autor und es ist erstens freundlich der ursprünglichen Website gegenüber und zweitens oft hilfreich für den Leser, wenn man auch die Quelle des Textes angibt. Das kann z.B. so aussehen:

Wie bereits oben gesagt: Titelseiten geben einem Leser Orientierung über das Buch. Hier werden die wichtigsten Metadaten des Buches wie Autor und Titel genannt und helfen, wie in einem Papierbuch, ganz schnell herauszufinden, welches Buch man gerade in der Hand, bzw. im EBook-Reader geöffnet hat. Natürlich kann man hier auch andere Informationen geben. Über Metadaten werde ich in einem späteren Artikel noch genauer eingehen.

Jan 192012
 

Vor zwei Tagen habe ich mit einer kleinen Serie über das Programm Sigil begonnen und beschrieben, wie man mit dieser Software einen Text in ein EBook im EPUB-Format verwandeln kann. In den nächsten Tagen folgen weitere Artikel über Möglichkeiten, diese EBooks lesbarer oder findbarer zu machen. Heute möchte ich über Kapitelumbrüche schreiben.

Mir persönlich gefällt es, wenn ein neues Kapitel auf einer neuen Seite anfängt. Bei EBook-Readern gibt es “Seiten” wie man sie aus Papier-Büchern kennt eigentlich eher virtuell, aber man kann den gewünschten Effekt auch hier erreichen, indem man sogenannte “Chapter Breaks” benutzt. Dazu benutzt man den entsprechenden Button in der Button-Leiste.

In dem Beispiel soll jeder Akt auf einer neuen Seite anfangen. Um das zu erreichen, sucht man die Überschrift des nächsten Aktes, also “Act II”. Dazu kann man z.B. die Suchfunktion von Sigil verwenden, wie in dem folgenden Bild:

Nun kommt ein ganz wichtiger Hinweis, wichtig deshalb, weil ich diesem Fehler relativ oft mache und mich dann ärgere. Diesen Ärger möchte ich anderen ersparen. Wenn man einen Chapter Break einfügen möchte, möchte man ihn vor der entsprechenden Überschrift einfügen. Bei Sigil ist es aber so, dass der Chapter Break am Ende der Zeile, in der der Cursor ist, eingefügt wird. Wenn man also den Cursor auf der Überschriftszeile vor die Überschrift setzt, wird der Chapter Break nach der Überschrift erfolgen. Das führt dazu, dass man die Überschrift des neuen Kapitels nicht, wie gewünscht oben am neuen Kapitel hat, sondern unten am vorigen Kapitel. Man sollte also den Cursor immer eine Zeile ÜBER der Überschrift setzen, nicht direkt davor. Wenn man im nächsten Bild genau hinsieht, ist der Cursor am Ende der letzten Zeile des 1. Aktes und nicht am Anfang der Überschrift des 2. Aktes.

Wenn man nun auf den Button für Chapter Break klickt, ist die Überschrift nun nicht mehr mitten im Text, sondern ganz oben auf einer neuen Seite. Wenn man den Vorgang für alle Überschriften wiederholt, ist in Sigil folgendes zu beobachten:

Unter dem Ordner “Text” ganz links sind nun für jedes Kapitel eine separate XHTML-Seite zu finden. Außerdem ist im Vorschaufenster für jede geöffnnete XHTML-Seite ein Reiter zu sehen. Man kann nun von einem Kapitel zum nächsten springen, indem man entweder auf die entsprechende Datei links oder auf den Reiter klickt.

Was hat das nun für eine Auswirkung? Im EBook-Reader fängt jedes Kapitel immer auf einer neuen “Seite” an. Das schafft einen sichtbareren Bruch zwischen Kapiteln und eine bessere Übersicht im Buch.

Wenn man das nicht möchte, so ist das auch in Ordnung. Dann lässt man es einfach bleiben. Aber man sollte doch mit der Funktion der Chapter Breaks vertraut sein, wenn man eine “Titelseite” für das Buch erstellen möchte.

Jan 172012
 

Immer wieder, wenn man EBooks im Internet sucht, steht man vor folgender Herausforderung: der Text eines Buches ist zwar vorhanden, aber nicht in einem EBook-Reader-Format wie EPUB, sondern als normaler Text oder als HTML. Selbstverständlich kann Calibre Text oder HTML ins EPUB-Format konvertieren, aber das Ergebnis ist oft nicht ganz so sauber wie man es sich erwünscht, auch wenn es brauch- bzw. lesbar ist. In solchen Fällen kann man mit der freien Software Sigil schönere Ergebnisse erzielen.

Dieser Artikel ist länger als ursprünglich geplant geworden. Daher werde ich ihn aufteilen und die verschiedenen Kapitel in den nächsten Tagen veröffentlichen.

  • Heute werde ich, nach ein paar einleitenden Bemerkungen, etwas zur Formatierung von Texten sagen.
  • Ein Abschnitt über Kapitelumbrüche ist für den 19. Januar 2012 geplant.
  • Ein Abschnitt über Titelseiten ist für den 21. Januar 2012 geplant.
  • Ein Abschnitt über Umschlagbilder ist für den 23. Januar 2012 geplant.
  • Ein Abschnitt über Metadaten ist für den 25. Januar 2012 geplant.
  • Ein Abschnitt über Inhaltsverzeichnisse ist für den 27. Januar 2012 geplant.

Einleitende Bemerkungen

Sigil ist ein Werkzeug zur Erstellung von EBooks im EPUB-Format. Man kann es sich von dieser Website herunterladen:

http://code.google.com/p/sigil/

Die Installation ist problemlos und wenn man das Programm startet, hat man einen Bildschirm wie diesen:

Leider ist das Programm in Englisch gehalten. Eine deutsche Version oder die Möglichkeit, die Spracheinstellungen zu ändern, habe ich nicht gefunden.

Wie funktioniert Sigil nun? Das kann man wohl am besten mit einem Beispiel zeigen. Nehmen wir mal an, dass wir Shakespeares “Alls well that ends well” ins EPUB-Format verwandeln wollen. Den Text finden wir hier: http://shakespeare.mit.edu/allswell/full.html:

Formatierung des Textes

Wenn man nun den Text dieses Textes kopiert und in Sigil einfügt hat man schon die meiste Arbeit bei der Erstellung des EBooks getan. Aber wenn man genauer hinschaut, merkt man, dass das Ergebnis nicht so, wie auf der Website aussieht:

Die Formatierung, z.B. die durch Fettdruck hervorgehobene Schrift, ist verloren gegangen. Wenn man darauf wert legt, bleiben zwei Möglichkeiten:

  1. Man benutzt die Möglichkeiten von Sigil um den Text nach eigenen Wünschen zu formatieren. Vorteil dieses Verfahrens ist, dass man genau das Ergebnis bekommt, welches man will. Wenn z.B. im ursprünglichen Text manche Stellen in fetter Schrift dargestellt wurden, man selbst diese Stellen aber auch noch unterstreichen möchte, so kann man es mit Sigil den eigenen Vorlieben entsprechend gestalten. Nachteil dieses Verfahrens ist, dass es arbeits- und zeitaufwändig ist.
  2. Man importiert den HTML-Text der ursprünglichen Seite und somit alle Formatierungen. Vorteil dieser Möglichkeit ist, dass es schnell geht. Nachteil ist, dass man ein wenig mit HTML vertraut sein sollte. Das ist vielleicht ein wenig abschreckend, aber andererseits ist HTML nun auch nicht so furchtbar kompliziert, wie man vielleicht denken könnte.

Ich werde auf beide Verfahren eingehen.

Den Text mit Sigil formatieren

Sigil ist ein WYSIWYG-Editor. Jeder, der eine Textverarbeitungssoftware benutzen kann, kann also mit Sigil umgehen.

Nehmen wir mal an, dass wir die Kapitelüberschriften als solche kennzeichnen wollen. In unserem Beispiel sind es Überschriften wie “Act 1″. Der entsprechende Text wird mit der Maus markiert. Links oben finden wir ein Menü, dass mit “Normal” beschriftet ist. Wenn man es aufklappt, findet man hier eine Liste von “Headings”, also Überschriften. Also wählen wir “Heading 1″ und schon ist unsere Überschrift eine Überschrift:

Als nächstes wollen wir die einzelnen Rollen des Dramas kennzeichnen und sie mit fetter Schrift hervorheben. Also markieren wir den entsprechenden Text und klicken auf das Icon für Fettschrift …

… und schon wird der Text unseren Wünschen entsprechend dargestellt:

Das Verfahren ist also einfach und bequem, aber man merkt dann doch bald, dass man wenn man das ganze Drama so durcharbeiten möchte, viel Zeit mitbringen sollte. Bei einem einfachen Roman mit ein paar Kapitelüberschriften kann man es sich geben, aber in einem Fall wie das Beispiel, muss man doch mit Aufwand rechnen. Deshalb ist die zweite Möglichkeit, den HTML-Text des Originals weiter zu nutzen doch eine schnellere.

Bevor ich aber dazu komme, nur noch eine kurze Zwischenbemerkung darüber, warum man Überschriften als Überschriften kennzeichnen sollte. Anfänger in der Textverarbeitung (und deshalb auch in Programmen wie Sigil) benutzen oft einfach Fett, Kursiv und Unterstrich um Überschriften zu formatieren. Das kommt vielleicht noch aus der Zeit, wo man mit einer Schreibmaschine Texte verfasste und die einzige Möglichkeit Überschriften hervorzuheben war, diese entweder in Großbuchstaben oder mit Unterstrich oder beides zu formatieren. Das war “in der guten alten Zeit” in Ordnung, aber in Sigil und auch in der Textverarbeitung sollte man anders vorgehen. So wollen wir z.B. später ein Inhaltsverzeichnis aus allen Überschriften erstellen, aber wie soll das Programm sowas können, wenn es nicht weiß, was Überschrift ist und was normaler Text? Die einzige Art, dem Programm dies zu sagen ist, die Überschriften als Überschriften zu kennzeichnen.

Das urspüngliche HTML verwenden

Genau genommen sollte man von XML und nicht von HTML sprechen, denn EPUB ist ein XML-Format. Aber es würde den Rahmen dieses Artikel sprengen auf diese Unterschiede einzugehen. Es genügt zu wissen, dass man HTML in XML einfügen kann.

Als erstes muss man von der WYSIWYG-Anzeige in die “Code”-Anzeige wechseln. Der entsprechende Button findet sich in der Mitte oben:

Sigil erzeugt automatisch den entsprechenden XML-Code. Da muss nun das HTML eingefügt werden. Wie kommt man an das HTML? Man geht zurück zum Browser, wo man sich den Text ursprünglich geholt hat und öffnet die Webseite im HTML-Format. Beim Firefox und Google Chrome benutzt man STRG-U. Die Webseite wird dann wie folgt dargestellt:

Am einfachsten ist es, wenn man in Sigil den Abschnitt, der mit <html > anfängt und mit </html> aufhört markiert und löscht.

Dann markiert man in der Quelltextanzeige des Browsers alles von <html …> bis “</html>”, kopiert es und fügt es in Sigil ein:

In unserem Beispiel gibt Sigil eine Fehlermeldung heraus:

Es ist bei solchen Fehlermeldungen, wo etwas technisches Verständnis in HTML und XML hilft, das Problem zu beheben. Kurz gesagt: HTML lässt eine gewisse Laxheit in der Kodierung zu. Da wir aber das HTML in eine XML-Datei einfügen wollen und XML diese Laxheit nicht erträgt, kommt es zu Fehlermeldungen. Als XML/HTML-Kennerin würde ich den Fehler manuell beheben, Nicht-Kenner können es erstmal mit “Fix automatically” versuchen und schauen, ob es tatsächlich zu größeren Problemen in der Darstellung kommt.

In diesem Fall wird auf ein Stylesheet verwiesen (später im Artikel ein paar Worte dazu), auf das Sigil sowieso nicht zugreifen kann. Darum entferne ich den LINK-Tag einfach. Aber dies ist eine Lösung für das spezifische Problem und keine allgemeingültige. Der HTML-Code sieht nun so aus:

In diesem spezifischen Fall kommen noch weitere Fehlermeldungen wie die obige vor. Man kann nun auf die Programmierer der Website schimpfen, die kein valides HTML erzeugt haben und die Fehler manuell oder automatisch bereinigen. Wenn alles in Ordnung ist, kann man wieder in die WYSIWYG-Anzeige wechseln:

Man stellt fest, dass der Text nun wie auf der Website dargestellt wird. Vielleicht gefällt einem nicht der hellblaue Kasten ganz oben. Den entfernt man einfach durch Markieren und Löschen.

Stylesheets

Nicht HTML/XML-Kenner können diesen Abschnitt überspringen. Ich möchte nur darauf hinweisen, dass man die von Sigil vorgegebene Formatierung selbstverständlich ändern kann. Wenn man z.B. Überschriften nicht in schwarzen, sondern pinken Text darstellen möchte, kann man es tun. Dazu muss man ein CSS-Stylesheet erzeugen, in den Sigil-Ordner namens “Styles” legen und dieses Stylesheet dann entsprechend verknüpfen. Es würde den Rahmen dieses Artikels sprengen darauf detaillierter einzugehen. Ich möchte nur auf die Möglichkeit hinweisen, die ich persönlich bis jetzt noch nicht genutzt habe, da mir das von Sigil vorgegebene Format gefällt oder zumindest ausreicht.

Wenn man bis hier gekommen ist, hat man bereits ein brauchbares Ebook. Das kann man nun mit “Save” abspeichern, in seinen EBook-Reader hochladen und lesen.

Okt 262011
 

Ich wollte soeben eine EBook-Datei im epub-Format in die Mediathek dieses WordPress-Blogs hochladen. Allerdings war das nicht so einfach, denn ich bekam folgende Meldung:

“Tut mir leid, aber aus Sicherheitsgründen ist dieser Dateityp nicht erlaubt.”

Nun habe ich die Meldung gegoogelt und habe dank flosenart eine Lösung gefunden, die es mir ermöglicht, auch diesen Dateityp hochzuladen.

Zuerst musste ich den MIME-Type von epub feststellen. Die Antwort fand ich bei Wikipedia: application/epub+zip.

  1. Öffne die functions.php-Datei im WordPress-Ordner “wp-includes” in einem Texteditor
  2. Suche die Funktion “get_allowed_mime_types()”
  3. Füge in der Liste der erlaubten Dateitypen folgendes hinzu:
    'epub' => 'application/epub+zip', (Komma nicht vergessen)
  4. Die Datei abspeichern und per FTP auf den Server, auf dem die WordPress-Installation liegt, in das Verzeichnis wp-includes laden.

Dieses Verfahren ist natürlich auch für andere Dateitypen gültig, aber man sollte sich eventueller Sicherheitsprobleme bewusst sein – die ich bei epub nicht sehe.

Bei dem nächsten Upgrade von WordPress muss ich wahrscheinlich die Datei wieder ergänzen.