Jan 172012
 

Immer wieder, wenn man EBooks im Internet sucht, steht man vor folgender Herausforderung: der Text eines Buches ist zwar vorhanden, aber nicht in einem EBook-Reader-Format wie EPUB, sondern als normaler Text oder als HTML. Selbstverständlich kann Calibre Text oder HTML ins EPUB-Format konvertieren, aber das Ergebnis ist oft nicht ganz so sauber wie man es sich erwünscht, auch wenn es brauch- bzw. lesbar ist. In solchen Fällen kann man mit der freien Software Sigil schönere Ergebnisse erzielen.

Dieser Artikel ist länger als ursprünglich geplant geworden. Daher werde ich ihn aufteilen und die verschiedenen Kapitel in den nächsten Tagen veröffentlichen.

  • Heute werde ich, nach ein paar einleitenden Bemerkungen, etwas zur Formatierung von Texten sagen.
  • Ein Abschnitt über Kapitelumbrüche ist für den 19. Januar 2012 geplant.
  • Ein Abschnitt über Titelseiten ist für den 21. Januar 2012 geplant.
  • Ein Abschnitt über Umschlagbilder ist für den 23. Januar 2012 geplant.
  • Ein Abschnitt über Metadaten ist für den 25. Januar 2012 geplant.
  • Ein Abschnitt über Inhaltsverzeichnisse ist für den 27. Januar 2012 geplant.

Einleitende Bemerkungen

Sigil ist ein Werkzeug zur Erstellung von EBooks im EPUB-Format. Man kann es sich von dieser Website herunterladen:

http://code.google.com/p/sigil/

Die Installation ist problemlos und wenn man das Programm startet, hat man einen Bildschirm wie diesen:

Leider ist das Programm in Englisch gehalten. Eine deutsche Version oder die Möglichkeit, die Spracheinstellungen zu ändern, habe ich nicht gefunden.

Wie funktioniert Sigil nun? Das kann man wohl am besten mit einem Beispiel zeigen. Nehmen wir mal an, dass wir Shakespeares “Alls well that ends well” ins EPUB-Format verwandeln wollen. Den Text finden wir hier: http://shakespeare.mit.edu/allswell/full.html:

Formatierung des Textes

Wenn man nun den Text dieses Textes kopiert und in Sigil einfügt hat man schon die meiste Arbeit bei der Erstellung des EBooks getan. Aber wenn man genauer hinschaut, merkt man, dass das Ergebnis nicht so, wie auf der Website aussieht:

Die Formatierung, z.B. die durch Fettdruck hervorgehobene Schrift, ist verloren gegangen. Wenn man darauf wert legt, bleiben zwei Möglichkeiten:

  1. Man benutzt die Möglichkeiten von Sigil um den Text nach eigenen Wünschen zu formatieren. Vorteil dieses Verfahrens ist, dass man genau das Ergebnis bekommt, welches man will. Wenn z.B. im ursprünglichen Text manche Stellen in fetter Schrift dargestellt wurden, man selbst diese Stellen aber auch noch unterstreichen möchte, so kann man es mit Sigil den eigenen Vorlieben entsprechend gestalten. Nachteil dieses Verfahrens ist, dass es arbeits- und zeitaufwändig ist.
  2. Man importiert den HTML-Text der ursprünglichen Seite und somit alle Formatierungen. Vorteil dieser Möglichkeit ist, dass es schnell geht. Nachteil ist, dass man ein wenig mit HTML vertraut sein sollte. Das ist vielleicht ein wenig abschreckend, aber andererseits ist HTML nun auch nicht so furchtbar kompliziert, wie man vielleicht denken könnte.

Ich werde auf beide Verfahren eingehen.

Den Text mit Sigil formatieren

Sigil ist ein WYSIWYG-Editor. Jeder, der eine Textverarbeitungssoftware benutzen kann, kann also mit Sigil umgehen.

Nehmen wir mal an, dass wir die Kapitelüberschriften als solche kennzeichnen wollen. In unserem Beispiel sind es Überschriften wie “Act 1″. Der entsprechende Text wird mit der Maus markiert. Links oben finden wir ein Menü, dass mit “Normal” beschriftet ist. Wenn man es aufklappt, findet man hier eine Liste von “Headings”, also Überschriften. Also wählen wir “Heading 1″ und schon ist unsere Überschrift eine Überschrift:

Als nächstes wollen wir die einzelnen Rollen des Dramas kennzeichnen und sie mit fetter Schrift hervorheben. Also markieren wir den entsprechenden Text und klicken auf das Icon für Fettschrift …

… und schon wird der Text unseren Wünschen entsprechend dargestellt:

Das Verfahren ist also einfach und bequem, aber man merkt dann doch bald, dass man wenn man das ganze Drama so durcharbeiten möchte, viel Zeit mitbringen sollte. Bei einem einfachen Roman mit ein paar Kapitelüberschriften kann man es sich geben, aber in einem Fall wie das Beispiel, muss man doch mit Aufwand rechnen. Deshalb ist die zweite Möglichkeit, den HTML-Text des Originals weiter zu nutzen doch eine schnellere.

Bevor ich aber dazu komme, nur noch eine kurze Zwischenbemerkung darüber, warum man Überschriften als Überschriften kennzeichnen sollte. Anfänger in der Textverarbeitung (und deshalb auch in Programmen wie Sigil) benutzen oft einfach Fett, Kursiv und Unterstrich um Überschriften zu formatieren. Das kommt vielleicht noch aus der Zeit, wo man mit einer Schreibmaschine Texte verfasste und die einzige Möglichkeit Überschriften hervorzuheben war, diese entweder in Großbuchstaben oder mit Unterstrich oder beides zu formatieren. Das war “in der guten alten Zeit” in Ordnung, aber in Sigil und auch in der Textverarbeitung sollte man anders vorgehen. So wollen wir z.B. später ein Inhaltsverzeichnis aus allen Überschriften erstellen, aber wie soll das Programm sowas können, wenn es nicht weiß, was Überschrift ist und was normaler Text? Die einzige Art, dem Programm dies zu sagen ist, die Überschriften als Überschriften zu kennzeichnen.

Das urspüngliche HTML verwenden

Genau genommen sollte man von XML und nicht von HTML sprechen, denn EPUB ist ein XML-Format. Aber es würde den Rahmen dieses Artikel sprengen auf diese Unterschiede einzugehen. Es genügt zu wissen, dass man HTML in XML einfügen kann.

Als erstes muss man von der WYSIWYG-Anzeige in die “Code”-Anzeige wechseln. Der entsprechende Button findet sich in der Mitte oben:

Sigil erzeugt automatisch den entsprechenden XML-Code. Da muss nun das HTML eingefügt werden. Wie kommt man an das HTML? Man geht zurück zum Browser, wo man sich den Text ursprünglich geholt hat und öffnet die Webseite im HTML-Format. Beim Firefox und Google Chrome benutzt man STRG-U. Die Webseite wird dann wie folgt dargestellt:

Am einfachsten ist es, wenn man in Sigil den Abschnitt, der mit <html > anfängt und mit </html> aufhört markiert und löscht.

Dann markiert man in der Quelltextanzeige des Browsers alles von <html …> bis “</html>”, kopiert es und fügt es in Sigil ein:

In unserem Beispiel gibt Sigil eine Fehlermeldung heraus:

Es ist bei solchen Fehlermeldungen, wo etwas technisches Verständnis in HTML und XML hilft, das Problem zu beheben. Kurz gesagt: HTML lässt eine gewisse Laxheit in der Kodierung zu. Da wir aber das HTML in eine XML-Datei einfügen wollen und XML diese Laxheit nicht erträgt, kommt es zu Fehlermeldungen. Als XML/HTML-Kennerin würde ich den Fehler manuell beheben, Nicht-Kenner können es erstmal mit “Fix automatically” versuchen und schauen, ob es tatsächlich zu größeren Problemen in der Darstellung kommt.

In diesem Fall wird auf ein Stylesheet verwiesen (später im Artikel ein paar Worte dazu), auf das Sigil sowieso nicht zugreifen kann. Darum entferne ich den LINK-Tag einfach. Aber dies ist eine Lösung für das spezifische Problem und keine allgemeingültige. Der HTML-Code sieht nun so aus:

In diesem spezifischen Fall kommen noch weitere Fehlermeldungen wie die obige vor. Man kann nun auf die Programmierer der Website schimpfen, die kein valides HTML erzeugt haben und die Fehler manuell oder automatisch bereinigen. Wenn alles in Ordnung ist, kann man wieder in die WYSIWYG-Anzeige wechseln:

Man stellt fest, dass der Text nun wie auf der Website dargestellt wird. Vielleicht gefällt einem nicht der hellblaue Kasten ganz oben. Den entfernt man einfach durch Markieren und Löschen.

Stylesheets

Nicht HTML/XML-Kenner können diesen Abschnitt überspringen. Ich möchte nur darauf hinweisen, dass man die von Sigil vorgegebene Formatierung selbstverständlich ändern kann. Wenn man z.B. Überschriften nicht in schwarzen, sondern pinken Text darstellen möchte, kann man es tun. Dazu muss man ein CSS-Stylesheet erzeugen, in den Sigil-Ordner namens “Styles” legen und dieses Stylesheet dann entsprechend verknüpfen. Es würde den Rahmen dieses Artikels sprengen darauf detaillierter einzugehen. Ich möchte nur auf die Möglichkeit hinweisen, die ich persönlich bis jetzt noch nicht genutzt habe, da mir das von Sigil vorgegebene Format gefällt oder zumindest ausreicht.

Wenn man bis hier gekommen ist, hat man bereits ein brauchbares Ebook. Das kann man nun mit “Save” abspeichern, in seinen EBook-Reader hochladen und lesen.

Empfehlen/Bookmark

  One Response to “Sigil – EBooks im EPUB-Format erstellen”

  1. Ergänzender Artikel:

    Guide to format and convert your book

 Leave a Reply

(required)

(required)

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>