Silbentrennung und bedingter Zeilenumbruch in HTML-Dokumenten

Kommentare (2)

#1 von Mathias Nater am 23. Mai 2009

Vielen Dank für die Referenz auf Hyphenator.js; es freut mich, wenn mein Skript Anwendung findet.

Ich erlaube mir, einige Gedanken anzubringen.

1.
Die Unterstützung von ­­­, kam im IE 5. Jedenfalls, wenn man die IECollection (http://finalbuilds.edskes.net/iecollection.htm) zu Rate zieht.

2.

Bei Druckausgabe können wir kontrollieren, ob die Silbentrennung korrekt ist[...]

Wenn man Hyphenator.js einsetzt, kann man statt des “soft hyphens” auch ein beliebiges anderes Trennzeichen verwenden (z.B. die Pipe “|”) und sich somit sämtliche Trennstellen anzeigen lassen und nötigenfalls korrigieren. (http://code.google.com/p/hyphenator/wiki/en_DealingWithInaccurateHyphenation)

3.

Es ist also die Frage, ob wir als Textersteller [...] selbst ein Programm einsetzen sollen, welches automatisch Silbentrennung durchführt.

Gegebenenfalls Browser werden eines Tages von Haus aus Silbentrennung unterstützen, so werden sie höchst wahrscheinlich den selben Algorithmus wie Hyphenator.js (und auch LaTeX und OpenOffice u.v.m.) verwenden. Dieser beruht auf sprachspezifischen Trennmustern, wodurch die Silbentrennung 1:1 abhängig ist von der Qualität dieser Muster.

Die Trennmuster für die deutsche Sprache werden aus diesem Grund zur Zeit von einer Gruppe (http://groups.google.de/group/trennmuster-opensource) überarbeitet.
Stand der Arbeit ist, dass wir über eine Wortliste mit 431’085 Wortformen, inklusive deren Trennungen verfügen; das sind die rund 400’000 häufigsten Wörter (bis und mit Häufigkeitsklasse 20).
Die Trennmuster werden auf Basis dieser Wortliste berechnet. Wenn nun mit diesen Trennmustern ein selteneres Wort getrennt wird, kann es in der Tat zu Fehltrennungen kommen.
Ziel der Gruppe ist, die Wortliste Schritt für Schritt zu erweitern, was aber mit sehr viel Arbeit verbunden ist (Häufigkeitsklasse 21 umfasst ca. 240’000 Wortformen, die alle auf Rechtschreibung geprüft und getrennt werden müssten).

Die verlinkte Liste lustiger Fehltrennung und irreführender Trennungen ist ausserdem etwas müssig. Erstens enthält sie Rechtschreibefehler (Kondenstreifen) und Trennungen, die völlig korrekt sind (bei ‘Bonbon-niere’ wird niemand stolpern, da der Kontext vom ersten Wortteil definiert ist.)

Es gibt aber tatsächlich Trennungen die zwar korrekt, aber schlecht sind (‘bein-halten’, ‘Urin-stinkt’). Diese werden aber mit den Trennmustern verhindert.

4.

Als Textersteller bin ich dann nicht für eventuell unverständliche oder sinnentleerte Abtrennungen verantwortlich.

Doch! Es gibt Wörter, wo kein Algorithmus in vernünftiger Zeit entscheiden kann, wie getrennt werden soll (Drucker-zeugnis/Druck-erzeugnis), weil es vom Kontext abhängt.
Hier muss der Autor dem Algorithmus unter die Arme greifen, in dem er entweder das Wort mit Bindestrich schreibt (‘Druck-erzeugnis’: Dudenempfehlung bei zweideutigen Wörtern), es entsprechend auszeichnet (bei CSS3 z.B. mit ‘hyphenate: 5 11’) oder von Hand trennt (bei Hyphenator.js gibt es zusätzlich noch eine Liste von Ausnahmen).
Die Silbentrennung liegt also absolut in der Verantwortung des Autors!

5.

Je nachdem [...] kann es (bei Hyphenator.js) mitunter zu lustigen bis unverständlichen Silbentrennungen kommen

Ja, das stimmt. Ursache siehe oben.
Ich frage mich allerdings manchmal, wie häufig diese Fehltrennungen tatsächlich sind und ob ein manuell getrennter Text tatsächlich weniger Fehler hätte.
Meiner Erfahrung nach sind Fehltrennungen höchst selten (ein ‘kritisches’ Wort muss erst einmal im Text vorkommen und dann auch noch am Zeilenende/-anfang), während man als Mensch auch gerne einmal einen Fehler macht;-)

[
Hinweis von Gerald (hyperkontext):
Diesen Text erhielt ich von Mathias per E-Mail, weil sein Kommentar nicht automatisch angenommen wurde (Textlänge). Ich habe mir erlaubt, seine Mail nun als seinen Kommentar hier einzufügen.
]


#2 von Gerald, hyperkontext am 23. Mai 2009

@Mathias:
Zuerst mal Sorry für das T zuviel in deinem Vornamen. Habe es umgehend ausgebessert.

Danke für die umfangreiche und informative Stellungnahme.

Speziell zu Punkt 4:

Die Silbentrennung liegt also absolut in der Verantwortung des Autors!

Was ich aber vor allem meinte ist, dass ich bei digitalen Texten keine Umbruchstellen voraussehen kann und die Ausgabe nicht kontrollieren kann.

Dein angeführtes Beispiel zeigt aber, dass ich da wohl zu kurz gedacht habe. Es gibt eben auch Wörter, denen ich mit durchdachter Schreibe die beabsichtigte Trennung vorgeben kann (muss).

Solch fachkundige Erweiterung des Horizontes macht das Leben ja schon wieder interessanter ;) Danke.


Externe Bezugnahmen (1)

  1. Silbentrennung in TYPO3-Eingabefeldern mit dem Entity ­ von TYPO3 @ Lisardo am 28. September 2010: […] Silbentrennung und bedingter Zeilenumbruch in HTML-Dokumenten von Hyperkontext, bei dem ich eigentlich den Hyphenator das erste mal gesehen habe.

Datum:
veröffentlicht am 20 Mai 2009, 16:28 MET
Artikel:
Silbentrennung und bedingter Zeilenumbruch in HTML-Dokumenten [hyperkontext | Weblog]
Kurz-URL:
http://hyperkontext.at/s/207
Thema:
Webgestaltung 
Stichworte:
, , ,  
Reaktionen:
Kommentare 2, Bezugnahme 1

Zum Artikel: Silbentrennung und bedingter Zeilenumbruch in HTML-Dokumenten

Dieser Eintrag kann nicht mehr kommentiert werden.

Mögliche themenverwandte Artikel aus dem Weblog

Blättern (chronologisch)

älterer Artikel »
Von Pädo- und Kasperkriminellen der Leyen