Textauszeichnungen in HTML mit Texteditoren

Montag, 18 Juni 2007 04:01 MET

Thema:
Webgestaltung  
Stichworte:
,  
 
Screenshot einer Editoroberfläche
Textauszeichnungen in HTML mit Texteditoren [hyperkontext | Weblog]

Das Gesicht eines potenziellen Schreiberlings, einer Textverfasserin, erhellt sich in Sekundenschnelle, wenn im Zuge einer Website-Implementierung ein Text-Editor mit vielen Bildchen erscheint, mit dem nach Lust und Laune formatiert werden kann.

Im Sinne einer standardkonformen semantischen Dokumentenstruktur könnte das aber desaströs enden, wenn Sie nicht vorgesorgt haben.

HTML ist eine Textauszeichnungssprache

Und in diesem Sinne sollte dem auch Rechnung getragen werden.

Wenn es sich um HTML (Hypertext Markup Language)-Dokumente handelt ist es als Entwickler oder Site-Betreiber sehr klug, Redakteuren und Textverfassern nur die Optionen im Editor zur Verfügung zu stellen, die notwendig sind. Und auch hier braucht es zumeist noch eine kurzweilige Einführung in Dokumentenstruktur und logische Textauszeichnungen.

Semantik heißt in diesem Zusammenhang, die Bedeutung bestimmter Wörter oder Textteile für Programme und Ausgabegeräte kenntlich zu machen.

Hinweise auf Definitionen und Verweise

Dieser Artikel ist kein Tutorial oder neuerliche Interpretation von bestimmten Textauszeichnungen. Es gibt genügend kompetente Blogeinträge, Literatur und Diskussionen. Ich habe ein paar Verweise zu dem Thema im Quellenverzeichnis zusammengestellt.

Praktischer Sinn von Textauszeichnungen

Textauszeichnungen – nicht zu verwechseln mit Textformatierungen, welche die optische Darstellung beeinflussen und daher mit CSS (Cascading Style Sheets) umgesetzt werden – sind Hinweise für Programme und Ausgabegeräte, dass einem Wort oder einem Textabschnitt eine bestimmte Bedeutung zukommt.

Das einfachste Beispiel sind wohl die Hierarchieformen der Überschriften von <h1> bis <h6>. Dass hierbei einer Überschrift mit <h1> mehr Gewicht gegeben wird als einer Überschrift mit <h2>, erscheint logisch. Jedes Programm und Ausgabegerät kann sich an diesen Abstufungen orientieren und dementsprechende Wertigkeiten davon ableiten.

Ob <h1> nun optisch sehr groß erscheint oder <h2> größer als <h1> ist, ist Sache der Formatierung.

Im vorigen Absatz habe ich die Start-Tags der Überschriften als Code-Element <code><h1></code> dargestellt. Damit kann nun ein Programm etwas anfangen, weil es eindeutig erkennt, dass es sich hier um Codebeispiele handelt und dies anders bewerten, als wenn ich das einfach platt in den Text geschrieben hätte.

Im ersten Absatz dieses Teiles, ist das Wort Textformatierungen im Quelltext von einem <dfn> Tag-Paar umgeben, weil nachfolgend die Erklärung des Wortes stattfindet. Damit kann ein Ausgabe- oder Verarbeitungsprogramm logisch erfassen, dass der nachfolgende unmittelbare Text offenbar eine genauere Beschreibung darstellt.

In der Praxis ein Dilemma

Ein strukturiertes HTML-Dokument darf keine Lücken in der Überschriften-Hierarchie aufweisen. Beispielsweise kann ich nicht auf eine Überschrift zweiter Ordnung, eine der vierten folgen lassen. Da fehlt eine Überschrift dritter Ordnung.

In besseren Editor-Programmen kann die Benutzung von nur einem Teil der Überschriftenordnung vorgegeben werden, sagen wir mal von H2 bis H5. Leider kann ich aber nicht verhindern, dass diese Möglichkeiten dann völlig durcheinander verwendet werden. Es müsste also extra ein Skript geschrieben werden, das die Ordnung der Überschriften vor dem Speichern prüft und die Texter auf Ungereimtheiten aufmerksam macht. Und das natürlich noch sehr benutzerfreundlich.

Ich habe so ein Editor-Programm bis jetzt noch nicht gesehen. Für Hinweise wäre ich dankbar.

Wie soll ich also nicht webaffinen Benutzern erklären, dass sie bei jedem vierten Wort nachdenken sollten, ob es sich um eine Abkürzung, ein Akronym handelt und dies im Editor mit drei Extra-Mausklicks kennzeichnen sollten. Oder eingerückter Text, also das Element blockquote, nur für Zitate und wichtige Aussagen verwendet werden soll, andernfalls auf andere Art formatiert werden sollte.

Texteditoren-Programme unterstützen kaum

Die Unterstützung durch Programme in diesem Zusammenhang fällt zusätzlich noch sehr bescheiden aus. Mir bekannte Programme, die zum Beispiel die Eingabe auch von Abkürzungen und Akronymen ermöglichen, sind gerade mal XStandard und TinyMCE (siehe auch Verweise im Quellenverzeichnis).
Weiters gibt es auch noch ein Plug-In für den Windows Live-Writer.

In vielen WCMS (Web-Content Management System) ist es beispielsweise gar nicht möglich, eine Textauszeichnung in einem Überschriftenfeld unterzubringen. Auszeichnungsfunktionen bringen aber auch nur etwas, wenn sie vom Benutzer verstanden und richtig eingesetzt werden. Und das ist nun in der Praxis ein Knackpunkt.

Textverfasser sind überfordert

Wenn Sie nicht gerade ein Webstandard-Freak sind, dann werden Sie jetzt mit den Schultern zucken und nicht verstehen, wie so etwas zum Problem gemacht werden kann.

Was will der? Ich schreibe Texte. Alles andere macht das Programm.

Glauben Sie mir, ich kenne diese verschmitzten, müden Gesichtsausdrücke meines Gegenübers, wenn ich so etwas erkläre. Und ich kann es keinem Menschen verübeln, der ganz einfach nur Texte schreiben will.

Aber wo soll ich denn mit einer schnellen Begründung anfangen? Die einleuchtendste Erklärung ist für viele noch, dass Suchmaschinen damit besser zurecht kommen. Aber das ist nach zwei Tagen auch vergessen.

HTML-Lektoren – ein neues Berufsbild?

Erweiterung des Berufsbildes Lektor. Klingt ungewohnt, aber könnte im professionellen Bereich Sinn machen. Ich habe noch nichts davon gehört, aber vielleicht gibt es das ja schon?

HTML kann in diesem Zusammenhang durchaus als technische Grammatik eines Textes verstanden werden und Lektorinnen sind ja unter anderem auch für richtige Satzzeichen und Auszeichnungen zuständig.

Textauszeichnungen können manchmal ganz schön verzwickt sein

Die konsequente Anwendung anderssprachlicher Textauszeichnungen – und diese sind im Deutschen durch unzählige Anglizismen sehr viele – brauchen schon spezielleres Wissen über assistive Ausgabegeräte und Programme. Beispielsweise unterstützen viele Screenreader gängige fremdsprachliche Wörter ohne spezielle Sprachauszeichnung und lesen sie richtig vor. Dies erhöht die Ausgabegeschwindigkeit vieler Programme, da ständiger Sprachwechsel Rechenleistung erfordert. Hierzu gibt es unzählige Diskussionen und keine eindeutigen Richtlinien.

Eine weitere uneindeutige Handhabung besteht mit Auszeichnungen als Abkürzung oder Akronym. Erschwert wird die Diskussion über Handhabung dieser Auszeichnungen noch zusätzlich durch die – laut letztem Arbeitsentwurf der jeweiligen Arbeitsgruppen – beabsichtigte Streichung des Akronym-Elementes in HTML 5 bzw. XHTML 2. Weiters ist die Kombination mit Sprachen zu diesen Auszeichnungen oft nicht leicht zu bewerkstelligen.

Es braucht sowohl gut unterstützende Texteditoren-Programme, als auch Menschen, die hierzu spezielleres Wissen haben – HTML-Lektoren.

Beispielsweise wird die Abkürzung HTML im Deutschen auch in Deutsch buchstabiert, die ausgeschriebene Bedeutung im Titel-Attribut aber in Englisch gesprochen. Korrekt müsste die Auszeichnung in einem deutschsprachigen Dokument also so aussehen: <abbr lang="en" title="Hypertext Markup Language"><span lang="de">HTML</span></abbr> . Dem Abkürzungs-Element wird also der Sprachwechsel auf Englisch angezeigt und das Titel-Attribut wird in Englisch vorgelesen. Weil aber die Abkürzung selbst in Deutsch gelesen wird, müsste ich also dann zur Aussprache der Abkürzung selbst, wieder zur deutschen Sprache wechseln. Hierzu gibt es natürlich ziemlich viel Grenzfälle.
Dass Ausgabegeräte wie der IE6 das Element <abbr> überhaupt nicht kennt, lasse ich mal dahingestellt.

Korrekte Textauszeichnung ist Investition in die Zukunft

In Zukunft sind so gut wie alle Texte digital gespeichert und in jedem erdenklichen Zusammenhang und möglicher Form abrufbar. Texte werden von Programmen verarbeitet, sortiert und in semantische Zusammenhänge gebracht. Konsequente logische Textauszeichnungen sind in Summe ein Beitrag zur Effizienz und Zukunftstauglichkeit.

Ein Beispiel:

Da in einigen Sprachen das Wort UNO eine ganz andere Bedeutung hat als die gleichnamige Abkürzung UNO (United Nations Organization), kann ein Programm diesen Unterschied exakt nur durch die Kennzeichnung als Abkürzung im Kontext erfassen.

Wir können uns ausmalen, wie viele weitere solch typischer Beispiele ich hier aufzählen könnte.

Konkreter Nutzen von Textauszeichnungen in HTML

  • Die Erfassung von Texten wird für alle Ausgabegeräte und Programme genauer und logischer.
  • Übersetzungsprogramme können zum Beispiel in deutschsprachigen Dokumenten erkennen, dass es sich bei einem bestimmten Wort um eine andere Sprache handelt. Kurioserweise oft sogar um die Sprache, in die sie übersetzen sollten.
  • Suchmaschinen und andere Programme können in Texten Struktur erkennen, Abkürzungen, Definitionen, sprachliche Unterschiede und semantische Zusammenhänge deuten und mit anderen Texten im Kontext eine Bedeutung geben, die sonst nie möglich wäre.
  • Bei Umstellungen auf andere Software-Systeme in Organisationen oder Unternehmen ist der Im- und Export von Dokumenten dann qualitativ wesentlich besser, da die Semantik und logische Struktur auch für Programme verständlich wird.
  • Wir sind in Zukunft auf die digitale Verarbeitungsqualität von Texten immer mehr angewiesen. Immer mehr Programme werden in der Lage sein, logische Textauszeichnungen zu erfassen, für ihre Zwecke einzuordnen und an anderer Stelle aus- bzw. weiterzugeben.
  • Es werden immer mehr Formate entstehen (siehe z.B. Mikroformate), die noch mehr Möglichkeiten geben Texte für Programme logisch erfassbar zu machen. Digitale Texte ohne jegliche Textauszeichnungen werden über kurz oder lang in der digitalen Verwahrlosung verschwinden oder enorm viel menschlichen Arbeitsaufwand erfordern, um sie brauchbar zu machen.

Daher ist es nicht übertrieben zu sagen, dass wir in Summe unrechenbaren Aufwand an Energie, Arbeitsstunden und Hirnschmalz einsparen und Effizienz steigern (würden), wenn wir heute schon konsequent solch banale Dinge berücksichtigen.

Und auch Menschen die assistive Ausgabegeräte benutzen hätten mit derartiger Auszeichnungs-Disziplin schon heute ihre helle Freude. Ich habe allerdings massive Zweifel ob der Erfüllung meiner Wünsche und hoffe nur, dass Texteditoren-Programme in naher Zukunft zumindest mehr Unterstützung für Textauszeichnungen bieten.

Abschnitt 1 von 1

Quellenverzeichnis

  1. Elemente zur Textstrukturierung (SELFHTML)
  2. Absätze, Zeilen und Phrasen (W3C Recommendation)
  3. Evaluation of WYSIWYG editors (2007)
  4. Von Abkürzungen und Kurzwörtern (Windows Live-Writer Blog)
  5. (X)HTML 5 und XHTML 2 im Vergleich (Revidierte Übersetzung von Jens Meiert)

Weitere Links zum Thema

Externe Verweise dieses Artikels wurden zuletzt am 13. September 2008 auf Relevanz geprüft.

Datum:
veröffentlicht am 18 Juni 2007, 04:01 MET.
Artikel:
Textauszeichnungen in HTML mit Texteditoren [hyperkontext | Weblog]
Kurz-URL:
http://hyperkontext.at/s/63
Thema:
Webgestaltung 
Stichworte:
,  

Interne Bezugnahme von neueren Artikeln

  1. HTML-Textauszeichnungen ABBR und ACRONYM vom 25. Juni 2007
  2. Text mit HTML Bedeutung geben vom 14. September 2008
  3. Silbentrennung und bedingter Zeilenumbruch in HTML-Dokumenten vom 20. Mai 2009
  4. Nur Screenreader verarbeiten Sprachauszeichnung in HTML vom 23. Juli 2010
Dieser Eintrag kann nicht mehr kommentiert werden.

Mögliche themenverwandte Artikel aus dem Weblog

Blättern (chronologisch)

älterer Artikel »
Underscore-Hack für IE kleiner 7 auch für den IE7