Betont fett - HTML-Semantik zwischen Wichtigkeit und Wirklichkeit

Dienstag, 28 Juni 2011 14:38 MET

Thema:
Webgestaltung  
Stichworte:
, ,  
 
Maske eines Frauengesichtes, welche die Wangen betont überdimensioniert aufplustert
Betont fett - HTML-Semantik zwischen Wichtigkeit und Wirklichkeit [hyperkontext | Weblog]

Wie steht es um Wirklichkeit und Nutzen von HTML als Textauszeichnungssprache?

Gerade mal Überschriften scheinen in ihrer Bedeutung angekommen zu sein. Im Umkehrschluss lässt sich feststellen, dass bedeutungslose oder quasi regelwidrige Auszeichnungen von Screenreadern – vermutlich auch von Suchmaschinen – meist verstanden werden.

Der praktische Nutzen steht in keinem Verhältnis zum Aufwand korrekter Textauszeichnungen. Auch nach mehr als 10 Jahren (empfohlenem) Regelwerk nicht.

Betonte Wichtigkeit

Allenthalben wird seit vielen Jahren die Funktion von HTML als Text­auszeichnungs­sprache betont. Alle nicken zwar ab und die einen vertiefen sich wieder in ihren Spaghetticode, die anderen machen ein Geschäft daraus.

Andere haben mitunter von HTML als Textauszeichnungssprache und Semantik noch nie was gehört. Das betrifft zu oft nicht Neulinge, sondern nach wie vor Akteure großer Agenturen, wie manche Relaunches wiederholt aufs Neue beweisen.

Immer wieder wird in diversen Foren nach dem Unterschied zwischen b und strong gefragt, ob da überhaupt einer sei und ob das irgendeine Bedeutung hat. Die Ratschläge bewegen sich von Google ist es egal bis b wird von Google etwas besser als strong gewichtet.

Klar, unsereins schüttelt den Kopf ob vermeintlicher Unbedarftheit oder gar vermuteter Ignoranz.

Doch wie steht es nun um Wirklichkeit und Nutzen von HTML-Semantik?

Sisyphos wäre einen Vergleich wert.

Wie schon ähnlich ernüchternd für Sprach­aus­zeichnungen festgestellt: Allein die Betrachtung einfachster HTML-Elemente zur Betonung beziehungsweise Wichtigkeit einzelner Wörter oder Satzteile, lässt wiederholt Ernüchterung aufkommen.

Oder anders gesagt: Der praktische Nutzen steht in keinem Verhältnis zum Aufwand korrekter Textauszeichnungen. Auch nach mehr als 10 Jahren (empfohlenem) Regelwerk nicht.

Fette Wirklichkeit

Die Kluft zwischen Theorie und Praxis, zwischen Regelwerk und Anwendung in dem Bereich, mutet mehr wie unterschiedliche Galaxien an, die sich nur zeitverzögert über Jahrzehnte verständigen können. Die Übertragungsprogramme versuchen dem Rechnung zu tragen. Was die einen betonen, unterstreichen die anderen fett. Wenn die Botschaft zehn Jahre später ankommt, müssen wir immer noch verstehen, was die anderen damals meinten.

Alle gängigen Auswertungsprogramme (Crawler, Browser, Screenreader, et cetera) sind darauf getrimmt, aus quasi jedem Spaghettiquelltext relevante Informationen zu ziehen. Das beginnt bei der einfachen Annahme einer Betonung.

Auch wenn die Spezifikation sagt, dass für wichtigen Text (HTML5) beziehungsweise starke Betonung (HTML4) das Element strong verwendet werden sollte und Element b nur mehr zur visuellen Aufbereitung (HTML4) oder als abgesetzter Text (HTML5) dient, werten die Programme nun eben beide Elemente gleichwertig aus. Element b – in der Grundeinstellung der Browser meist visuell fett angezeigt – wird nun mal nach wie vor in der Praxis für betonten Text angewendet. Die Programme passen sich dem an.

Echt fett

Semantik hin oder her: HTML in seiner Bedeutung als Text­auszeichnungs­sprache wird praktisch nicht ausgewertet.

Gerade mal Überschriften scheinen in ihrer Bedeutung angekommen zu sein und werden von Suchmaschinen, als auch von Leseprogrammen, ausgewertet und ihr Vorhandensein als dementsprechend wichtig gewertet.

  • Es hat so gut wie keinerlei praktische Auswirkungen, ob wir strong oder b und i oder em im HTML-Quelltext notieren. 3 von 6 getesteten Screenreadern schert sich um die Elemente überhaupt nicht. Die anderen drei, bis auf JAWS, behandeln strong und b beziehungsweise i und em offenbar vollkommen gleichwertig.
  • Suchmaschinen halten sich bedeckt, was sie auswerten. Google scheint – gemäß der bereits oben verlinkten Aussage aus 2006 von Matt Cutts  – Elemente strong und b etwas höher zu gewichten als den normalen Fließtext, beide aber gleichwertig zu behandeln. Ich gehe davon aus, dass sich an der Vorgangsweise kaum was geändert hat.
  • Auch Abkürzungen (abbr) oder Zitate innerhalb von Fließtexten mit dem Element q werden gerade mal von zwei der getesteten sechs Screenreader erkannt. cite als Quellenangabe nur von einem, der wiederum q nicht kennt.
  • Wie mit anderen Textauszeichnungen (code, var, kbd, samp und einige mehr) verfahren wird, können wir nur vermuten. Meine Vermutung bewegt sich im Bereich von gar nicht bis überhaupt nicht. Auch Screenreader scheinen diese Elemente nicht zu interessieren, obwohl die Auswertung beispielsweise bei samp und kbd durchaus sinnvoll wäre.
  • Der Hälfte der Screenreader sind Definitionslisten unbekannt, zwei Drittel wertet sie nicht aus. Selbst verschachtelte Listen, egal welcher Art, werden nur von einem der Leseprogramme korrekt interpretiert.

Treppenwitz zur HTML-Semantik

Im Umkehrschluss lässt sich feststellen, dass bedeutungslose oder quasi regelwidrige Auszeichnungen von Screenreadern – vermutlich auch von Suchmaschinen – meist verstanden werden. So erkennen beispielsweise immerhin zwei Drittel der Screenreader doppelte Zeilenumbrüche im Fließtext als Absätze. Sogar nur durch CSS definierte Absätze – ich nehme an, hier sind HTML div-Elemente gemeint, die per CSS visuell zu Absätzen getrennt sind – werden immerhin von der Hälfte der getesteten Leseprogramme als abgesetzte Textstellen ausgewertet.

Die Lage würde sich natürlich rasch ändern, wenn große Player wie Google zum Beispiel ankündigen würden, künftig das Element strong höher oder markant anders als b zu gewichten. Da würden viele Quelltexte wohl sehr schnell geändert werden.

Dass die Elemente b und i in HTML5 laut Spezifikationen (WHATWG und W3C) nun wieder Bedeutung – unterschiedlich zu strong und em – erlangen, sei als Treppenwitz noch angemerkt. Die auswertenden Programme werden, wie die bisherige Erfahrung zeigt, solche Unterschiede wohl auch in 10 Jahren noch nicht verarbeiten und deutlich machen.

Henne-Ei-Henne

Es handelt sich natürlich um das berühmte Henne-Ei-Syndrom: Weil die Textauszeichnungen – wenn überhaupt – kaum richtig angewendet werden, gibt es auch keine Programme die sie auswerten. Allein die Gefahr der Missinterpretation durch falchen Einsatz ist offenbar zu groß.

Abschnitt 1 von 1

Verweise zum Thema:

Externe Verweise dieses Artikels wurden zuletzt am 28. Juni 2011 auf Relevanz geprüft.

Datum:
veröffentlicht am 28 Juni 2011, 14:38 MET.
Artikel:
Betont fett - HTML-Semantik zwischen Wichtigkeit und Wirklichkeit [hyperkontext | Weblog]
Kurz-URL:
http://hyperkontext.at/s/314
Thema:
Webgestaltung 
Stichworte:
, ,  
Kommentarfeed:
RSS 2.0

Ihre Meinung

Absätze und Umbrüche werden im Eingabefenster automatisch erkannt.
Wenn Sie mit HTML vertraut sind, dürfen Sie gerne auch folgende Elemente verwenden:

<a href=""></a> <strong></strong> <code></code> <blockquote></blockquote>.

In der Vorschau geben Sie bitte noch Ihren Namen und mögliche weitere Daten zu Ihrer Person an und es erscheint die Schaltfläche zum Speichern Ihres Kommentars.


Mögliche themenverwandte Artikel aus dem Weblog

Blättern (chronologisch)

älterer Artikel »
Mai 2011 im Kontext