previous next Up Title Contents Index

2.3 Einführung in das HTML-Publishing


HTML-Publishing ist ein neu entstehendes Arbeitsfeld, bei dem es darum geht, Informationen im weltweiten Internet oder im firmeninternen Intranet zugänglich zu machen. Im HTML-Publishing arbeiten vor allem Quereinsteiger aus verwandten Bereichen: Es gibt noch keine geregelte Ausbildung. In manchen Büchern zur Berufswahl werden aber schon neue Berufsbilder aus diesem Bereich aufgeführt. So stellt der Job Guide Multimedia aus dem Jahr 1997 das Berufsbild des Webmasters vor:

Der Webmaster ist verantwortlich für das reibungslose Funktionieren von Web-Sites. Zu seinen Aufgaben gehört das Erstellen und Editieren von Seiten im Internet. Ferner kümmert sich der Webmaster um die Aktualisierung von Web-Sites und die optimale Verknüpfung der einzelnen Seiten über Links, um dem Benutzer eine möglichst reibungslose und funktionale Navigation zu ermöglichen. An der Schnittstelle zwischen den Inhalten und der Programmierung muß er sich auch mit Problemen der Aufbereitung und technischen Umsetzung von Internet-Anwendungen beschäftigen (Kösters 1997, S. 39).


Man spricht deshalb von "HTML-Publishing", weil für Veröffentlichungen im Internet die Seitenbeschreibungssprache HTML verwendet werden muß. "Seitenbeschreibung" heißt in diesem Zusammenhang, daß Textstellen mit sogenannten "Tags" umgeben werden, die Angaben zu diesen Textstellen enthalten. Ein Textausschnitt sieht dann z. B. folgendermaßen aus:

<h1> Der Quantencomputer </h1>
Der Quantencomputer ist ein Computer, der <strong>nicht</strong> binär arbeitet...



Der Anfang der Überschrift (engl. Heading) wird durch den Tag <h1> signalisiert, das Ende durch den Tag </h1>. Das Wort "nicht" wird durch die Tags <strong> und </strong> als besonders hervorgehoben gekennzeichnet. Der Browser wertet die Tags aus und formatiert die zugehörigen Textstellen entsprechend. Überschriften werden größer dargestellt, Hervorhebungen werden durch Fettdruck, rote Farbe oder auch - bei einem akustisch unterstützten Browser - durch eine Erhöhung der Lautstärke zum Ausdruck gebracht.
HTML-Dokumente unterscheiden sich in drei Punkten von Dokumenten, die mit einem Textverarbeitungsprogramm wie Word erstellt werden:

Word-Datei im Texteditor

Abbildung 2.2.6-1: Word-Datei im Texteditor


HTML-Datei im Texteditor

Abbildung 2.2.6-2: HTML-Datei im Texteditor


Am Anfang war die Erstellung von HTML-Dokumenten noch sehr mühsam, da die Tags mit einem Editor in den Text eingefügt werden mußten. Dann entstanden spezielle Programme zur Erstellung von HTML-Dokumenten, mit denen ähnlich wie mit einem Textverarbeitungsprogramm gearbeitet werden konnte (WYSIWYG - What you see is what you get). Ein Beispiel hierfür ist AOLpress. Heute gibt es sogar Programme (z. B. NetObjects Fusion), mit denen nicht nur einzelne Seiten erstellt, sondern ganze Websites (alle auf einem Server angebotenen Seiten) verwaltet werden können. Der Autor legt die Struktur der Website mit Hilfe eines Baumdiagrammes fest. Das Programm erzeugt daraufhin die zugehörigen Seiten und fügt Navigationsschaltflächen und -verweise ein. Man bezeichnet dies als integriertes "Site-Management".
HTML ermöglicht lediglich die statische Darstellung von Dokumenten, die Text und Graphiken enthalten können, am Bildschirm. Damit im WWW auch dynamische Änderungen in Webseiten, das Abspielen von Audio- und Videodateien und das Ausführen von Programmen möglich sind, wurden verschiedene Ergänzungen zu HTML eingeführt:


JavaScript ist eine Programmiersprache, deren Befehle in HTML-Dateien eingebunden werden können. Sie ermöglicht es, Elemente einer Website nachträglich zu ändern, ohne daß erneut auf den Server zugegriffen werden muß. Zum Beispiel kann eine Graphik durch eine andere ersetzt werden oder ganz verschwinden, wenn der Benutzer darauf klickt (Münz URL 5).


Das Common Gateway Interface (cgi) ermöglicht es, von einer Webseite aus ein Programm [*] aufzurufen, das auf dem Server gespeichert ist und dort auch ausgeführt wird. An das Programm können Daten übergeben werden, indem sie in einer bestimmten Form an die Web-Adresse (URL) des Programmes angehängt werden. Das Programm generiert eine HTML-Seite mit seinen Ergebnissen und sendet diese an den Browser, der sie am Bildschirm anzeigt. Eine typische cgi-Anwendung ist ein Suchsystem. Diesem wird über die cgi-Schnittstelle ein Suchstichwort übergeben. Es führt die Abfrage aus, generiert eine HTML-Seite mit den Suchergebnissen und sendet sie über die cgi-Schnittstelle an den Browser (Münz URL 4).


Java ist eine vollwertige Programmiersprache, die für den Einsatz im WWW besonders geeignet ist, weil Java-Programme auf allen Plattformen laufen und weil spezielle Sicherheitsvorkehrungen gegen das Ausspionieren oder unbefugte Ändern von Daten getroffen wurden: Java-Programme, die über das WWW geladen wurden (die sogenannten "Applets"), dürfen z. B. nicht auf lokal gespeicherte Dateien zugreifen oder andere Programme starten. Man sagt, sie laufen in einer Sandbox ab. Im Unterschied zu cgi-Programmen werden Java-Applets nicht auf dem Server gestartet, sondern zum Client übertragen, dort in Maschinensprache übersetzt und anschließend ausgeführt (Münz URL 3).


Mit Hilfe von Plugins, die auf dem Client installiert werden, können Dateien in verschiedenen Formaten direkt im Browser-Fenster angezeigt werden. Es gibt z. B. Plugins für PDF-, Word- und Excel-Dateien. Besonders interessant sind Plugins für Audio- und Videodateien (Münz URL 2).



Im Zusammenhang mit HTML hört man oft auch die Abkürzungen VRML, DHTML, SGML und XML:

VRML steht für Virtual Reality Modeling Language und ist eine Ergänzung zu HTML, mit deren Hilfe dreidimensionale "Welten" am Bildschirm angezeigt werden können. Der Benutzer kann sich in diese "Welten" scheinbar hineinbewegen, indem er mit der Maus verschiedene Pfeile anklickt (Münz URL 6).


DHTML (Dynamic HTML) ist nur ein Marketing-Schlagwort der Browser-Hersteller. Es geht lediglich darum, mit Hilfe von JavaScript oder einer ähnlichen Makrosprache den Inhalt von WWW-Seiten nachträglich zu ändern, ohne erneut auf den Server zugreifen zu müssen (Münz URL 7, Kossel 1997, S. 186).


SGML bedeutet Standard Generalized Markup Language. Im Vergleich zu HTML ist SGML eine Art "übergeordnete Grammatik". Andersherum ausgedrückt ist HTML eine SGML-Anwendung. SGML stellt Syntaxregeln zur Verfügung, nach denen man sich selbst eine Auszeichnungssprache mit eigenen Tags definieren kann. Eine solche Definition einer eigenen Sprache mit eigenen Tags heißt DTD (document type definition). SGML an sich hat also keinen praktischen Nutzen; es muß immer noch eine DTD hinzukommen, die die Syntaxregeln von SGML mit "semantischem Leben" erfüllt. Eine dieser DTDs ist HTML (JOGUbits URL).


XML (eXtensible Markup Language) ist nichts anderes als ein extrem einfacher SGML-Dialekt. Die Komplexität von SGML wurde so stark reduziert, daß die XML-Spezifikation nur noch 26 (statt 600!) Seiten lang ist. Daher besteht Hoffnung, daß XML im WWW angewendet wird und daß XML-Browser programmiert werden (Bray URL, Flynn URL, Cover URL).
XML soll HTML nicht ersetzen, sondern nur ergänzen: "HTML, so zeichnet sich dabei ab, wird die Brot-und-Butter-Sprache für alle einfachen, unabhängigen Dokumente und Hypertext-Projekte sein. XML wird die Sprache für den speziellen Bedarf und für zusammenhängende Projekte werden" (Münz URL 8).

[*] Cgi-Programme sind oft in "Perl" geschrieben, aber grundsätzlich kann jede beliebige Programmier- oder Scriptsprache verwendet werden.

previous next Up Title Contents Index