Graphische Sitemap von www.heimetli.ch
Beim herumspielen mit Gephi, einem Programm zur Analyse von Netzwerken, kam ich auf die Idee, die Sitemap von www.heimetli.ch als Netzwerkdiagramm darzustellen.
Das Resultat ist hier zu sehen:
Gephi
Wie schon gesagt, ist Gephi ein Programm zur Analyse von Netzwerken. Es kann alle möglichen Parameter eines Graphen bestimmen und ihn nach verschiedenen Verfahren darstellen.
Das Bild oben zeigt ein Diagramm das mit dem "Force Atlas" Algorithmus erzeugt wurde. Wenn die resultierende Darstellung nicht überzeugt, kann man die Knoten auch manuell verschieben, wobei sich die Verbindungslinien automatisch anpassen.
Die Grösse und Farbe der Knoten kann man mit den Parametern des Netzwerks bestimmen oder gezielt einstellen.
Einen guten Einstieg in Gephi geben die Videos von jengolbeck auf Youtube.
Die Daten
Die Bereitstellung der Daten dauerte viel länger als die Darstellung.
Um die Links in den Seiten zu finden, habe ich lynx genutzt. Das tönt schlimmer als es ist, denn mit dem Kommando lynx -listonly -dump http://..... werden alle Links auf der Seite ausgegeben.
Ein Shell-Script hat die ausgegebenen Links gleich wieder an lynx verfüttert, so dass bald einmal alle Links in den Seiten identifiziert waren. Externe Links wurden nicht verfolgt, nur die internen.
Ein zweiter Pass war nötig um die Seiten (Knoten) durch Kanten zu verbinden.
Aus diesen Rohdaten wurde ein .gexf-File erstellt, genau nach der Anleitung auf der Gephi-Seite. Beim Einlesen dieses Files hat sich Gephi dann beschwert dass dieses Fileformat "abgekündigt" sei. Auf der ganzen Webseite von Gephi ist davon nichts zu lesen...
Das Programm ist zwar nie abgestürzt, aber ab und zu reagierte es nicht unbedingt wie erwartet. Es ist wohl ratsam, die aktuelle Darstellung häufiger zu speichern als bei anderen Programmen üblich.
Die Rohdaten können Sie mit dem folgenden Link herunterladen: heimetli.gexf.
SVG-Export
Der Export klappte problemlos, nur schien mir das File sehr gross.
Aus diesem Grunde habe ich es durch www.svgminify.com geschickt. Das hat das File schon mal auf 54% geschrumpft.
Mit einem Editor habe ich daraufhin noch alle class-Attribute aus dem File gelöscht, was die Grösse um ein paar Kilobytes reduzierte. Alle Newlines aus dem File zu putzen gab ihm dann den letzten Schliff.
Im nächsten Post werden die gleichen Daten interaktiv mit D3.js dargestellt.