zu deinem o.g. Blog-Eintrag: Ja, ich bin ein Freund von Hierarchien!
Nicht, dass ich gerne dem Obrigkeitsdenken nachhänge, aber in vielen
Fällen von datenbankgestützten Webanwendungen halte ich eine
hierariche Strukturierung der Inhalte nach wie vor für ein nützliches
Instrument.
Vor allem halte ich das Argument der "Gegner", sich jeweils auf eine
Schublade festlegen zu müssen, für überholt. Das Argument stammt aus
einer Zeit, als für den Zugriff auf Daten kaum mehr als eine
Verzeichnis-Ordnung eines Betriebssystems zur Verfügung stand. In
relationalen DBs lassen sich dagegen einfach n-zu-n-Beziehungen
zwischen Hierarchie-Elementen und Inhalten herstellen.
Damit kann sowohl Inhalt A gleichzeitig an den Positionen 4 und 7, als
auch Position 4 die Inhalte A und B enthalten.
Aber die großen WEB2.0-Anwendungen kommen doch auch ohne aus, könnte
man meinen. Beispiel Wikipedia: Jeder Artikel liegt (abgesehen von ein
paar Ausnahmen) schön flach erreichbar im Netz. Dennoch scheint man
auf hierarchische Strukturen nicht verzichten zu wollen, bastelt
Portalseiten und entwickelt Werkzeuge zur Strukturierung, um den
Nutzer den Anschein einer wohlstrukturierten Ansammlung von Inhalten
zu geben.
Doch worin besteht generell der Unterschied zwischen der Vergabe von
Labels und der Verwendung einer hierarchischen Struktur?
Die Hierarchie ist eine eigenständige Einheit, die auch ohne Inhalte
existieren kann. Labels dagegen "kleben" nur an den Inhalten und
können ohne sie nicht leben. Darüber hinaus hat ein Label keine
Beziehung zu einem anderen Label. Und Labels kann ich vergeben, wie
ich möchte, ohne mir Gedanken über bereits vergebene Labels zu machen.
Heute schreibe ich ihn so, morgen vielleicht anders, obwohl ich die
gleiche Zuordnung meine.
Nicht zu vergessen, dass ein Name einer Hirarchie-Position einmal, ein
gleichlautendes Label jedoch vielfach gespeichert werden muss, was die
Redundanz erhöht.
Alles Nachteile, die es bei einer hierarchischen Ordnung nicht gibt.
Stattdessen setze ich lieber zusätzlich eine (ggf. indexierte)
Volltextsuche ein und wer suchet, der wird finden :-)
Ciao Horst
Hierarchien halte ich bei vielen Inhalten für sinnvoll
("unverzichtbar"), z.B. für Tutorials. Tags und Hierarchien sind keine
Entweder-Oder-Entscheidung. Mein Site ist hierarchisch strukturiert
(alleine, da seit 01/1997 im Web, wo "Tags" nicht existierten). Ende
letzten Jahres führte ich Tags ein und sie ergänzen die hierarchische
Struktur gut. So gibt es eine Menge weiterer *relevanter*
Informationen, die interessant sind im Zusammenhang mit einem Artikel,
die aber hierarchisch anders eingeordnet sind. Dass sie gerne benutzt
werden, weiß ich, da ich die Tags loggen und auswerten lasse (Antwort
auf: Was interessiert die meisten?).
Durch die Tag-Clouds, die ich gleichzeitig mit den Tags programmierte,
ergeben sich interessante Beziehungen, auf die ich vorher nicht
unbedingt komme, weshalb ich die Clouds am Ende der Tagseiten anzeigen
lasse.
Eines ist richtig: Ein Tag kann leicht ausgelassen werden oder für das
Gleiche können unterschiedliche Tags vergeben werden, alleine ein
falsches Zeichen, ein Synonym oder eine andere Form verhindern, dass
Gleichartiges gefunden wird. Ich habe deshalb ein Java-Applet
programmiert, das auf die Tag-Datenbank zugreift und bei Eingabe auch
von Teilzeichenketten alle existierenden Tags mit der Teilzeichenkette
anzeigt (und bei Auswahl eines Tags den Tag-URL in die Zwischenablage
kopiert).
Ich denke, Tags (bzw. deren Vorgänger? wie Kategorien) wurden eher aus
der Not geboren, Seiten ohne hierarchische Struktur nachträglich zu
strukturieren, im Speziellen informative Blogs, die sonst nur
chronologisch absteigend sortiert wären.
Fazit: Will ich einen Wissensinhalt schnell finden, ist die Hierarchie
ideal, nicht nur zum Erforschen des Inhalts - ähnlich wie bei einem
Buch kann ich später gelesenes schnell finden. Tags sind zusätzlich
eine sinnvolle Ergänzung. Nicht für jeden Inhalt ist eine
hierarchische Struktur notwendig, für Blogs, die nur
Erlebnistagebücher sind, dürfte die chronologische Ordung die beste
sein.
Grüße
Elmar
> zu deinem o.g. Blog-Eintrag: Ja, ich bin ein Freund von Hierarchien!
Ich denke, das ist nichts Ungewöhnliches. Ich finde meine Dateien im
Dateisystem fast immer gleich wieder, weil ich ein Bild der
Verzeichnisstruktur habe und weiß, was wohin gehört. D.h., ich brauche
nicht erst danach zu suchen. Meinetwegen, ich suche die
Mikroformate.odt. Ich begebe mich dazu einfach in meinen immer offenen
Total Commander, und mit wenigen Tastaturanschlägen bin ich am Ziel.
Und ich bilde mir ein, dabei schnell zu sein. Nun aber angenommen, ich
habe Google Desktop installiert, also dieses "Google für daheim", und
gebe in einem immer verfügbaren kleinen Suchfeld für Google-Desktop-
Suchen einfach den Namen der gewünschten Datei ein. Plopp, wird sie
mir sofort im Browser als Link zum Anklicken angeboten, inklusive
Inhaltsvorschau. Und mit ihr auch alle anderen Varianten der Datei,
von deren Existenz ich zum Teil ehrlich gesagt doch gar nichts mehr
wusste.
Kann man also durchaus dran Geschmack finden, an dieser Art, Inhalte
wiederzufinden. Das Problem ist nur, dass man dabei dazu erzogen wird,
dass es einem piepegal ist, wohin man was überhaupt ablegt. Man
verlässt sich enfach drauf, dass die Suche es gleich wiederfindet.
Ideal ist das wahrscheinlich für Leute wie meine Mutter, die immer
noch große Probleme hat, sich im Dateisystem zurechtzufinden. Wer
dagegen gewohnt ist, beim Speichern von Daten bewusst und präzise
vorzugehen, wird sein durchdachtes Ablagesystem kaum aufgeben wollen.
> Vor allem halte ich das Argument der "Gegner", sich jeweils auf eine
> Schublade festlegen zu müssen, für überholt. Das Argument stammt aus
> einer Zeit, als für den Zugriff auf Daten kaum mehr als eine
> Verzeichnis-Ordnung eines Betriebssystems zur Verfügung stand. In
> relationalen DBs lassen sich dagegen einfach n-zu-n-Beziehungen
> zwischen Hierarchie-Elementen und Inhalten herstellen.
> Damit kann sowohl Inhalt A gleichzeitig an den Positionen 4 und 7, als
> auch Position 4 die Inhalte A und B enthalten.
Naja, relationale Datenbanken sind Gitternetze und damit noch mal was
anderes als Daten, die in Form einer Baumstruktur abgelegt sind.
Normalerweise sind Baumstrukturen tatsächlich so, dass ein Inhalt
darin einen festen Ort hat. Dank Mechanismen wie symbolischer Links
ist es aber möglich, einen Dateneintrag auch an mehreren sinnvollen
Stellen innerhalb einer Baumstruktur erscheinen zu lassen, was den
Zugriff durchaus beschleunigen kann.
> Aber die großen WEB2.0-Anwendungen kommen doch auch ohne aus, könnte
> man meinen. Beispiel Wikipedia: Jeder Artikel liegt (abgesehen von ein
> paar Ausnahmen) schön flach erreichbar im Netz. Dennoch scheint man
> auf hierarchische Strukturen nicht verzichten zu wollen, bastelt
> Portalseiten und entwickelt Werkzeuge zur Strukturierung, um den
> Nutzer den Anschein einer wohlstrukturierten Ansammlung von Inhalten
> zu geben.
Die Flachheit ist allerdings kein genuines Problem von Wikis. HTML und
seine Hyperlinks selbst bieten ja auch nichts anderes, als von A nach
B zu verlinken. Da gibt es nirgends Hierarchien. Dass Webangebote
häufig hierarchisch strukturiert wirken, ist eigentlich allein eine
Frage des Webdesigns. Dass Webangebote in aller Regel eine solche
Hierarchie "simulieren", hat allerdings einen guten Grund: eben weil
die meisten Menschen gut mit Schubladen umgehen können und sich
dadurch leichter merken können, was wo zu finden ist.
> Die Hierarchie ist eine eigenständige Einheit, die auch ohne Inhalte
> existieren kann. Labels dagegen "kleben" nur an den Inhalten und
> können ohne sie nicht leben. Darüber hinaus hat ein Label keine
> Beziehung zu einem anderen Label. Und Labels kann ich vergeben, wie
> ich möchte, ohne mir Gedanken über bereits vergebene Labels zu machen.
Wenn man ein Label hier und da vergeben hat und löscht dann alle
Daten, denen dieses Label zugeordnet ist, verbleibt dieses bei den
meisten label-orientierten Anwendungen durchaus weiter im Datenbestand
und ist so ein ähnlicher Zombie wie ein Verzeichnis ohne Dateien. Was
aber in jedem Fall stimmt, ist, dass ein Label keine definierte
Beziehung zu anderen Labels hat, so wie man von einem Verzeichnis
sagen kann, dass es ein Unterverzeichnis von seinem Elternverzeichnis
ist. Allerdings ist lassen sich Beziehungen zwischen Labels durchaus
mittels Heuristik (http://de.wikipedia.org/wiki/Heuristik) ermitteln:
so, wie man bereits begonnen hat, aus Labels so was wie Tag-Clouds zu
basteln, könnte eine Software durch Analysieren aller Daten und ihrer
Labels eine Art Verwandtschafts-Index von Daten ermitteln. So was
also, wie das, was Google mit dem Link "ähnliche Seiten" bei
Suchtreffern anbietet. Das Problem bei all diesen Sachen ist, dass es
nicht 100%ig präzise und auch nicht unbedingt nachvollziehbar für den
Endanwender ist. Für Programmierer und Systemspezialisten also einfach
ein Graus. Doch je weiter die Datenflut anschwillt, desto gefragter
werden solche heuristischen Methoden. Mittlerweile hat ja jeder
Normalanwender eine 6stellige Anzahl Dateien auf seinem PC. Vor
zwanzig Jahren hätte das nur ein Supercomputer gepackt. Und auch der
PC-Spezialist wird von vielen der über 100.000 Dateien seines Rechners
kaum Kenntnis haben. Die unscharfe Suchlogik jenseits der festen
Schubladen kann also selbst einem solchen Experten Interessantes über
die Inhalte des Rechners liefern.
> Heute schreibe ich ihn so, morgen vielleicht anders, obwohl ich die
> gleiche Zuordnung meine.
Ja, die Problematik der Schreibweise. Ist allerdings auch
suchanwendungsseitig lösbar. Siehe Google mit "meinten Sie...?". Oder
die Sache mit den unterschiedlichen Wörtern. Heute tagge ich "Datei",
und morgen "File", heute "Ajax-Objekt", morgen "XML-HTTPRequest-
Objekt". Doch warum unterstellt man, dass beim "Taggen" alles nur
chaotisch abläuft, während beim Einordnen in Baumstrukturen alles
geordnet zugeht? Beim "Taggen" eines Blog-Eintrags etwa bietet mir die
Blog-Software onkeypress passende vorhandene Labels an. Wahlweise auch
alle vorhandenen Labels, aus denen ich aussuchen kann. Es ist also
nicht so, dass man wie im meta-keywords-Tag von HTML in jeder HTML-
Datei völlig unkontrolliert irgendwas anderes reinschreibt. Im Rahmen
einer Webanwendung ist bereits das Vergeben von Labels interaktiv so
beeinflussbar, dass bereits vorhandene Labels gerne wiederverwendet
werden.
viele Grüße
Stefan Münz
erst mal willkommen im Forum!
> Hierarchien halte ich bei vielen Inhalten für sinnvoll
> ("unverzichtbar"), z.B. für Tutorials. Tags und Hierarchien sind keine
> Entweder-Oder-Entscheidung. Mein Site ist hierarchisch strukturiert
> (alleine, da seit 01/1997 im Web, wo "Tags" nicht existierten). Ende
> letzten Jahres führte ich Tags ein und sie ergänzen die hierarchische
> Struktur gut. So gibt es eine Menge weiterer *relevanter*
> Informationen, die interessant sind im Zusammenhang mit einem Artikel,
> die aber hierarchisch anders eingeordnet sind. Dass sie gerne benutzt
> werden, weiß ich, da ich die Tags loggen und auswerten lasse (Antwort
> auf: Was interessiert die meisten?).
In jedem guten Sachbuch gibt es ein Inhaltsverzeichnis und ein
Stichwortverzeichnis - das lernen bereits die Kinder. Beide
Verzeichnistypen repräsentieren eigentlich genau das, worum es hier
geht. Ein hierarchischer Zugang, und ein Suchwort-orientierter Zugang.
In elektronisch gespeicherten Daten, die volltextdurchsuchbar sind,
kann außerdem noch ein schlichtes Suchfeld dazukommen. Und all diese
Zugangsformen haben ihre Berechtigung. Ein einigermaßen erfahrener
Sachbuchleser weiß, wann er ein Inhaltsverzeichnis und wann ein
Stichwortverzeichnis nutzen sollte. Wie du aber auch sagst, ist es
gerade die gegenseite Ergänzung der Zugangsweisen, die dem Anwender
häufig erst die echte Power bietet. Immer, wenn man den Anwender
erziehen will und sagt "vergiss A und setze voll auf B", dann kann das
nicht auf Dauer gut gehen. So hadere ich mit den schönen neuen Online-
und-Social-Bookmark-Services ernsthaft herum, weil ich da einfach die
Möglichkeit vermisse, eine Ordnerstruktur anzulegen. Stattdessen habe
ich nichts als Labels. Und beim Anlegen eines Bookmarks will ich mich
ehrlich gesagt auch nicht ewig mit taxonomisch/lexikalischen
Erwägungen auseinandersetzen. Da vermisse ich einfach was, und viele
andere wahrscheinlich auch. Irgendwann wird dann ein Anbieter damit
anfangen, das Anlegen persönlicher Ordnungsstrukturen zustätzlich zu
den Labels anzubieten, und sich dadurch wahrscheinlich einen
Wettbewerbsvorteil verschaffen. Hoffen wir zumindest, dass dem so
ist.
> Eines ist richtig: Ein Tag kann leicht ausgelassen werden oder für das
> Gleiche können unterschiedliche Tags vergeben werden, alleine ein
> falsches Zeichen, ein Synonym oder eine andere Form verhindern, dass
> Gleichartiges gefunden wird.
Das kommt wie ich schon Horst geschrieben an auf die Intelligenz der
Anwendungssoftware an. Wenn die z.B. "spielen" und "Spielen" als zwei
Labels behandelt, die nichts miteinander gemein haben, dann ist sie
einfach sehr primitiv, und es wird sicher nicht lange dauern, bis sich
was Besseres durchsetzt. Viele Anwendungen können orthografisch und
morphologisch schon einiges als zusammengehörig erkennen. Wo es
meistens noch hapert, ist auf der semantischen Ebene. Synonyme
vielleicht noch, aber spätestens bei "Bedeutungsverwandtschaft" hört
es in aller Regel auf. Außerdem müssen bei Labels noch mal andere
Maßstäbe angesetzt werden als bei einer beliebigen Volltextsuche. Denn
ein Anwender könnte ja "Spiel" und "spielen" bewusst als zwei
unterschiedliche Labels angelegt haben, die er sauber
auseinanderhalten will. Der Anwender sollte also idealerweise die
Möglichkeit haben, die "Schärfe" der Suche einzustellen, so wie das
etwa Heise anbietet.
> Ich denke, Tags (bzw. deren Vorgänger? wie Kategorien) wurden eher aus
> der Not geboren, Seiten ohne hierarchische Struktur nachträglich zu
> strukturieren, im Speziellen informative Blogs, die sonst nur
> chronologisch absteigend sortiert wären.
Schon möglich, dass das so ist. Journal-artig aufgebaute Blogs sind ja
auch eine Inhaltsform, die keine sinnvollen Hierarchie-Strukturen
aufweist, außer der kalendarischen (Jahr/Monat/Tag). Um noch
irgendeinen anderen "Halt" zu bieten, sind die Tags/Labels dort höchst
sinnvoll. Dagegen finde ich es bei einem Service wie YouTube.com
schade, dass die keinen verzeichnis-artigen Einstieg bieten. Das würde
das gemütliche Stöbern stark vereinfachen. Stattdessen hofft man wohl
darauf, dass die modernen Junkies sich alles sowieso nur über
Newsfeeds präsentieren lassen, wo sie dann in den langen Listen von
Einträgen abonnierter Feeds hektisch querlesen, um irgendwo wieder mal
die geniale News zu finden ... ist vielleicht wirklich eine Frage der
Herangehensweise und letztlich eine Generationenfrage?
viele Grüße
Stefan Münz
gerade im Basic Thinking Blog zu dem Thema gefunden:
http://www.basicthinking.de/blog/2007/06/01/strategische-ueberlegungen-zur-webentwicklung/
(das englische eingerahmte Zitat)
Zuerst war das Browsing, dann das Searching, und jetzt sollen "social
graphs" das alles ersetzen. Die Rede ist dabei von Facebook:
http://de.wikipedia.org/wiki/Facebook
http://www.facebook.com/
Wobei diese Plattform allerdings so weit ich sehen kann nichts anderes
tut als all die vielen anderen neueren Social-Network-Plattformen
auch, nur eben auf eine bestimmte Zielgruppe (Studierende) fixiert.
Wenn das allerdings dahingehend gemeint ist wie "du brauchst weder
mehr zu stöbern noch zu suchen, sondern bekommst einfach das
vorgesetzt, was deine Freunde und deren Freunde toll finden", dann
möchte ich den intellektuellen Mehrwert, der damit verbunden sein
soll, doch ernsthaft in Frage stellen (Zitat: "The "social graph," or
your network of relationships, will push information to you. You'll
learn from your friends".)
Das alles sind durchaus essentielle informationstechnische
Zukunftsfragen, die weit über "Baumstruktur oder Labelkultur"
hinausgehen. Denn letztlich geht es darum, wie wir typischerweise an
Informationen gelangen, welche Informationen wir erhalten, welche
Filter unsere Meinungsbildung beeinflussen usw.
viele Grüße
Stefan Münz