Feb
29
2012
Im Bereich Veröffentlichungen habe ich zwei neue Abstracts eingestellt, die auf der LREC 2012 vorgestellt werden. Beide beschäftigen sich mit Language Engineering, das erste Paper aus Architektur-Sicht, das zweite aus Algorithmen-Sicht.
Außerdem habe ich das Paper über mein hierarchisches Fuzzy-Cluster-Verfahren verlinkt, nachdem es endlich publiziert wurde. Ich muss noch rausfinden, ob ich das Paper auf der eigenen Seite veröffentlichen darf.
Jan
27
2012
Interessant, wie viele Semantik und Logik verwechseln. Semantik = Sinn verstehen, Logik = Verknüpfungen folgen => Schlussfolgern können. So würde ich es in wenigen Worten zusammenfassen.
Beispiel:
“Frankfurt am Main” im Text erkennen und wissen, dass es diese Stadt ist: Semantik.
“Eintracht Frankfurt” im Text erkennen und auf Basis von Wissen schlussfolgern, dass diese in dieser Stadt zu Hause ist: Logik
Jan
14
2012
Und dass mir keiner sagt, man könne keine schönen hierarchischen Fuzzy-Cluster erzeugen! 

Jan
09
2012
Gravitationsbasierte Graphvisualisierungen sind theoretisch toll, praktisch aber bei einigen tausend Datenpunkten beschränkt nützlich, da ewig gerechnet werden muss
Hat jemand ne Idee, wie ich einen relativ großen Graphen (>3.000 Knoten) visualisieren kann? Treemaps möchte ich verhindern, weil die ja doch nicht jeder rafft. Außerdem sieht man in einer Treemap die Graphenstruktur nicht so gut (ist schließlich für Bäume gemacht).
Graph wäre azyklisch und gerichtet.
Jan
20
2011
Wenn ich mir überlege, was für Kritiken ich bei meinen Veröffentlichungen bekommen habe, dann stellt sich mir doch die Frage, wie solch eine Studie so eine Aufmerksamkeit erlangen kann. Da behaupten doch tatsächlich zwei Harvard-Studenten, dass Google die Suchergebnisse manipulieren würde. Ich will gar nicht auf das Ergebnis eingehen, weil ich das weder bekräftigen möchte noch es entkräftigen möchte. Es geht mir nur um die Methodik.
Die beiden “Forscher” haben neben der Sortierung der Suchergebnisse untersucht, wie oft auf die entsprechenden Links geklickt wurde. Golem schreibt dazu:
Nun wollten die Forscher wissen, ob dieses Ranking auf die Qualität der angezeigten Treffer zurückzuführen oder einer eingebauten Voreingenommenheit geschuldet ist. Dazu untersuchten sie über vier Wochen die Click-Through-Rate (CTR) zweier unterschiedlicher Quellen für Suchergebnisse von Google, Yahoo und Bing.
Und jetzt das überraschende Ergebnis: Die Benutzer klicken i.d.R. die ersten Treffer häufiger an. Wenn allerdings Google-Dienste an dieser Stelle stehen (was bei der Suche nach email, etc. der Fall ist), dann werden andere Links häufiger geklickt. Die Begründung der Forscher klinkt erstmal logisch:
Das würde den Schluss nahelegen, dass die Nutzer die weiter unten stehenden Ergebnisse bevorzugen – stark genug, um den Effekt des höheren Rankings der mit dem jeweiligen Suchmaschinenanbieter verbundenen Websites zu überwinden.
Allerdings ist die Schlussfolgerung nicht logisch. Denn dieser Effekt wird mit einer wahrscheinlichen Manipulation der Suchergebnisse begründet. Viel wahrscheinlicher ist aber vielleicht, dass Google seine eigenen Dienste über die Navigation an der oberen Seitenleiste anbietet und die Benutzer, für die Google relevanter wäre, erst gar nicht suchen. Ich bin auf der Google-Seite zumindest noch nie auf die Idee gekommen, nach den Diensten zu suchen, da sie ja schon verlinkt sind. Warum zweimal klicken, wenn es einmal geht.
Ein klassischer Fall von “fail”! Da wurde eine offensichtlich nicht objektive Maßgröße zur Überprüfung einer These herangezogen.