Archive for January, 2009

Viele bunte Bilder: Visualisierung von Daten

Saturday, January 31st, 2009

Endlich mal was richtig Sinnliches im Recherche-Blog: tolle Beispiele dafür, wie KollegInnen Daten anschaulich dargestellt haben. Die Beispiele stammen aus dem Beitrag 5 Best Data Visualization Projects of the Year des Blogs Flowing Data. Das können doch nicht nur die angelsächsischen KollegeInnen, oder? Ich würde mich sehr über Beispiele aus Deutschland freuen. Kommentare, bitte!

Ich habe aus den angeblich fünf besten noch einmal drei rausgesucht, die ich unter journalistischen Gesichtspunkten für interessant halte. Das schönste ist meiner Ansicht nach dieses hier aus der New York Times:

http://www.nytimes.com/interactive/2008/02/23/movies/20080223_REVENUE_GRAPHIC.html

Man muss sich die originale, interaktive Grafik anschauen (Klick aufs Bild), um es zu vestehen. Sehr anspruchsvoll, auch für die Leser. Ein kleines Meisterwerk.

Ebenfalls aus der NYT der Entscheidungsbaum:

Und am schönsten, aber journalistisch meiner Ansicht nach weniger interessant, weil es eher um Unterhaltung geht, sind die Beispiele aus der BBC:

Googles OR-Operator kaputt?

Wednesday, January 21st, 2009

Habe ich was verpasst? Warum funktioniert Googles boolscher Operator OR nicht mehr, oder zumindest im Moment nicht?

Wenn ich nach „albrecht ude“ suche, bekomme ich 1.730 Treffer, suche ich nach „albrecht ude“ OR „ude albrecht“, bekomme ich 1.820 Treffer - so weit, so gut.

Suche ich aber nach iRights.info, gibt’s 31.700 Treffer, bei irights.info OR irights.de aber nur 30.200. Das hat nichts mit der Unschärfe bei hohen Trefferzahlen zu tun, man kann das auch reproduzieren mit z.B.  „hermann spielkamp“ (170 Treffer) und „hermann spielkamp“OR „spielkamp hermann“ (107 Treffer).

Die URLs sehen auch nicht gerade so aus, als würden die Suchanfrage „richtig übersetzt“: http://www.google.de/search?hl=de&q=“hermann+spielkamp“OR+“spielkamp+hermann“. Was machen die Plus-Zeichen an den Stellen, an denen sie nichts zu suchen haben?

Es ändert sich auch nichts, wenn man es über die erweiterte Suche probiert, oder auch advanced search in der .com-Version, wo das Menue ja überarbeitet worden ist, um genau diese ODER-Funktion etwas einfacher verständlich zu machen.

Sehr seltsam. Hat jemand etwas darüber gehört, dass/warum da geschraubt wird?

whitehouse.gov/robots.txt – change has come

Wednesday, January 21st, 2009

Noch ist Obama keine 24 Stunden im Amt, schon wird an allen Ecken und Enden der USA etwas geändert. Mit dem Hochladen der neuen Inhalte auf www.whitehouse.gov ist auch die längste mir bekannte robots.txt Datei Geschichte, sie hatte gefühlte 89 Bildschirmseiten und ich habe sie nie abgespeichert, das google cache ist schon leer und archive.org hat Server-Problme :-( Sobald ich was habe, trage ich das hier nach.
Im MSN live Cache bin ich nun fündig geworden, deren robot war am 9.1. das letzte mal auf der Site:
http://cc.msnscache.com/cache.aspx?q=%22www+whitehouse+gov+robots+txt%22&d=75320168942549&mkt=de-DE&setlang=de-DE&w=4be343d6,5a788843

Warum die alte robots.txt überhaupt so lang war, konnte nie jemand erklären - bei Stichproben waren alle Inhalte aus den für Suchmaschinen gesperrten Seiten auch über google auffindbar.

US Airways 1549: Wie zu einem Flugzeugabsturz recherchieren?

Friday, January 16th, 2009

Ein Flugzeug stürzt in den Hudson River. Alarm in allen Nachrichtenredaktionen. Woher Informationen nehmen, die über das hinaus gehen, was Augenzeugen und Rettungskräfte zu sagen haben?

Investigative Reporters & Editors hat auf einer Webseite die Ressourcen zusammen gefasst, die in den USA dafür zur Verfügung stehen. Vorbildlich.

Willkommen in der IT-98%-Bananenrepublik!

Thursday, January 15th, 2009

Wolfgang Sander-Beuermann weist im Newsletter des SuMa e.V. und in dessen Blog auf den aktuellen Stand bei der Nutzung der Suchmaschinen hin:
die grossen Drei (Google, Yahoo, MSN) haben mit ihren Suchmaschinen zusammen 98% Marktanteil. Dazu kommt als 4-te amerikanische Firma „Ask“ mit 0,5%. In den Nischen der restlichen 1,5% tummeln sich alle anderen noch nicht insolvent gewordenen oder die wenigen Newcomer.

Als Ursache dafür nennt er:
Es ist das Ergebnis beispielloser Ignoranz in der Wissenschafts- und Förderpolitik. Anstatt in realitätsnahe Zukunftstechnologien der IT zu investieren, die von den Nutzern gebraucht werden, wurden Unsummen an Fördergeldern für abgehobene Wolkenkuckucksvisionen sinnlos verbrannt. Denn das Ganze ist eine Frage des Geldes: es ist völlig naiv, zu glauben, dass technisch gute neue Ideen ausreichen würden, um neue Maßstäbe zu setzen. Nur dann, wenn solch gute neue Ideen mit ausreichend Startkapital versorgt werden, kann etwas Konkurrenzfähiges daraus werden. Solange jedoch die Wissenschafts- und Medienpolitik weiter im Tiefschlaf vor sich hin googelt, wird sich hieran nichts ändern.

Mehmet Toprak greift das Thema auf zwei Seiten in eWeekEurope auf: Google: Der stille Skandal (S. 2).

Sander-Beuermanns Stimme hat Gewicht: Er ist Mitentwickler der ersten deutschen Metasuchmaschine metager und Vorsitzender des SuMa e.V., „Gemeinnützigen Vereins zur Förderung der Suchmaschinen-Technologie und des freien Wissenszugangs“.

Es wird Zeit, dass - wie derzeit im Finanzsektor - die „Kräfte des freien Marktes“ Thema einer politischen Diskussion werden!

Gefährlicher Softwaretipp

Sunday, January 11th, 2009

Auf handelsblatt.com gibt es die Kolumne Schiebs Softwaretipp. Der jüngste der derzeit fünf Beiträge behandelt das Vermeiden Spuren beim Surfen, also die Anonymsierung: Im Netz surfen – und anonym bleiben heißt der Text vom 08.01.2009. Diesen Text halte ich für unverantwortlich, weil grob irreführend.

(more…)

Europas digitale Bibliothek “Europeana” ist wieder online

Sunday, January 4th, 2009

Robert Gehring über Europas digitale Bibliothek “Europeana”, die wieder online ist.