Konsolentipps #003: GoogleNgram-Dateien runterladen

Bei Commandlinefu habe ich einen Befehl entdeckt, wie man die Daten des wirklich interessanten Tool GoogleNgram runterladen kann.
Möchte man nicht gleich alle, sondern nur die in einer bestimmten Sprache, auf den heimischen Rechner ziehen möchte hilft folgender Befehl:
wget -qO - http://ngrams.googlelabs.com/datasets | grep -E href='(.+ger …
more ...

Jahresrückblick 2010 - was die Suche sagt

Die Zeit der Jahresrückblicke ist im vollen Gange. Überall tauchen im Fernsehen Laberbacken Talkmaster auf und Redaktionen verpacken alles was in diesem Jahre passiert ist neu in kleinen Filmchen, damit diese ausgiebig bequatscht werden.

Je nach Sendezeit und Sender ist es ein gewaltiger Qualitätssprung nach oben in langweilige Sinnlosigkeit. Interessanter …

more ...

Piwik Login geht nicht

image0Letztens kam ich nicht mehr auf meine Piwikinstallation. Nach Eingabe des Passworts kam nur folgende Nachricht in einem roten Kasten:

Fehler: Der Sicherheitsschlüssel des Formulars ist ungültig oder abgelaufen. Bitte aktualisieren Sie das Formular und überprüfen Sie, dass Cookies aktiviert sind.

Oder bei einer englischen Installation wäre es :

Form security …
more ...

Blogstatistik wieder umgestellt

Ich hatte vor einiger Zeit berichtet, dass ich pagelogger als Statistiktool einsetze und wie man die Boterkennung verbessert. Nun habe ich das System wieder gewechselt und mich für die freie GoogleAnalytics-Alternative Piwik entschieden. pagelogger war etwas dürftig in der Ausstattung und wird nicht aktiv weiterentwickelt (zumindest tut sich nix). Bei …

more ...

pageLogger Boterkennung verbessern

Ich habe schon über die Statistiksoftware pageLogger berichtet und bin auch bisher damit zufrieden. Allerdings stellte ich fest, dass die Bot-Erkennungsliste etwas mager ist.

Im Verzeichnis PAGELOGGER/includes/robots liegt die Datei robots.txt. Sie ist gefüllt mit RegEx - also kleinen Textschnipseln die in einem User Agent auftauchen können - und …

more ...