Liomans Blog - PageLoggerhttps://lioman.de/42 ist die Antwort – aber wie lautet die Frage?Tue, 30 Nov 2010 17:40:00 +0100Blogstatistik wieder umgestellthttps://lioman.de/2010/11/blogstatistik-wieder-umgestellt/<p>Ich hatte vor einiger Zeit berichtet, dass ich pagelogger als Statistiktool einsetze und wie man die Boterkennung verbessert. Nun habe ich das System wieder gewechselt und mich für die freie GoogleAnalytics-Alternative Piwik entschieden. pagelogger war etwas dürftig in der Ausstattung und wird nicht aktiv weiterentwickelt (zumindest tut sich nix). Bei Piwik habe ich zudem die Möglichkeit leicht alle Ips zu anonymisieren. Ich speichere also keine Personenbezogene Daten - außer wenn ein Kommentar veröffentlicht wird. Die Daten werden aber nicht&nbsp;weitergegeben.</p> LiomanTue, 30 Nov 2010 17:40:00 +0100tag:lioman.de,2010-11-30:/2010/11/blogstatistik-wieder-umgestellt/AllgemeinBlogPageLoggerPiwikStatistikpageLogger Boterkennung verbessernhttps://lioman.de/2009/11/pagelogger-boterkennung-verbessern/<p><strong>Ich habe schon über die Statistiksoftware pageLogger berichtet und bin auch bisher damit zufrieden. Allerdings stellte ich fest, dass die Bot-Erkennungsliste etwas mager&nbsp;ist.</strong></p> <p>Im Verzeichnis <span class="caps">PAGELOGGER</span>/includes/robots liegt die Datei robots.txt. Sie ist gefüllt mit RegEx - also kleinen Textschnipseln die in einem <a class="reference external" href="http://de.wikipedia.org/wiki/User%20Agent">User Agent</a> auftauchen können - und einer Erklärung die dann im Frontend&nbsp;auftaucht.</p> <p>Bsp:</p> <pre class="literal-block"> gaisbot/#Gaisbot geckobot#GeckoBot gencrawler#GenDoor gigabaz/#GigaBaz gigabot#GigaBot googlebot#Googlebot griffon#navi.ocn.ne.jp </pre> <p>Doch 271 Bots sind etwas wenig sind doch mehrere Tausende inzwischen bekannt. Es sind zwar nicht alle wichtig und einige kommen sicher sehr selten auf einem kleinen Blog vorbei. trotzdem ist es sinnvoll die Liste ein wenig zu&nbsp;erweitern.</p> <p>Ich habe mir verschiedene Listen im Netz angeschaut und sie dann mit ein paar Konsolenbefehlen zusammengefügt. Dann noch eine kleine Reinigung der Liste von Hand und nun werden ganze 871 <a class="reference external" href="http://de.wikipedia.org/wiki/Webcrawler">Spider</a>&nbsp;unterstützt.</p> <p>Wer sie möchte kann sie <tt class="docutils literal">hier</tt> herunterladen und in sein pageLoggerinstallation&nbsp;einfügen.</p> <p><span class="caps">PS</span>: Bei mir ging dies nicht über pageLogger direkt. Ich habe die Datei per <a class="reference external" href="http://de.wikipedia.org/wiki/File%20Transfer%20Protocol"><span class="caps">FTP</span></a>&nbsp;hochgeladen.</p> LiomanTue, 24 Nov 2009 14:04:00 +0100tag:lioman.de,2009-11-24:/2009/11/pagelogger-boterkennung-verbessern/DigitalBotsCrawlerDownloadPageLoggerRegexrobotsStatistikStatistiktool: PageLoggerhttps://lioman.de/2009/11/statistiktool-pagelogger/<p><strong>*Tja gerade habe ich noch Piwik angepriesen und nun ist es schon wieder aus. Meine jetzige Alternative heißt&nbsp;PageLogger.*</strong></p> <p>Piwik sah in der Demo eigentlich ganz gut aus und auch das Pluginsystem hielt ich für viel versprechend. Das Projekt hat sich zum Ziel gesetzt die Open-Source-Alternative zu <a class="reference external" href="http://de.wikipedia.org/wiki/Google%20Analytics">Google Analytics</a> zu werden. Leider geht Piwik dementsprechend mit den Ressourcen um. Man benötigt im Grunde einen eigenen Server mit 128 M. Denn mit weniger bekommt man das System ohne Plugins gerade so zum laufen. Will man sich aber genauere Statistikgraphen anzeigen lassen oder die interessanten Plugins einbauen bekommt man nur eine&nbsp;Fehlermeldungen.</p> <p>Piwik ist wohl doch eher für mittelgroße bis große Seiten gedacht, die auch ein finanzielles Interesse an einer genauen Statistik haben. Für ein kleines privates Blog wie das Meinige braucht diese Websoftware einfach zu viel Ressourcen und kann deswegen nicht auf einem Freehost installiert&nbsp;werden</p> <p>Ich möchte aber trotzdem ein paar Statistiken haben, ohne meine Wordpress-<span class="caps">DB</span> aufzublähen und ohne&nbsp; die Daten an Dritte&nbsp;weiterzuleiten.</p> <p>Über Wikipedia bin ich auf <a class="reference external" href="http://www.pagelogger.com/">pageLogger</a> gestoßen. Die ehemals proprietäre Software steht inzwischen unter <a class="reference external" href="http://de.wikipedia.org/wiki/GPL"><span class="caps">GPL</span></a> und hat eigentlich alles was man so&nbsp;benötigt.</p> <p>Die Installation ging leicht von der Hand und auch der Trackingcode ist leicht eingebaut. Außerdem kann man - im Gegensatz zu Piwik -&nbsp; auch Bots+Spider tracken, was mich persönlich immer sehr&nbsp;interessiert.</p> <p>Die genaue Feature-Liste der Web Analytics&nbsp; Software findet sich <a class="reference external" href="http://www.pagelogger.com/de/features/index.html">hier</a></p> LiomanSun, 15 Nov 2009 13:40:00 +0100tag:lioman.de,2009-11-15:/2009/11/statistiktool-pagelogger/DigitalOpen SourceGoogle AnalyticsGPLPageLoggerPiwikStatistikweb analytics software