Liomans Blog - Botshttps://lioman.de/42 ist die Antwort – aber wie lautet die Frage?Tue, 24 Nov 2009 14:04:00 +0100pageLogger Boterkennung verbessernhttps://lioman.de/2009/11/pagelogger-boterkennung-verbessern/<p><strong>Ich habe schon über die Statistiksoftware pageLogger berichtet und bin auch bisher damit zufrieden. Allerdings stellte ich fest, dass die Bot-Erkennungsliste etwas mager&nbsp;ist.</strong></p> <p>Im Verzeichnis <span class="caps">PAGELOGGER</span>/includes/robots liegt die Datei robots.txt. Sie ist gefüllt mit RegEx - also kleinen Textschnipseln die in einem <a class="reference external" href="http://de.wikipedia.org/wiki/User%20Agent">User Agent</a> auftauchen können - und einer Erklärung die dann im Frontend&nbsp;auftaucht.</p> <p>Bsp:</p> <pre class="literal-block"> gaisbot/#Gaisbot geckobot#GeckoBot gencrawler#GenDoor gigabaz/#GigaBaz gigabot#GigaBot googlebot#Googlebot griffon#navi.ocn.ne.jp </pre> <p>Doch 271 Bots sind etwas wenig sind doch mehrere Tausende inzwischen bekannt. Es sind zwar nicht alle wichtig und einige kommen sicher sehr selten auf einem kleinen Blog vorbei. trotzdem ist es sinnvoll die Liste ein wenig zu&nbsp;erweitern.</p> <p>Ich habe mir verschiedene Listen im Netz angeschaut und sie dann mit ein paar Konsolenbefehlen zusammengefügt. Dann noch eine kleine Reinigung der Liste von Hand und nun werden ganze 871 <a class="reference external" href="http://de.wikipedia.org/wiki/Webcrawler">Spider</a>&nbsp;unterstützt.</p> <p>Wer sie möchte kann sie <tt class="docutils literal">hier</tt> herunterladen und in sein pageLoggerinstallation&nbsp;einfügen.</p> <p><span class="caps">PS</span>: Bei mir ging dies nicht über pageLogger direkt. Ich habe die Datei per <a class="reference external" href="http://de.wikipedia.org/wiki/File%20Transfer%20Protocol"><span class="caps">FTP</span></a>&nbsp;hochgeladen.</p> LiomanTue, 24 Nov 2009 14:04:00 +0100tag:lioman.de,2009-11-24:/2009/11/pagelogger-boterkennung-verbessern/DigitalBotsCrawlerDownloadPageLoggerRegexrobotsStatistikLieber Spammer - ein bisschen mehr Kreativitäthttps://lioman.de/2009/11/lieber-spammer-ein-bisschen-mehr-kreativitaet/<p><strong>*Ich hatte schon ein paar mal über Kommentarspam auf diesem Blog geschrieben und dabei das Akismet-Plugin gelobt. Obwohl es zuverlässig ist lohnt es sich die verschiedenen Spamkommentare&nbsp;anzuschauen.*</strong></p> <p>Die meisten schreiben ganz plump, komplette &#8220;Produkt&#8221;-Beschreibungen rein. Wie ein Casino wo man kostenlos ganz viele Geld machen kann und das ganz ohne Risiko, da die Betreiber ja ach so nett sind und allen mit zu wenig Geld in der Tasche was gutes tun möchten. Oder Medikamente zu Spottpreisen mit denen man wahlweise die ganze Welt begatten oder den kompletten Weltschmerz betäuben&nbsp;kann.</p> <p>Manche möchten den Spamkommentar als echten tarnen indem sie keine direkte Produktverlinkung durchführen sondern nur ihre eigene Homepage beim Kommentarverfassen eintragen. Diese sind meistens allgemein gehalten (damit sie überall drunter passen) und in schlechtem&nbsp;Google-Translator-Deutsch.</p> <blockquote> <em>Ist interessant. Möchte lesen mehr davon zu das Thema</em></blockquote> <p>oder so ähnlich. Nun kam mal was ganz neues&nbsp;rein:</p> <blockquote> <tt class="docutils literal">Tja, das Leben kann so scheisse sein, mann muss sich nur mühe geben.</tt></blockquote> <p>Ein Spamkommentar zu meinem Artikel zur Grünen Suche - also komplett unpassend. Jetzt frage ich mich wie kommt so etwas zustande. Solche Kommentare werden normalerweise von Bots gepostet. Schieben die einfach einen Kommentar überall hin (das vermute ich) oder checken die den Deprifaktor eines Blogs bevor die so etwas schreiben (das befürchte ich).&nbsp; Da dies hier ein fröhliches, lebensbejahendes Blog ist muss ich vorsorgen und lauter positive Wörter&nbsp;posten:</p> <p><em>fröhlich, schön, Leben, Juhu, Spaß, hell, Sonne, toll, flauschig, kuschelig, `Puscheligkeit &lt;http://fellmonster.wordpress.com/2009/08/09/puscheligkeit/&gt;`__, Blumenwiese, Gummibären, hüpfen, springen, jauchzet, frohlocket, jubeln, Kaffee,&nbsp;Tee</em></p> <div class="line-block"> <div class="line"><em>Froh zu sein bedarf es wenig und wer froh ist ist ein König</em></div> <div class="line">Ich hoffe das reicht&#8230;* *</div> </div> LiomanTue, 03 Nov 2009 13:24:00 +0100tag:lioman.de,2009-11-03:/2009/11/lieber-spammer-ein-bisschen-mehr-kreativitaet/DigitalakismetBotsPuscheligkeitSpam