Liomans Blog - Ngramhttps://lioman.de/42 ist die Antwort – aber wie lautet die Frage?Tue, 21 Dec 2010 14:45:00 +0100Konsolentipps #003: GoogleNgram-Dateien runterladenhttps://lioman.de/2010/12/konsolentipps-003-googlengram-dateien-runterladen/<div class="line-block"> <div class="line">Bei <a class="reference external" href="http://www.commandlinefu.com/commands/view/7363/download-all-data-from-google-ngram-viewer">Commandlinefu</a> habe ich einen Befehl entdeckt, wie man die Daten des wirklich interessanten Tool GoogleNgram runterladen kann.</div> <div class="line">Möchte man nicht gleich alle, sondern nur die in einer bestimmten Sprache, auf den heimischen Rechner ziehen möchte hilft folgender Befehl:</div> </div> <pre class="literal-block"> wget -qO - http://ngrams.googlelabs.com/datasets | grep -E href='(.+ger.+\.zip)' | sed -r &quot;s/.*href='(.+ger.+\.zip)'.*/\1/&quot; | uniq | while read line; do echo $line &gt;&gt; liste.txt; done &amp;&amp; wget -i liste.txt &amp;&amp; rm liste.txt </pre> <p>Nun wird der komplette Datensatz in Deutsch runtergeladen. Möchte man andere Sprachen haben muss man sich die Links auf der <a class="reference external" href="http://ngrams.googlelabs.com/datasets">Ngram-Datasetseite</a> anschauen und die beiden &#8220;ger&#8221; durch die gewünschte Sprache ersetzen (z.B. &#8220;fra&#8221; für&nbsp;Französisch)</p> LiomanTue, 21 Dec 2010 14:45:00 +0100tag:lioman.de,2010-12-21:/2010/12/konsolentipps-003-googlengram-dateien-runterladen/DigitalBücherGoogleNgramKonsoleKonsolentippsLinuxNgramStatistik