Archive für Kategorie: Statistik

K-Means Clustering an Explorable Explainer

Zwei Webfundstücke

Timelapse auf einem Containerschiff:

 

Steven Pinker und Hans Rosling mit Statistik und Bilder und Gapminder (na klar)

Früher war es ganz bestimmt nicht besser

Mahas Vortrag auf dem 31C3

In diesem Jahr untersuchte Maha die Digitale Agenda der Bundesregierung und präsentierte seine Ergebnisse: Wir beteiligen uns aktiv an den Diskussionen auf dem 31. Chaos Communication Congress in Hamburg.

Maha präsentiert seine Untersuchung der Digitalen Agenda

Maha präsentiert seine Untersuchung der Digitalen Agenda

Welche Wörter kommen besonders häufig vor und welche Bedeutung haben sie? Das eigentlich sehr positive Wort aktiv verkommt bei näherer Betrachtung zur bloßen Plattitüde. Den Rest des Beitrags lesen »

Ich habe zunächst ein Probekapitel dieses Buches im Internet gefunden und war von den anschaulichen Beispielen begeistert. Mein Linguistikstudium liegt schon ein paar Jahre zurück, dennoch war ich interessiert zu erfahren, wie der Rest des Buches ist.

Entgegen der Kapitelaufteilung des Buches sehe ich zwei Hauptteile: Planung und Datenerhebung (Kap. 1 und 2) und Datenauswertung und Analyse (Kap. 3). Es gibt noch ein sehr kurzes viertes und letztes Kapitel zum Thema Gestaltung des Forschungsberichts. Die ersten beiden Kapitel beschäftigen sich mit der Planung und Durchführung einer Studie und das konsequent orientiert an sprachwissenschaftlichen Problemen. Ich gestehe: Ich habe diese beiden Kapitel überflogen. Dennoch sind mir zwei Dinge aufgefallen: Das Layout mit breitem Seitensteg und den Keywords ist sehr übersichtlich und hilft bereits Gelesenes leicht wieder zufinden. Einige Überlegungen hätte ich mir zu meiner Studienzeit so klar ausgesprochen gewünscht. Das beginnt bereits auf den erste Seiten mit Durchführbarkeit und Machbarkeit. Hört sich trivial an – ist es aber nicht.

Empirisches Arbeiten in Linguistik und Sprachlehrforschung

Empirisches Arbeiten in Linguistik und Sprachlehrforschung

Mein Hauptinteresse galt dem Kapitel drei Datenauswertung und Datenanalyse. Dort finden sich die wichtigsten Grundbegriffe (Signifikanz, Korrelation, …) und grundlegende Tests. Den Rest des Beitrags lesen »

A very nice and ambitious talk about stats and programming. Worth to spend 10 min. and watch.

 

In meinem vorherigen Blogpost habe ich beschrieben, wie ich endlich mal ein richtiger Programmierer werden wollte. Die dort erwähnten Online Kurse (im Englischen MOOC genannt) gibt es auch noch von anderen Anbietern: coursera und Khan Academy sind da (meiner Meinung nach) noch zu nennen.

Coursera und Khan Academy

Es kommt der Punkt, an dem nichts mehr geht. Erklärung ungenügend, Aufgabe nicht zu lösen, alle Hinweise aus der Community bringen nichts – zumindest nichts in Bezug auf die Problemlösung. Das ist der Punkt an dem man andere Erklärungen sucht und zwar bei anderem Anbietern solcher Kurse. Bei mir war das im Fall der linearen Regression so. Sie wurde sehr kurz abgehandelt und ich war weit davon entfernt die Übungsaufgabe zu lösen. Über einen Hinweis im Forum (also doch wieder die Community) kam ich direkt zum viel ausführlicheren entsprechenden Kurs bei Khan Academy. Den Rest des Beitrags lesen »

Wahlen und die Zeit unmittelbar davor sind die Stunde der Statistiker. Besonders bei einem Kopf-an-Kopf-Rennen wie bei den US-amerikanischen Präsidentenwahlen wird häufiger nachgefragt und überlegt, wo Fehler in der Berechnung sein könnten. Nach der Wahl zeigt sich nun auch, wo die Statistiker recht hatten und wo sie sich verrechnet haben. Zwei große deutsche Zeitungen (Die Zeit, FAZ) berichten über Nate Silver. Er konnte diesmal die Ergebnisse aller Bundesstaaten vorhersagen. Geglaubt haben es wahrscheinlich die Wenigsten. Mit einer ausreichend großen Datenbasis und etwas Mathematik kann man eine sehr gute Voraussage abgeben. Doch woher kommen diese Daten? Richard Gutjahr schreibt in seinem Blog über „Obama und den Datenbergbau„. Es geht nicht nur um die Erfassung verschiedener Daten, sondern auch um die Verbindung dieser Daten.