Session 2

hallo zusammen,

ich habe soeben karstens mini-präsentation hochgeladen, in der es darum ging, zu zeigen, wie man explorative verfahren (in typologischen kontexten) einsetzen kann. ich denke, wir sollten definitiv nochmal zu diesen dingen zurückkommen, sobald wir ein wenig weiter sind. vielleicht werden wir auch noch andere explorativen verfahren kennenlernen – ich finde bestimmte “baum modelle” sehr hilfreich ( http://en.wikipedia.org/wiki/Recursive_partitioning ) und könnte mir vorstellen, die einzuführen, wenn es unser plan zulaesst …

aber letztlich hatten wir uns ja darauf verständigt – wenn ich das recht erinnere -, (a) den fokus auf hypothesen-testende verfahren zu setzen und (b) uns mit statistischer modellbildung auseinanderzusetzen. wir werden sehen …

am dienstag werden wir dann erstmal mit einem datensatz rumspielen, der vom typ her dem entsprechen sollte, was ihr (also z.b. martin, franziska, ?) erheben werdet. ich habe diesen nun auch schon mal als tab-getrenntes text file hochgeladen, so dass es einfach nach excel/calc sowie nach R importierbar ist. (jede zeile des datensatzes beschreibt genau einen fall (d.h. einen korpusbeleg) relativ zu einer reihe von (nominalskalierten) variablen, die folglich in den spalten angeordnet sind).

wir brauchen für die kommende sitzung:
R > 2.4.0 (die neueste R-Version ist mom. 2.10.0)
– das Paket “vcd” (danke Martin 😉 ) & dessen dependents
– den o.g. datensatz

ertmal klären wir dann die basics in R (dateneingabe, basic syntax, etc.) und dann
fangen wir ganz klein an und konzentrieren uns auf das erstellen einfacher kontingenztafeln (–> 2×2 kreuztabellen), deren stat. auswertung und möglichkeiten d. visualisierung etwaiger effekte. dabei sollten wir bereits eine reihe elementarer stat. konzepte ansprechen koennen (stat. signifikanz, effektstärke, konfidenzintervall, …); schaut die bedeutungen dieser ausdrücke doch bitte nochmal nach, wenn euch diese
(a) noch nicht, oder
(b) nicht mehr so recht, oder
(c) = (a) + (b) = waren noch nie so recht und sind auch immer noch nicht
hinreichend klar sind 😉
eine gute hilfestellung dazu findet sich z.b. hier :
http://www.statsoft.com/textbook/Stathome.html

ok, schoenes WE dann noch
daniel

PS: vergesst nicht, die ersten 50-60 seiten gries zu lesen 😉 haben den text eigentlich alle?

2 Kommentare zu „Session 2“

  1. DW says:

    der workspace aus session 2 ist nun online; zudem hab ich mal alle befehle gesammelt, die wir bis dato benutzt haben (–>das komische file mit dem .r suffix). ich empfehle, dass ihr euch den tinn-r editor dl (http://sourceforge.net/projects/tinn-r/), der in den default einstellungen dann mit .r files assoziiert ist und eine reihe netter features bietet, die wir uns ggf. naechste woche mal anschaeun koennen. alternativ koennt ihr das file natuerlich auch umbenennen (z.b. –> nach *.txt) und dann mit dem editor eurer wahl anschauen/bearbeiten…

  2. DW says:

    habe vorhin eine reihe von files hochgeladen, die wir – wenn alles nach plan laeuft – im laufe unserer treffen brauchen werden. einge files liefern statistische hintergruende, andere sind linguistische applikationen von verfahren, die ich euch ans herz legen moechte, und dritte liegen irgenwo dazwischen.

    eines dieser files, “r-essentials“, koennt ihr vielleicht schon mal anschauen und mit den funktionen rumspielen.

    2 files haben “contingency table” im titel und bieten sich als vor- und nachbereitung der kommenden resp. letzten sitzung an.

    in der befürchtung, dass ihr das hier alles nicht rechtzeitig lest, moechte ich nocheinmal dazu aufrufen, die RSS feeds hier zu abonnieren

    ok, best, daniel

Kommentieren

Sie müssen angemeldet sein, um kommentieren zu können.