Session 4: Introduction to Statistical Modeling

hallo zusammen,

nachdem wir nun ja – m.E. recht produktiv – die ersten hürden genommen habe und eine reihe elementarer konzepte einigermaßen klar geworden (sind|sein sollten), können wir uns nun – denke ich – der stat. modelierung emprischer domänen nähern. hat man die ersten “häh???!!”-effekte mal verkraftet, macht das sogar richtig spass, finde ich 🙂

bisher haben wir uns ja mit methoden beschäftigt, die darauf abzielen, etwaige effekte von einer “explanatory/independent variable” auf eine “response/dependent variable” a) zu identifizieren (chi.square; fisher””s exact) und b) deren stärke zu messen (bedingt: p-werte dieser tests, Cramer””s phi/V, (log) odds ratios). genau genommen, waren unsere verfahren allesamt symmetrisch und welche variable nun welche funktionale rolle eingenommen hat, war den tests eher schnuppe…

das “problem” dabei ist allerdings, dass sie miese tücken haben, wenn sie auf korpusdaten (also “observational data”) angewendet werden. Crawley (2007:553) beschreibt dieses Problem in einem Kapitel, das er “The Danger of Contingency Tables” nennt ;). Dort heisst es:

In observational studies we quantify only a limited number of explanatory variables. It is inevitable that we shall fail to measure a number of factors that have an important influence on the behavior of the system in question. […] The problem comes when we ignore factors that have an important influence on the response variable. This difficulty can be particularly acute if we aggregate data over important explanatory variable
… und dann kommt ein Bsp. Was damit nun genau gemeint ist, werden wir uns bald verdeutlichen.

Wichtig ist es, erstmal von diesem “richtig/falsch”-Gedönz wegzukommen und anzuerkennen, dass es niemals das einzig wahre modell geben wird…irgendwie scheint mir der modellbegriff ja auch schon zu implizieren, dass wir es mit mehr oder weniger guten vereinfachungen des zielsystems zu tun haben. zudem sind (nil-)hypothesentestende verfahren eh ziemlich beknackt wissenschaftlich gesehen fragwürdig: siehe z.b. hier, hier, oder hier. eigentlich muss man sich nur mal fragen, wie man durch das ablehnen einer nil-hypothese überhaupt je einmal zu einer theorie kommen soll…but I digress

also, jedenfalls werde ich für die kommende sitzung mal was vorbereiten. wenn ihr es schafft/lust habt koennte ihr euch vielleicht schon mal das Kap 9 in Crawley”” R Book (Crawley 2007), oder Kap 7. im “kleinen Crawley” anschauen. Mindestens Karsten und ich haben diese Texte und mindestens ich leihe sie auch gern mal zum scannen aus…

ok, bald mehr (–> siehe dann “Kommentare zu diesem post”)
best,
daniel

2 Kommentare zu „Session 4: Introduction to Statistical Modeling“

  1. DW says:

    hi zusammen,

    karsten hat sich vorhin tapfer dazu bereit erklärt, das og kapitel aus dem ?dicken crawley? zu scannen! ich finde, dafür (allein) gehört er zum ritter geschlagen (?> sir schmibo 😉

    da da kapitel gute 60 seiten umfasst und sich ja auch nicht gerade wie ein harry potter ?roman? liest, werde ich mich bemühen, die wichtigsten stellen anzuzeigen und bitte euch, mindestens diese dann zur kommenden sitzung vorzubereiten.

    okido,
    ansonsten dann ein umwerfendes WE – natuerlich nicht im sinne der schweinegrippe – wünscht euch
    euer daniel 🙂

  2. DW says:

    ok, mE reicht es erstmal aus, wenn wir die seiten 323-336 (also bis Box-Cox Transformations…das aber NICHT mehr)
    best,
    d.

Kommentieren

Sie müssen angemeldet sein, um kommentieren zu können.