Hoofdstuk 1: Steekproef-verdeling Flashcards Preview

Statistische modellen > Hoofdstuk 1: Steekproef-verdeling > Flashcards

Flashcards in Hoofdstuk 1: Steekproef-verdeling Deck (4):
1

Wat gebeurd er als je een variabele toevoegt (bij twee variabelen)?

1. Multivariaat= 3+ variabelen: bv. leeftijd + edu > sms'en. Controleren: onder constant houden voor. Wanneer je een nieuwe onafhankelijke variabele toevoegt aan regressiemodel, kunnen de andere variabele veranderen. Leeftijd kan een negatief of een positief verband hebben op sms'en. Maar het kan ook als je educatie erbij toevoegt, dat het van een negatief naar positief verband gaat, of andersom. Dan kan leeftijd en educatie met elkaar samenhangen. Een verband dat je hebt gevonden, kan verdwijnen als je een variabel toevoegt, of de richting veranderen. Of als je geen verband vond, opeens wel een verband blijkt te zijn.

2. Moderatie: lage educatie: leeftijd > sms'en. Hoge educatie: leeftijd > sms'en. Zou het effect voor iedere groep hetzelfde zijn? Is het zo dat als iemand een lage of hoge educatie heeft, een ander effect ervaart (op sms'en)? Je hebt mensen die ontvankelijk voor de boodschap en ook niet ontvankelijk ervoor zijn, waardoor er geen effect is bij hen. Het effect voor de mensen waarom het gaat, kan een tegengesteld effect hebben voor de mensen waar het niet om gaat. De derde variabele wordt moderator en het verband tussen twee variabelen wordt anders.

3. Mediatie: Waarom zouden ouderen minder sms'en dan jongeren? Leeftijd > eenzaam > sms'en. Mediatie kan zijn dat als je meer eenzaam bent, je meer behoefte hebt om te sms'en. Het kan een positief effect hebben via ene route en negatief effect via de andere route. Variabelen die daartussen zitten, direct of indirect effect?

2

Stel je voor dat je een steekproef trekt van zakjes snoep? Beschrijf het proces.

Je trekt één toevalssteekproef, random. Hoeveel kleuren heb je in 1 zakje? 5 verschillende kleuren. Dus hoeveel kans heb je om gele snoepjes te krijgen? 1/5 = 20%. Eenheid= steekproef, dus een zakje snoep is de eenheid, eenheid gaat over waarvan je een steekproef van pakt.

> Maar het aantal gele snoepjes in een Zakje, heet een steekproefkenmerk/kansvariabele/sample statistic. Dus een kenmerk van de steekproef waar we geïnteresseerd in zijn.

>> Maar wat als we een andere steekproef hadden getrokken? Want dat kan ook, alles is op een random wijze gepakt. Dus de kans dat je ook een zak met geen gele snoepjes pakt bestaat ook. Het pakken van verschillende zakjes, dus het trekken van verschillende steekproeven, wordt samen in een STEEKPROEFVERDELING gestopt. En daar wordt weer een gemiddelde van gepakt van alle steekproeven die je hebt getrokken. We trekken geen duizend steekproeven, we trekken er maar één steekproef. Maar uiteindelijk kan je door één steekproef te trekken iets zeggen over de andere mogelijke steekproeven.

3

1. Wat betekent de 'sample statistic'?
2. Wat is de 'sample space'?

1. De sample statistic (kenmerk van steekproef) = de variable. Je krijgt een getal uit een steekproef van IETS waarin je geïnteresseerd in bent. Dat iets (onderwerp) waarvan je een steekproef trekt is de sample statistic. Bv. als je de lengte wilt opnemen van mensen, dan is de lengte de sample statistic.
> sample statistic= waarde/score uit de steekproef)

- SAMPLE STATISTIC= genaamd random variabele. Het is een variabele die een uitkomst score geeft aan een steekproef en verschillende steekproeven kunnen verschillende uitkomst scores bevatten. De waarde van de random variabele/sample statisic kan verschillen van steekproef tot steekproef. Het is random (variabele) omdat de score/waarde afhankelijk is van kans/toeval. Dus het gewicht van snoep is een sample statistic. En uit die sample statistic kunnen mogelijke waarden uitkomen, zoals 2,8 gram.

2. De sample space = alle mogelijke uitkomsten die je in de variabele kunt hebben, dus je hebt 10 snoepjes dan heb je dus 10 waarden. Want je kan niet meer dan 10 hebben in een zak. Dus de waarden van de sample statistics. Je hebt 5 mogelijke kleuren van snoepjes dus 5 is je sample space. Als lengte je sample statistic is, dan zijn alle mogelijke waarden de sample space.

4

1. Wat is de 'probability density' (dichtheid)?
2. Wat is 'expected value'/verwachte waarde?
3. Wat is de definitie van een continue en discreet?

1. De probability density = gemiddelde gewicht van de steekproef snoepjes. Kans op de steekproef tussen 2,7 en 2,8 gram is 0,007%. Gemiddeld gewicht is een continue gewicht, kun je altijd een waarde vinden die daar tussen is 2,75 bv. Oneindig nauwkeurig kunnen meten. Probability density hebben we nodig om iets te doen met kansen met continue variabelen. Het is een reeks van uitkomsten en niet van onafhankelijke cijfers.

2. De verwachte waarde/expected value = het gemiddelde van een steekproefverdeling (kansverdeling). Dus iets wat het meest voorkomt, 3 komt het meest voor dus dan is dat de verwachte waarde.

3. Discreet= beperkt aantal mogelijke waarden (hele getallen). Bv kleur van snoepjes - het is of zwart of rood, niet daartussenin. Of het aantal snoepjes: 3 of 10 snoepjes, niet 4,5 snoepjes.
Continue= oneindig aantal waarden (echte getallen met decimalen). De kans van precies 2,8 gram is 0. Daarom werk je met kans-dichtheid, bij continue variabelen.