Hoofdstuk 4: Testen van nulhypothese Flashcards Preview

Statistische modellen > Hoofdstuk 4: Testen van nulhypothese > Flashcards

Flashcards in Hoofdstuk 4: Testen van nulhypothese Deck (4):
1

1. Er zijn twee manieren om statistische gevolgtrekkingen te maken: door schatting te maken & Nulhypotheses, leg over Nulhypotheses meer uit.
2. Wat is de betekenis van het significantieniveau?
3. Waarom moet je een eenzijdige p-waarde verdubbelen naar een tweezijdige p-waarde?
4. Wat is een test statistic?

1. Nulhypotheses= verwachting (hypothese) geformuleerd over de populatie. We construeren een steekproefverdeling en gebruiken de waarde van de nulhypothese als denkbeeldige populatiewaarde. Dan toetsen we de nulhypothese en kijken we of het klopt of niet. Als de p-waarde lager is dan 0,05 (5%) dan verwerpen we de nulhypothese omdat onze steekproef te onwaarschijnlijk zou zijn als H0 waar is, want je hebt maar 5% dat H0 waar is, en nemen we de alternatieve hypothese aan, wat dan voor 95% waar is (1-0,05=0,95). Je hebt dan een significant resultaat.

2. Significantieniveau= is het (vooropgestelde) maximum risico/kans/waarschijnlijkheid dat je de nulhypothese verwerpt, terwijl hij eigen waar is. Als je deze fout maakt, dan maak je een Type I-fout. Je mag 5% vergissen, je hebt 5% kans om een Type I-fout te maken.

> Voorwaardelijke kans= de p-waarde die we berekenen is een kans, onder de assumptie dat de nulhypothese waar is.

3. Als je een tweezijdige p-waarde nodig hebt, moet je een eenzijdige p-waarde verdubbelen. En andersom moet je van een tweezijdige p-waarde halveren naar een eenzijdige p-waarden. Dat komt omdat je in een tweezijdige test afstand in twee richtingen gaan: groter dan de hypothetische waarde (U) of kleiner. Als gevolg moet de p-waarde aan beide kanten plaatsvinden in een steekproefverdeling.

4. Een test statistic= een statistische toets om de nulhypothese te testen en te bepalen of je H0 met verwerpen of niet, zoals F-toets of t-toets. Een test statistic standaardiseert het verschil tussen de score uit de steekproef (sample statistic) en de populatiewaarde die we verwachten van de nulhypothese (H0).

> Hoe groter de steekproefgrootte > hoe meer variatie tussen verschillende steekproefgemiddelden dalen en meer steekproefgemiddelden op elkaar zullen lijken en daardoor dichterbij de ware populatiegemiddelde komen.

2

Hoe vertaal je van een onderzoekshypothese naar een statistische hypothese? (Bespreek de statistische toetsen: Category share, Overall score level, score variation, score level change, different group score levels, different group shares, concurrent score levels).

STATISTISCHE TOETSEN:
1. Category share = Aandelen/proporties/categorieën/verhoudingen in de populatie. Bevat 1 variabele:
- kan dichotome variabele zijn: met 2 waarden, bijv. 2 leeftijdsgroepen: jong en oud OF ja en nee >>> Binomiale test.
- als 3+ categorieën voorkomen, zoals verhoudingen in windrichtingen (noord, oost, zuid, west), dit zijn 4 categorieën/verhoudingen/delen in de populatie. Als je ook nog percentages aan elk deel geeft is dit de hypothesized proportion >>> One-sample chisquared test.

2. Overall score level = Hoe hoog of laag zijn de scores over het algemeen? Je hebt een bepaalde standaard bv. 5,5 en je verwacht dat kinderen onder de 5,5 halen. Je verwacht dus dat het beneden het standaard is, je verwacht niet dat alle kinderen onder 5,5 hebben. Je hebt 1 numerieke variabele, om een gemiddelde bv. te berekenen >>> One-sample t test OF Bootstrap test op 1 mediaan.

3. Score variation = Meer overeenstemming of tegenstelling in scores van groepen? Scores ver boven het midden en/of ruim onder het midden ipv alle scores in het midden geconcentreerd (zoals het gemiddelde). Veel polarized? Dan veel verschillen tussen groepen. Dit is het beste te testen met de variantie of standaarddeviatie (variantie in scores van twee groepen, kan ook met meer dan 2 groepen). Met 1 categorische en 1 numerieke variabele >>> Levene's F-test (F-toets).

4. Score level change = Verandert de score na (herhaalde) meting? Verhoogt of verlaagt de score level dan? Is de score dus anders na het opnieuw meten van dezelfde (1) numerieke variabele? >>> Paired-samples t test.

Association *: relatie tussen twee of meer variabelen. Een kenmerk is gerelateerd aan een andere kenmerk. Bv. er is een associatie/verband tussen 'iemands bereidheid om te doneren EN blootstelling aan een beroemdheid die reclame maakt voor het doel', dan kan je concluderen dat iemand die geen beroemdheid heeft gezien, minder bereid is om te doneren. Als de verschillen tussen groep scores stijgen: wordt het verband hoger, als de verschillen minimaal zijn, is het verband lager. (groep a: wel beroemdheid, groep b: geen beroemdheid = beide geen verschil in bereidheid doneren: verband laag, wel heel veel verschil tussen deze twee dan verband hoog).

* 5. Different group score levels =Verband tussen bereidheid om te doneren en beroemdheid blootstelling: elke groep wordt met een van de twee beroemdheden geconfronteerd, er is dus nog geen 'no beroemdheid' aanwezig (anders was het 3 groepen). En dan kijk je nu of tussen de groepen 'welke beroemdheid' het meeste effectief is om de bereid van het doneren te verhogen.
- Dus met 2 groepen krijg je (2 waarden) >>> Independent samples t test.
- Met 3+ groepen (dus ook een 'geen blootstelling aan beroemdheid groep erbij) >>> Analysis of variance: F-test 'Eenwegsvariantie'.

* 6. Different group shares = Verschillende aandelen/verhoudingen van verschillende groepen: 2 categorische variabelen die verband met elkaar hebben. Komen categorieën meer of minder in 1 groep voor dan in de andere groep? (Bereidheid om te doneren? Ja/Nee, komt vaker voor bij vrouwen dan bij mannen >>> Chi-squared test (kruistabel: 2 variabelen verband met elkaar).

* 7. Concurrent score levels = Situaties waarin sommige combinaties van scores op verschillende variabelen veel vaker voorkomen dan andere combinaties van scores. Je hebt een combinatie van scores (op twee variabelen): je kan bv. een hoge exposure hebben met een hoge 'brand awareness'. Deze combinatie verwacht je meer (bij mensen: want hoe meer blootstelling aan advertentie, hoe meer merk bewustzijn, zou je denken) DAN de combinaties van de volgende scores:
- hoge exposure + lage brand awareness
- lage exposure + lage brand awareness
> 2+ numerieke variabelen > Linear >>> Pearson's correlatiecoefficient OF regressiecoefficient (F- en t toets).
> Ordinale variabelen (rangordening) met interval > Bend >>> Spearman's rangcorrelatie.

3

1. Wat is een TWEEZIJDIGE hypothese?
2. Wat is een EENZIJDIGE hypothese? (Geef 2 voorbeelden: waarbij het getal aan de linker en rechterkant kan komen: je alternatieve hypothese dan).

1. TWEEZIJDIGE hypothese= Als de nulhypothese het parameter (populatiegemiddele) gelijkstelt aan 1 enkele waarde, bijv. H0: 5,5. Wordt de nulhypothese verworpen als de waarde van de statistische toets alles behalve 5,5 is.

2. EENZIJDIGE hypothese= Maar wanneer een nulhypothese stelt dat het populatiegemiddelde 5,5 of hoger is, dan is de alternatieve hypothese dus minder dan 5,5 in de populatie. H0 kan alleen afgewezen worden als de waarde van de statistische toets zich aan één kant van de verdeling bevindt: alleen onder (5,5) (links) of boven (rechts). Alles wat 5,5 of hoger dan 5,5 is, wordt nulhypothese bevestigd. En alles onder de 5,5 wordt de nulhypothese verworpen.

> Voorbeeld 1: je verwacht dat kinderen onvoldoende scoren op 1-10 mediageletterdheid. Dus H0: in de populatie is het gemiddelde groter dan 5,5 (of 5,5). Omdat je verwachting is dat kinderen lager dan 5,5 scoren, moet je H0: boven de 5,5 zijn, omdat je H0 niet wilt laten kloppen. Omdat je dus verwacht dat het lager dan 5,5 is, kijk je naar de linkerkant, want daar wil je je waarde eigenlijk hebben (wat verwacht je? Lager = links, hoger = rechts). Dus heb je een LINKS EENZIJDIGE TOETS. Als het onder 5,5 is, dan verwerp je H0 (dit wil je namelijk: kinderen scoren onvoldoende, H1 klopt).

> Voorbeeld 2: Als je verwacht dat kinderen hoger scoren op 'spelletje's willen spelen' dan is je verwachting en je alternatieve hypothese: hoger dan 5,5. En dus is je nulhypothese: 5,5 of onder 5,5. Nu heb je een RECHTS EENZIJDIGE TOETS (wat je wilt > is waar je kijkt). Is het getal 7,6, verwerp je de nulhypothese, want het is niet onder 5,5 en neem je de alternatieve hypothese aan.

>>> Allebei de (linker of rechter) kant hebben dan 5% kans om de nulhypothese te behouden. Terwijl bij een tweezijdige toets je aan allebei de kanten 2,5% hebt.

4

1 Wat is Capitalization on chance?
2. En hoe kan je dit corrigeren?

Capitalization on chance= De waarschijnlijkheden om Type I-fouten hoger te maken (opgeblazen Type I-fouten) dan het significantieniveau dat we willen gebruiken. Dus als je mediageletterheid onder kinderen, de volgende scores: 3,5, 4,5 en 5,5 wilt gaan testen als nulhypotheses > moet je voor elke score een nulhypothese opstellen en en nulhypothese (elke score) heeft dan 5% om een goede nulhypothese te verwerpen. Als je dus 2 tests doet is het risico: 1 minus de kans/risico om een geen echte nulhypothese te verwerpen: 1 - 0,95 = 0,05 (dit is dan het doen van 1 nulhypothese test). En als je dus 2 H0 tests wilt doen is de kans: 1- 0,95 * 0,95= 0,0975. Drie nulhypothese tests? = 1- 0,95 * 0,95 * 0,95 = 0,143.

> Omdat de kans om ten minste één echte nulhypothese van geen verschil (correcte H0) te verwerpen is veel hoger geworden dan 5% als we een significantieniveau van 5% gebruiken voor elke afzonderlijke t-toets van de scores (3,5,4,5 en 5,5).

2. Corrigeren= Door Bonferroni correctie: deze correctie deelt het significantieniveau door het aantal test dat we doen. Dus het voorbeeld van hierboven erbij pakken:
- we doen 3 tests, dus delen we het significantieniveau van 5% door 3 (tests). Het resulterende significantieniveau voor elke t-test is 0,017. > Als de p-waarde van een t-test onder de 0,017 ligt, verwerpen we de nulhypothese.