Dataanalyse SPSS: Statistikk med SPSS kan være komplisert, men her lærer du den generelle prosedyren for dataanalyse med SPSS. EtterImporter data til SPSSortyping følger verifiseringen av dataene. Er de komplette? Er de gyldige? Hvordan er dataene distribuert? Evalueringen av dataene dine kan grovt sett deles inn i tre områder: den beskrivende (beskrivende), den utforskende (utforskende) og den endelige (inferensielle statistiske) analysen. I et praktisk eksempel viser vi den generelle prosedyren. Videre forklares resultatet av en hypotesetest nærmere.
Dataanalyse SPSS: Generell informasjon om beskrivende statistikk
Døbeskrivende statistikkpasser for de første trinnene i analysen din. Fordi det kan hjelpe deg å finne feil i dataene. I SPSS kan du også supplere den beskrivende statistikken med passende diagrammer. Dette gir deg for eksempel en ide om deg selvSPSS datadistribusjon. Dette vil også gi deg en innledende idé om hvorvidt visse forutsetninger for å utføre følgende statistiske prosedyrer er oppfylt.
Last inn eksempelfilen
SPSS leverer noen eksempeldatasett med installasjonen. For å gjøre dette åpner du filen demo.sav i velkomstskjermen, som inneholder data fra en telefonleverandør.
Figur 1: Velkomstskjerm med eksempler
Du kan bytte mellom datavisning og variabelvisning i SPSS. Datavisningen inneholder vanligvis sakene og datapunktene. Mens variabelvisningen inneholder den detaljerte beskrivelsen av variabelen. For eksempel kan du her, ta hensyn tilSPSS-syntaksskriv inn navnet på variabelen og en mer detaljert beskrivelse.
Figur 2: Variabel visning i SPSS
Etter at du har sjekket datasettet, utarbeider du den beskrivende statistikken.
Beregn gjennomsnitt, modus, median, standardavvik og varians med SPSS
Viktige indikatorer for beskrivende statistikk er fremfor altMedian, Modussamt det aritmetiske gjennomsnittet, men også spredningsparametere som standardavvik og varians. For eksempel bruker du variablene «alder», «ekteskap», «inntekt» og «internett».
Først bytter du til datavisningen. Du kan se at alderen ble spurt som et heltall og ikke som en kategori. Her lagres målenivået for "alder" som metrisk.
Variabelen "ekteskap" er spesifisert som en numerisk datatype. I tillegg legges dataverdien inn under «Verdier»-kolonnen. 0 = betyr "ikke gift" og 1 = "gift". Variabelen "inntekt" inneholder ifølge etiketten som er lagt inn "husholdningsinntekten i tusenvis". Har du vansker med oppgaven her anbefaler vi detteStatistikk råd.
Beskrivende statistikk – Dataanalyse med SPSS
Nå skal vi forklare hvordan du implementerer en beskrivende statistisk dataanalyse med SPSS. For å utarbeide den beskrivende statistikken velger du Analyser i SPSS og deretter Beskrivende statistikk og frekvenser. Deretter drar du variablene inn i høyre felt. Gjør valget som vist i figur 3. Til slutt bekrefter du oppføringen med "Neste"-knappen.
Figur 3: Innstillinger for beskrivende statistikk
Nå vises i resultatvinduetSPSS programvareevalueringen. Kolonnene representerer de evaluerte variablene, men beregningen av medianen eller det aritmetiske gjennomsnittet gir ikke mening for alle variablene på samme måte. Du bruker det aritmetiske gjennomsnittet for metrisk skalerte variabler. Mens medianen antar minst et ordinalskalanivå.
Medianen deler variabelens data i to. For det er nesten verdien i midten. Det aritmetiske gjennomsnittet av variabelen "husholdningsinntekt i tusenvis" er M=69,47. Imidlertid er medianen for samme variabel MD= 45. Standardavviket er gjennomsnittsavviket til verdiene fra deres gjennomsnitt. Videre danner variansen middelkvadratavviket.
Figur 4: Statistikkdatautgang i SPSS
Modusen er den hyppigst forekommende verdien for en variabel. I vårt eksempel er 39 år den vanligste omtalen i variabelen "Alder i år". Det aritmetiske gjennomsnittet er faktisk ikke brukbart med nominelt skalerte data. I vårt tilfelle kan du imidlertid se at omtrent like mange undersøkte er gift (M=0,5). Her er utdataene fra tabellen over frekvensene til variabelen "gift" mer detaljert.
Figur 5: Frekvenstabell for den nominelt skalerte variabelen «gift»
Nøkkeltall etter grupper i beskrivende statistikk
Du har nå beregnet noen nøkkeltall for enkeltvariabler. Videre ønsker vi å danne den beskrivende statistikken separat etter grupper.
For å gjøre dette, velg "Data" og "Split fil". Deretter setter du en kategorisk variabel som en divisjonsvariabel. Nå kan du utføre analysen på nytt, akkurat som beskrevet ovenfor. Alternativt kan du selvfølgelig slappe avDataanalysetjenestekrav. Etter at du har gjennomført analysen får du nøkkeltallene per gruppe. Medianen og det aritmetiske gjennomsnittet er nesten det samme i utvalget av ugifte og gifte. Man kan også se at fordelingen i begge gruppene er tilnærmet sentrert fordi medianen og gjennomsnittet er nesten identiske.
Gift | Husholdningsinntekt i tusenvis | Gift | alder i år | Internett-tilkobling | ||
ikke gift | N | Gyldig | 3224 | 3224 | 3224 | 3098 |
Savnet | 0 | 0 | 0 | 126 | ||
Gjennomsnitt | 69 2723 | ,00 | 42,02 | ,27 | ||
Median | 44 5000 | ,00 | 41,00 | ,00 | ||
Modus | 25,00 | 0 | 40 | 0 | ||
Standardavvik | 78,32925 | 000 | 12.326 | ,444 | ||
forskjell | 6135.471 | 000 | 151.934 | ,197 | ||
gift | N | Gyldig | 3176 | 3176 | 3176 | 3047 |
Savnet | 0 | 0 | 0 | 129 | ||
Gjennomsnitt | 69 6804 | 1,00 | 42,10 | ,26 | ||
Median | 45 0000 | 1,00 | 41,00 | ,00 | ||
Modus | 22,00 | 1 | 39 | 0 | ||
Standardavvik | 79,12361 | 000 | 12.254 | ,440 | ||
forskjell | 6260.546 | 000 | 150.162 | ,194 |
Figur 6: Beskrivende statistikk rapportert separat for en kategorisk variabel.
Dette leder oss til neste trinn:statistiske tester. Først hypotesetesten. Ikke glem å slette split-kommandoen i SPSS for følgende analyse.
Prinsippet for hypotesetesten for en dataanalyse med SPSS
Ved statistisk testing av en hypotese spesifiserer man et par hypoteser (jf. Field 2017). Dette sjekker du så for gyldighet ved hjelp av en beregning. Nullhypotesen er ofte formulert på en slik måte at det ikke er noen effekt og f.eksKorrelasjon i SPPSikke komme ut av det. Nullhypotesen for en urettet t-test for avhengige utvalg er: "Middelene til begge grupper er like". Den alternative hypotesen inneholder effekten. I t-testen står det: "De to gruppene skiller seg" Nå sammenligner du den beregnede verdien med en terskelverdi Du kan forkaste nullhypotesen dersom den beregnede verdien er under sammenligningsverdien Den alternative hypotesen gjelder da.
T-testen - Eksempel på dataanalyse med SPSS
I et enkelt eksempel, la oss se prinsippet for en t-test for en dataanalyse i SPSS. For eksempel vil du teste om gifte og ugifte er forskjellig i alder.
Velg Analyser, og deretter Sammenlign midler og uavhengige prøver T-Test.
Figur 7: Uavhengige prøver T-test
For at t-testen skal lykkes, bør den avhengige variabelen være metrisk. Fordelingene til de to gruppene skal være tilnærmet normalfordelt i den avhengige variabelen. Du bør også sjekke om variansene i gruppene er omtrent like. Du kan teste dette med Levene-testen. Til slutt kan du lese resultatet direkte i utgangen av t-testen (for å sjekke forutsetningene kan du f.eks. se påBesøk en University of Sussex-professor sin nettside for mer informasjon).
Levene-Test med SPSS
Levene-testen tester nullhypotesen: «Variansene til gruppene er like». Signifikanstesten gir resultatet p=0,888. Først og fremst sammenligner du p-verdien med en referanseverdi. Vanligvis kan du bruke 0,05 som referanse. Hvis den beregnede verdien er over dette, kan du ikke forkaste nullhypotesen. I dette tilfellet kan variansene antas å være like.
Tolkning av t-tester
Nå holder du deg i den første linjen i SPSS-utgangen. Nullhypotesen til t-testen er: "De to utvalgsmiddelverdiene er like". Les nå p-verdien til t-testen i "Sig (2-sidig)"-kolonnen. Også her er verdien over 0,05-terskelen. Igjen kan nullhypotesen ikke forkastes. Er han i tvil, kan han detStatistikktjenestenskape mer klarhet.
Figur 8: Tabell med resultater av t-testen i SPSS
Hvis p-verdien var under 0,05-grensen, kunne du forkaste nullhypotesen. Da holder den alternative hypotesen. I så fall vil det være forskjell mellom de to prøvene når det gjelder alder.
I dette eksemplet blir sammenkoblingen av beskrivende og konklusjonsstatistikk tydelig. Så bruk de moderne mulighetene for dataanalyse med SPSS for å øke kvaliteten på evalueringen din. Dessuten bør du absoluttSPSS Python-programmeringta i betraktning.Den beskrivende statistikken hjelper deg med å sjekke forutsetningene for videre analyse i SPSS. Dette etterfølges vanligvis av metoder for å teste hypoteser. Med deres hjelp kan du svare på forskningsspørsmålene dine.
litteratur
Field, Andy (2017): Oppdage statistikk ved å bruke IBM SPSS Statistics, 5. Auflage London.
Wooldridge, Jeffery (2013): Introductory Econometrics: A modern approach, 5. Auflage Mason (OH).