Semper Phone

Effortless
LEARNING

  • Improve effortlessly – just by living your life
  • Learn while waiting for your apps to load
  • Recommended by 5 universities
  • Community of over 1,000,000 learners
  • 50,000+ expert-made packs, or create your own
"One of the best learning apps" - CNET
  • Apple Play Store
  • Install Semper from the Play Store
Testtheorie Marburg 14/15

Testtheorie Marburg 14/15

Last update 

Testtheorie und -konstruktion

Items (224)

  • Drahtbiegemethode

    Eignungstest für zB handwerkliche Berufe (Draht soll nach Vorlage gebogen werden)

  • Griffith Entwicklungsskalen, IDS, Schulreifertest...

    Entwicklungstest für Kinder

  • Deduktives Vorgehen: Ausgangspunkt

    Theorie oder Modell; top-down Vorgehen (von Konstrukt zu Item)

  • OLMT (Objektiver Leistungsmotivationstest)

    10s: Zurücklegen einer Strecke via Drücken von roter oder grüner Taste

  • Rorschach-Test (Projektives Verfahren): Kennwerte

    Anteil Detail-, Farb-, Formantworten

  • Hexagon-Modell (zB. EXPLORIX->Test zur Ausbildungsplanung)

    6 Persönlichkeitstypen->Gegenüberliegende keine Gegensätze, nur am weitesten voneinander entfernt

  • Externale Konstruktion (Kriteriumsorientiertes Vorgehen): Ziel

    Items finden, die eine Kategorie von Menschen gut charakterisieren (zB Depressive)

  • Übungsaufgaben bei Leistungstests: Beispielaufgabe angeben

    Leichte Aufgabe, Struktur wie Testaufgabe oder VP löst selbst leichte Ü-Aufgaben

  • Welche Arten von Tests gibt es?

    Leistungstests. PersölichkeitsFB, Objektive Persönlichkeitstests, Projektive Verfahren

  • Kriteriumsorientiertes Vorgehen: Ablauf

    typ. Gruppe u. Kontrollgr. finden, Items zusammenstellen, Gruppen bearbeiten lassen

  • Kriteriumsorientiertes Vorgehen: Vorteile

    Validität gewährleistet, Items oft undurchschaubar (->schwer verfälschbar)

  • Ablauf Theorie o. Quellenfindung

    Erst Fachliteratur, dann relevante (ähnliche) Tests suchen

  • Erkenntnis Antretter 2013

    Leistungstests in deutschsprachiger Erwachsenenpsychiatrie= nicht zeitgemäß!

  • Kriteriumsorientiertes Vorgehen: Durchschaubarkeit

    schwer durchschaubar->schwer verfälschbar

  • Kriteriumsorientiertes Vorgehen: Interne Konsistenz

    meist niedrig -> Retestuntersuchung nötig

  • Kontrast eines "besseren" Tests zu anderen: Theoretisches Modell

    adäquateres Strukturmodell, differenzierter durch mehr Subskalen + neuste Forschung

  • Kontrast eines "besseren" Tests zu anderen: Zielgruppe

    besser passend für Zielgruppe

  • Kriteriumsorientiertes Vorgehen: Dimensionale Interretation v. Skalenwerten

    ist problematisch (besser: Wahrscheinlichkeitsaussagen)

  • Kontrast eines "besseren" Tests zu anderen: Einsatzbedingungen

    kürzer, schneller, Selbstadministration mgl, Onlinedurchführbarkeit statt pp...

  • Kontrast eines "besseren" Tests zu anderen: Testtheoretisches Modell

    probabilistische Testtheorie anwenden

  • Testinstruktion: Vorgehen

    muss benannt bzw umschrieben werden

  • Kontrast eines "besseren" Tests zu anderen: Vorgesehene Normierung

    aktuelle Normen, für Zielgruppe maßgeschneiderte Normen

  • Vorteile freies Antwortformat

    geignet, wenn komplexes Denken, originelle Lösungen o. Praxistransfer gefragt

  • Eingeschränkte freie Antworten

    Kurze Antwort verlangt auf Frage, die Antwort schon eingrenzt (zB Nachbarländer)

  • Vorteile eingeschränkte freie Antworten

    Wissen nicht nur bloßes Wiedererkennen, offen für semi-originelle Lösungen

  • Nachteile eingeschränkte freie Antworten

    Auswertung aufwändig u evtl nicht objektiv

  • Zuordnungsaufgabe

    Element der einen soll Element der anderen Spalte zugeordnet werden

  • Nachteil Zuordnungsaufgabe

    Erfasst nur Wiedererkennen und nicht freien Abruf v, Gedächtnisinhalten

  • Nachteile Multiple Choice

    Distraktoren gut?, Leistungstests: erfasst hier nur Wiedererkennen, Ratewahrscheinlichkeit hoch

  • Multiple Choice in Klausuren

    "x aus 5"-richtige Antwortzahl nicht angegeben! (Ratewahrsch: 0,03), Begründung für Punkt nur bei komplett richtigen Lösungen

  • Beurteilungsaufgaben

    zB via Likert-Skala: Persönlich- und Interessentests

  • Nachteil dichotome Antworten

    Entscheidung wird oft erzwungen (wenn Antwort nicht klar->trotzdem ankreuzen!)

  • Markeritems

    Items, die besonders typisch sind (sollten als erstes festgelegt werden)

  • Regeln zur Formuliertung von Items

    verständliche Sprache, auf Passung zu Antwortmgl. achten

  • Invertierung: Problem

    Nicht immer gelingt es, genau das Gegenteil auszudrücken

  • Testgütekriterium Objektivität

    Ergebnisse unabhängig davon, wer Untersuchung, Auswertung, Interpretation ausführt

  • Durchführungsobjektivität

    Test wird immer gleich durchgeführt/dargeboten

  • Eigenschaftseinschätzung: Problem

    Sollten nach Häufigkeit des auftretenden Verhaltens formuliert werden

  • Instruktion verfassen - Randbedingungen klären

    Arbeitstempo, -weise, Vertraulichkeit, Verhalten bei Nichtwissen, Hilfsmittel, Gebrauch d. Testunterlagen

  • Auswertungsobjektivität

    Test immer auf gleiche Weise ausgewertet

  • Interpretationsobjektivität

    Testergebnisse immer auf gleiche Weise interpretiert (evtl. bes. Sachkunde notwendig)

  • Durchführungsobjektivität: Maßnahmen

    Testmaterial mitliefern, weiteres Material benennen, Durchführungsbedingungen spezifiz.

  • Durchführungsobjektivität: Anweisung an Versuchsleiter

    Instruktion vortragen, eindeutige Zeitvorgaben, Regeln für Umgang mit Fragen/Störungen

  • Auswertungsobjektivität: mehrstufige Antwortskalen

    Der angekreuzten Stufe eine Zahl zuordnen (1-2-3...oder 0-1-2...)

  • Auswertungsobjektivität: Verwendung von Schablonen

    "richtige" A. werden gezählt, bei mehrstufigen Skalen die Zahlen addiert, Rohwertsumme=Ergebnis

  • Cohens Kappa

    für Intra-/Interrater-Reliabilität (Reliabilität zw. zwei Zeitpunkten/ Beurteilern

  • Intraklassenkorrelation

    Zur Bestimmung der Interrater-Reliabilität

  • Interpretationsobjektivität: Vorgabe

    Rohwerte müssen in Aussage transformiert werden

  • Interpretationsobjektivität: wichtige Informatonen

    Welches Merkmal gemessen und wie wird Ausprägung beim Pb in Rel. zu welchen Personen festgestellt?-> Normtabelle!

  • Marburger Modell: Normwerte

    Auf alle Normwerte anwendbar, auf die Normalverteilung zutrifft

  • Marburger Modell: Skalen

    5-stufig: sehr niedrig bis sehr hoch

  • Marburger Modell: Mittelkategorie "durchschnittlich"

    umfasst halbe SD (38% d. Pers.=durchschn.), restliche Stufen= eine SD

  • Marburger Modell: Konfidenzintervalle

    werden mit visualisiert

  • Marburger Modell: Allgemein

    Modell zur Evaluation individueller Testscores

  • Marburger Modell: Spalte "SW"

    Bereich d. Standardwerte für einzelne Ausprägungskategorie wird angegeben

  • Marburger Modell: Stanine Werte

    Mittelwert 5; Standardabweichung 2

  • Kennwerte zur Frage "Misst das Item das, was es messen soll?"

    Trennschärfe, Faktorladung, Fremdtrennschärfe

  • Kennwerte zur Frage "Differenziert es gut genug zwischen den Menschen?"

    Itemstreuung, Itemschwierigkeit

  • Kennwerte zur Frage "Passen die Items gut zueinander?"

    evtl. unterschiedliche Itemschwierigkeiten, Faktorenstruktur

  • Itemschwierigkeit: Definition

    Größe d. Anteils an Personen, die das Item im Sinne d. Merkmals beantwortet haben

  • Itemschwierigkeit: "Im Sinne d. Merkmals"

    Leistungstests=richtig; Persönl.FB=Antwort, die das Merkmal indiziert

  • Itemschwierigkeit: p=NR/N

    Anzahl Pbn, die Item i.S.d.M. beantwortet haben / Anzahl Pbn, Item bearbeitet haben

  • Itemschwierigkeit: Rolle d. Variation

    Wenn p=1 oder p=0 alle Probanden gleich und Item somit UNBRAUCHBAR!

  • Itemschwierigkeit: Maß für Variation

    si (Streuung) = Wurzel aus ( Itemschwierigkeit p mal 1 - Itemschwierigkeit 1q)

  • Zusammenhang zw. Itemschwierigkeit u. - streuung

    Itemstreuung ist im mittlere Bereich p=0,50 am höchsten

  • Nur mittelschwere Items verwenden?

    Nein! Da Itemschwierigkeit abhängig von Stichprobe (manchmal Differenzierung in oberem/unterem Bereich gewünscht)

  • Korrektur der Itemschwierigkeit, wenn vermutlich geraten wird

    p= Anz.Pbn mit Antwort i.S.d.M - [Anz.Pbn mit falscher Antwort /(Anzahl Wahlmglk. - 1)] / Anzahl Pbn

  • Anwendung Ratekorrektur

    Nur dann, wenn in Instruktion zu Raten aufgefordert wird wenn Lösung unbekannt

  • Sollte Item mit geringer Streuung und Schwierigkeit eliminiert werden?

    Muss nicht, wenn Test genug Items mit mittlerer Schwierigkeit enthält

  • Itemschwierigkeit bei fehlender Beantwortung

    p = Anzahl Pbn mit Antwort i.S.d.M/ Anzahl Beantwortungen (dennoch nicht optimal)

  • Speedtests: fehlende Beantwortung als Problem

    letzte Items werden nur von wenigen Pbn bearbeitet

  • Speedtests: unangebrachte Lösung für fehlende Beantwortung

    Zeitbeschränkung aufgeben

  • Speedtests: Itemreihenfolge als Lösung für fehl. Beantw.

    so varriieren, dass mind 50% alle Items bearbeitet [a)1-50,51-100 b) 51-100, 1-50]

  • Speedtests: Test verlängern als Lösung für fehl. Beantw.

    paar Items hinten dran, Zeit verlängern, zusätzl. Items NICHT in Itemanalyse aufnehmn

  • Itemschwierigkeit bei mehrstufigen Antworten (zB 0=nie, 5=immer)

    Arithm. Mittel als Maß der Itemschwierigkeit; SD als Maß der Streuung

  • Trennschärfe (r klein it): Definition

    Korrelation des Items mit dem Test o. der Skala d. Tests, zu dem Item gehört

  • Trennschärfe: Test-bzw. Skalenwert

    wird ber alle Items mit Ausnahme des analysierten bestimmt

  • Trennschärfe als Kennwert 1

    In welchem Ausmaß misst Item das Selbe wie der Test

  • Trennschärfe als Kennwert 2

    Wie gut trennt Item zw. Personen mit untersch. Merkmalsausprägung

  • Trennschärfe: Werte

    liegt als Korrelationskoeffizient von -1 bis 1 vor

  • Part-whole Korrektur des Testwerts

    Korrelation Item - (Skala minus Item)

  • Was passiert ohne Part-whole Korrektur?

    Überschätzung der Trennschärfe, da Itemkorrelation mit sich selbst!

  • Einflussfaktor auf Trennschärfe: Inhaltl. Passung d. Items zur Skala

    Je besser, desto höher Trennschärfe

  • Einflussfaktor auf Trennschärfe: Verteilungsform v. Itemantw. u. Skala

    gleiche V.-Form günstig, unterschiedliche mindern Korrelation

  • Einflussfaktor auf Trennschärfe: Streuung d. Skalenwerte

    Große günstig, kleine ungünstig

  • Einflussfaktor auf Trennschärfe Streuung d. Items

    Große günstig, kleine ungünstig

  • Einflussfaktor auf Trennschärfe: Itemschwierigkeit

    Wirkt über Streuung, mittlere günstig, extreme ungünstig (Beziehung meist u-förmig)

  • Falsche Annahme an Trennschärfenhöhe

    Sollte möglichst hoch sein

  • Trennschärfenhöhe: Zielhöhen bzgl. Homogenität

    homogenes Merkmal: hoch; heterogenes: moderat

  • Trennschärfenhöhe: Zielhöhen bzgl. Schwierigkeit

    extrem=niedrig; zur Differenziertung im unteren/oberen Berich evtl. leichte/schwere items nötig

  • Trennschärfenhöhe: Maßnahmen zur Differenzierung im unteren/oberen Bereich

    evtl. leichte/schwere items nötig

  • Elimination v. Items mit niedriger Trennschärfe

    Erhöhung d. internen Konsistenz, evlt. Validitätsverlust durch Ausschluss v. Merkmalsfacetten

  • Induktives Vorgehen zB bei LMI (Leistungs-Motivations-Inventar)

    Bottom up (Ausgangspunkt sind diffuse Vorstellungen, dann Faktorenanalyse, dann Eliminierung)

  • Achtung beim Rausschmeißen v. Items mit schlechter Validität!

    Ist bei diesem Item Trennschärfe hoch, misst der Rest d. Items vllt auch nicht das was man messen möchte!!!!

  • Itemanalyse für Falschantworten (Distraktoren): Allgemein

    Können in Leistungstests genauso wie richtige Antworten analysiert werden

  • Itemanalyse für Falschantworten: Erwartung

    Negative Trennschärfe bzw kleiner als bei richtiger Antwort

  • Itemvalidität: Allgemein (Kennwert Phi)

    Korrelation d. Items mit externem Validitätskriterium (nicht mit Skala!)

  • Itemvalidität: Anwendungsbereich

    bei externaler Konstruktion wichtiges Auswahlkriterium (zB Testleistung mit späterer Stellung im Unternehmen korreliert)

  • Faktorenanalyse: Allgemein

    Prüfunf, ob der Test wie beabsichtigt eindimensional ist

  • Faktorenanalyse: Schritt 1

    Angemessene Faktorenzahl ermitteln

  • Zu Faktorenanalyse Schritt 1: Parallelanalyse nach HORN

    Eigenwertverläufe v. Zufallsvariablen fr gleiches N und gleiche Itemzahl; Vgl. mit Eigenwerten d. eigenen Daten

  • Faktorenanalyse Schritt 2

    Hauptachsenanalyse, wenn eindeutig 2 o. mehr Faktoren

  • Hauptachsenanalyse: Faktor da, auf dem viele inhaltl. gute Items laden?

    Nur diese Items weiter verwenden

  • Hauptachsenanalyse: Verteilung d. Items auf 2 o. mehr korrel. u. gut interpr. Faktoren?

    evtl Subtests einführen

  • Maß für Messgenauigkeit

    alpha; je mehr Items, desto höher

  • Itemselektion Problem: Alphamaximierung...

    ...durch Eliminiation v. Items mit niedr. Trennschärfe kann Validität einschränken

  • Trennschärfen: Eliminierung aufgrund v. Streuung?

    Ja, wenn niedrige Trennschärfe nicht auf kleine Streuung zurückzuführen ist

  • Trennschärfen: weitere Eliminierungsgründe

    negative Trennschärfen, unpassende Inhalte

  • Achtung bei Eliminierung v. mäßig guten Trennschärfen!

    Könnten sich deutlich verbessern, wenn richtig miese Items rausgehauen werden!

  • Korrelationsmatrix

    Matrix d. Korrelationen v. Tests miteinander: hier kann Anzahl d. Faktoren geschätzt werden

  • Explorative Faktorenanalyse (EFA): Allgemein

    Modell-/Hypothesengenerierendes Verfahren (variablenpassende Faktoren sollen gef. werden

  • Konfirmatorische Faktorenanalyse (CFA): Allgemein

    Modell-/Hypothesenbestätigendes Verfahren

  • EFA: Entwickler

    Francis Galton und Charles Spearman (um 1900; Ziel: Struktur d. Intelligenz)

  • EFA: Ausgangspunkt

    Variablen, die miteinander mehr o. weniger stark korrelieren

  • EFA: keine o. sehr schwache Zusammenhänge

    Faktorenanalyse weglassen

  • Prüfung auf Voraussetzungen für EFA

    Kaiser-Meyer-Olkin-Koeffizient (KMO)

  • Werte KMO

    <.50 inkompatibel; >.59 schlecht; >.69 mäßig; <.79 mittel; <.89 gut; <.90 sehr gut

  • Zu beachten bei Durchführung EFA: Personenstichprobe

    liegen Daten zu mehreren Variablen liegen vor (oder gleich ganze Korrelationsmatrix)?

  • Zu beachten bei Durchführung EFA: Zusammenhänge

    stecken in den Variablen systematische Zusammenhänge (mit KMO prüfen)

  • Zu beachten bei Durchführung EFA: Wie Schätzung der Faktoren?

    (Hauptachsen- oder Hauptkomponentenanalyse?)

  • Zu beachten bei Durchführung EFA: Extrahierte Faktoren

    Wieviele Faktoren sollen extrahiert werden?

  • Zu beachten bei Durchführung EFA: Abhängigkeit

    Sollen Faktoren unabhängig sein oder sind korrelierte Faktoren ok?

  • Hauptkomponentenanalyse: 1. Hauptkomponente

    Linie die so durch Daten gelegt wird, dass Abstände zu Datenpunkten möglichst klein

  • Hauptkomponentenanalyse: 2. Hauptkomponente

    wird rechtwinklig (orthogonal) zu 1. HK gelegt->usw...max. so viele HK wie Variablen. mgl.

  • Annahme Hauptkomponentenanalyse

    Gesamte Varianz eines Items wird durch die Faktoren aufgeklärt

  • Hauptkomponentenanalyse: Extrahierungsgrenze

    Alle Komponenten (Faktoren) darunter können ignoriert werden

  • Hauptkomponentenanalyse: Teil d. Ges.Varianz v. der Komponente Fi aufgeklärt

    Eigenwert / Summe aller Eigenwerte

  • HKanalyse: Summe d. quadrierten Ladungen

    = Anteil aufgeklärte Varianz

  • HKanalyse: Rotationsgrund

    Damit einzelne Variablen klarer den Faktoren zugeordnet werden können

  • Varimax

    Gängigste Rotationsmethode (Orthogonal)

  • Kommunalität (h²) (Berechnung)

    Summe der quadrierten Ladungen einer Variablen über alle Faktoren

  • Was bedeutet hohe Kommunalität?

    Variable wird sehr gut durch beide Faktoren erklärt

  • Eigenwert Bedeutung

    Höhe der durch jeweils einen Faktor F erklärten Varianz aller Variablen

  • Eigenwert > 1 bei standardisierten Variablen

    Faktor erklärt mehr Varianz als 1 Variable aufweist-> Faktor erfüllt datenreduz. Zweck d. FA!!

  • durchschn. Eigenwert (Achtung Eigeninterpretation)

    Eigenwert / Anzahl Variablen

  • Eigenwert Berechnung

    Summe aller quadrierten Faktorladungen eines Faktors

  • Faktorladung

    Korrelation zw. Variable u. einzelnem Faktor (nur bei unkorr. Faktoren)

  • "Schöne" Faktorenladung

    Hoch auf einem Faktor, niedrig auf anderen (bei einer Variable)

  • Wann ist Faktorenladung signifikant?

    Ist von N abhängig

  • Fürntratt-Kriterium (Maß für Güte einer Faktorladung)

    Ladung² / Kommunalität-> a² / h²

  • Faktorenladung als Beurteilung für Items

    analog zur Trennschärfe bewerten (siehe vorherige Fragen/Begriffspaare)

  • Zusammensetzung Varianz einer Variable

    h² (Summe d. quadr. Ladungen)+Spezifität+ (1 - Reliabilität)

  • Wie könnte der gemeinsame Anteil Spezifität+(1 - Reliabilität) berechnet werden?

    1-h²

  • Kommunalität (Bedeutung)

    Anteil d. Varianz, der durch alle FAKTOREN erklärt werden kann

  • Was bedeutet ein starker Knick in Faktor x Eigenwerts-Diagramm?

    Unterhalb Eigenwert zu gering (Extrahierungsgrenze)

  • Was ist die Ursache stark negativer Ladungen?

    Invertierte Items!

  • Evaluation der Anzahl der zu extrahierenden Items via...

    Hypothetisches Modell, Kaiser-Kriterium, Scree-Plot, Parallelanalyse

  • Rotation gewünscht? Wenn ja, welche?

    Orthogonale oder oblique (schiefwinklige)

  • Hypothetisches Modell (Anzahl d. zu extrah. Fakt.)

    Anzahl d. Faktoren wird vorgegeben - theoriegeleitet

  • Kaiser-Kriterium (Anzahl d. zu extr. Faktoren)

    Eigenwert > 1 (wenn kleiner, erklärt Faktor weniger als Varianz einer Variable)

  • Scree-Test/Scree-Plot (Anzahl der zu extr. Faktoren)

    Eigenwertsverlauf; nach bedeutsm. Abfall (Eigenwerts x Faktor-Diagramm)

  • Parallelanalyse (Anzahl der zu extr. Fakt.)

    Vgl. emp. Eigenwertsverlauf mit Eigenwertsverlauf v. Zufallsvariablen (viele Datensätze mit gleichem N und gleicher Variablenanzahl)

  • MAP-Test (Anzahl der zu extrah. Faktoren)

    Minimum-Average-Partial-Test

  • Gründe für sehr flachen Eigenwertsverlauf

    Unreliable Variablen, niedrig korrelierte Variablen

  • Hauptachsenanalyse: Verfahren

    Schätzung d. Kommunalität (max. aufklärb. Varianz) aus den Daten (² multipl. Korr. d. Variablen mit allen anderen V.)

  • Ergebnisunterschiede Hauptachsen- u. Hauptkomponentenanaly.

    Selten Unterschiede, aber mögich

  • Erhöht die Rotationstechnik den aufgeklärten Varianzanteil?

    Nein, sie hilft, die extrahierten Faktoren besser zu interpretieren

  • Faktoren der orthogonalen Rotation

    unkorreliert

  • Faktoren der obliquen Rotation

    korreliert, zB Promaxrotation

  • Reliabilität: Definition (r klein tt)

    Genauigkeit mit der ein Test ein Merkmal erfasst (ohne Validitätsgarantie!!!)

  • Der "wahre Wert" einer Ausprägung

    Mittelwert von unendlich vielen Messungen mit gleicher Methode

  • Typischer Wert für die Reliabilität von Persönlichkeitstests

    r klein tt = 0,80

  • Differenz 2er Messwerte: Zufall?

    Anhand von Reliabilität und Standardabweichung überprüfbar

  • Klassische Testtheorie (KT) o. auch Reliabilitätstheorie: Dienlichkeit

    dient der Herleitung von Formeln zu Schätzung der Reliabilität

  • Klassische Testtheorie: Grundannahmen (Axiome)

    macht nur wenige Axiome, die aber nicht empirisch überprüfbar sind

  • Axiome der KT: Verhältnis wahrer Wert - beobachteter Wert

    beobachteter Wert X = Wahrer Wert T + Messfehler E

  • Messfehler: Definition

    Gesamtheit aller unsystematischen Fehler

  • Messfehler: Unabhängigkeit

    sind unabhängig vom wahren Wert (hängen NICHT mit Merkmalsausprägung zusammen)

  • Messfehler: Korrelationen

    Messfehler 2er Tests sind UNKORRELIERT

  • Systematische Fehler

    zB Antwortbias- solche Fehler 2er Tests korrelieren

  • Entstehung Messfehler

    bei Testkonstruktion, Testdurchführung, Auswertung (ACHTUNG: NICHT BIAS!)

  • andere Definition Reliabilität

    Anteil der Varianz der wahren Werte T an der Varianz der beobachteten Werte X

  • Formel Reliabilität

    Rel= Var (T) / Var (X)

  • Was bedeutet eine Reliabilität von 0,80?

    Varianz v. X zu 80% auf Unterschiede in T zurückzuführen

  • Lösung für Problem: Varianz d. wahren Werte muss geschätzt werden

    Test erneut identisch durchführen (gleiche Pers, gleiche Beding.), Kovarianz d. Tests bilden

  • Vergleich Kovarianz 2er wahrer Werte mit 2 beob. Werten

    Cov (X, X') = Cov (T, T')

  • Ableitung aus Kovarianzannahme für Reliabilität (damit wahrer Wert nicht mehr dabei)

    Rel = Corr (Korrelation) von X (erste Messung) und X (zweite Messung)

  • Retest-Reliabilität: Grundsatz

    Reliabilität kann nur über die Korrelation d. Tests mit sich selbst geschätzt werden

  • Ist die Retest-Reliabilität eine Grundannahme der KT?

    Nein! Aber Ableitung aus dieser!

  • Wann fällt die Retest-Reliabilität?

    bei differenziellen Übungseffekten, evtl. nicht identische Durchführungen Test1 u. Test2

  • Retest-Reliabilität: Zeitabstand

    Groß genug damit keine Erinnerungeffekte, klein genug damit keine Merkmalsfluktuation

  • Paralleltest-Reliabilität: Funktion

    Verhindert Abschreiben; ermöglicht Veränderungsmessung

  • "Pseudo-Paralleltest"

    Nur unterschiedliche Item-Reihenfolge

  • Paralleltest-Reliabilität: Inhalt der Tests

    Nie identisch! Aber inhaltlich äquivalent

  • Paralleltest-Reliabilität: Gruppen und Zeitabstand

    selbe Gruppe, geringer Zeitabstand

  • Wann ist ein Test parallel?

    Gleiche Mittelwerte, gleiche Streuungen, gleiche Reliabilität

  • Faktoren, von denen Retest-Reliabilität ahängt

    Selbe wie Retest, minus Erinnerungseffekte

  • Interne Konsistenz: Split half

    Zusammenhang zwischen 2 Testhälften

  • Interne Konsistenz: Cronbachs Alpha

    Zusammenhang zwischen theoretisch allen Testhälften

  • Split-half-Reliabilität: Aufteilung

    ..in 2 Hälften NACH der Durchführung

  • Split-half-Reliabilität: Odd-even-Methode (NACH Durchführung)

    Aufteilung nach Reißverschlussverfahren (Items 1,3,5.. Test1, 3,4,6.. Test2)

  • Split-half-Reliabilität: Aufteilung nach Kennwerten NACH Durchführung

    Schwierigkeit, Trennschärfe->ähnlich?->Itempaar gebildet usw...

  • Split-half Reliabilität: Aufteilung VOR Durchführung

    Ausnahme: Speed Tests (Halbierung nach Itemkennwerten, Durchführung mit halber Bearbeitungszeit direkt hintereinander)

  • Split-half-Reliabilität: Korrelation und Reliabilität

    Korrelation beider Tests UNTERSCHÄTZT die Reliabilität

  • Split-half-Reliabilität: Testlänge u. Reliabilität

    Nimmt mit Itemanzahl ZU

  • Spearman-Brown-Formel: Grundlage

    Schätzung wie hoch Rel wäre, wenn Test doppelt hohe Itemanzahl hätte

  • Spearman-Brown-Formel: Formel

    = k(Faktor, um den Itemzahl erhöht wird) * Rel / (1+(k-1)* Rel)

  • Cronbachs Alpha: Grundlage

    Zerlegung des Tests in so viele Hälten wie Items

  • Cronbachs Alpha: Formel

    Zu kompliziert, in Folien nachschauen!

  • Cronbachs Alpha: Streuung der Testwerte

    Je größer, desto höher wird Alpha (ein Grund: heterogene Personenstichprobe)

  • Cronbachs Alpha: Interkorrelation der Items

    je höher (pos.) Korrelationen, desto größer Alpha (homogene Tests - hohes Alpha)

  • Cronbachs Alpha: Itemzahl

    Je mehr gute Items, desto größer Alpha

  • Cronbachs Alpha: Streuung d. Items u. Interkorrelation

    Je größer Interkorrelation im Vgl. zu Streuung, desto größer Alpha

  • Was für ein Mittelwert ist Cronbachs Alpha

    Mittelwert der Reliabilitäten bei maximal möglichen Testaufteilungen

  • Verhältnis Cronbachs Alpha und Split Half

    liegen nah beieinander (aber Alpha besser, wenn nicht Gründe für genau 2 Testhälften)

  • Vorteil Interne Konsistenz

    Kann immer und ohne zusätzl. Erhebung aus Daten geschätzt werden

  • Cronbachs Alpha und Itemselektion

    Kann maximiert werden, ACHTUNG: evtl. Validitätsverlust

  • Reliabilität: Einfluss der Streuung

    Vergrößerung=höhere Rel

  • Reliabilität: Konfundierung d. Messwerte mit anderer Variablen

    Streuung wird erhöht (gilt nicht bei konstanter Erhöhrung zB Übungseffekte)

  • Reliabilität: Stichprobengröße

    Bei kleinen Stichproben Abweichungen nach oben und unten

  • Konfundierung:Definition

    Je ausgeprägter Merkmal desto größer auch andere Variable

  • Typische Werte für Alpha

    bei Leistungstests oft > .90, bei PersönlFB oft zw. .70 und .80

  • Retestreliabilität von IQ-Tests: Alter

    3-10 Jahre: Starker Anstieg, danach nur leicht

  • Retestreliabilität von IQ-Tests: Länge d. Retest-Intervalls

    je kürzer desto höher, ABER auch bei längeren nur leichtes Abfallen

  • Retestreliabilität von Persönlichkeitstests

    hängt vom Merkmal ab + Alter!

  • Bedeutung Reliabilität für Einzelfalldiagnostik: Aussage über Konfidenzintervall

    Schätzung d. Bereichs d. wahren Werts (enges Invervall? - Hohe Rel günstig!)

  • Bedeutung Reliabilität für Einzelfalldiagnostik: Festlegen von...

    Einseitig, Zweiseitig? Sicherheitswahrscheinlichkeit? Reliabilitätskoeff. auswählen

  • Reliabilität und Konfidenzintervall

    je höher Rel desto höher Konfidenzintervall

  • Standardmessfehler

    Gibt an, wie stark die Messfehler um die wahren Werte streuen

  • Standardmessfehler: Formel

    = Sx (SD d. Testwerte) * Wurzel aus: 1- Rel

  • Konfidenzintervall: Definition

    Bereich, in dem wahrer Testwert bei einer zuvor festgel. Sicherheits- u. Irrtumswahrsch. liegt

  • Konfidenzintervall: Formel

    =X - z-Wert * Standardmessfehler

  • Kritische Differenz zweier Testwerte

    "Ist Wert in Test 1 tatsächlich höher/niedriger als in Test 2?"

  • Regression zur Mitte

    anfänglich extrem hohe o. extrem niedrigen Messwerte sind beizweiten Messung etwas zur Mitte regrediert