Praktische Durchführung

bildBogen austeilen,
Instruktion Manual,
Das Aufgabenblatt nach je 20 Sekunden 'STOP, nächste Zeile' sagen.
GZ ist Nummer der letzten Ankreuzung (nicht Anzahl der korrekten Ankreuzungen).
Am bester erst GZ eintragen und Folie dabei nach unten verschieben (besser handhabbar).
Profil kann durch Verbinden der letzten Ankreuzungen erstellt werden.
F1 mit Folie 1 ermitteln: Anzahl der Auslassungen (von d2s) bis zur letzten Ankreuzung!
F2 mit Folie 2 ermitteln: Anzahl der false alarms.
Aufsummieren
Auf Vorderseite übertragen
F% ist F * 100 / GZ

(relativer Fehleranteil in %)

SB ist Differenz zwischen minimalem Einzel-GZ und maximalem Einzel-GZ
Fehlerverteilung: Anzahl der Fehler Zeile 1-4, 5-10, 11-14

Dann ohne weitere Anleitung oder Normen 'Verlauf' interpretieren.

Mit Tabelle vergleichen %Rang bzw Standardwerte.

GZ: letztes angekreuztes Item, egal ob Treffer oder nicht.
F: Fehlerrohwert: Summe aller Fehler (Auslassungs (F1) und Verwechslungsfehler(F2))
F%: Fehler * 100 / GZ
GZ - F

KL: Konzentrationsleistungswert: Anzahl der Treffer (d2) - Anzahl der Verwechslungfehler (F2)

Ü-Syndrom: Übersprungs-Syndrom: Indiz für instruktionswidriges Verhalten.

KL neu eingeführt. (Konzentrationsleistung): Anzahl markierter Targets abzüglich Verwechslungsfehler (Auslassungsfehler gehen nicht in Berechnung ein).
Ü-Syndrom: Übersprung Syndrom: Indiz für instruktionswidriges Verhalten: außergewöhnlich hoher GZ Wert bei entsprechend vielen Fehlern.


Mit neuer Version (1994) auch Alternativvarianten die teils auf Kritik zurückgingen:
A15 Sek. Bearbeitungszeit (statt 20)
B4 Minuten ohne Zeitfraktionierung
Cwie B mit Zusatz, daß Fehler von Gesamtzahl bearbeiteter zeichen abgezogen werden.
Dunerprobt: Targets und Non-Targets vertauscht.

Neuauflage 1994 (Brickenkamp 1994):

Testbogen Folien identisch, auf Folie 1 zusätzlich kleine Zahlen (Anzahl der Treffer bis zu dieser Stelle.

Neu: Auswertungsformblatt.


Testgrundlage

Diagnostische Zielsetzung (Zustands-/Veränderungsdiagn., Einzelfall/Forschung)

Aufmerksamkeits- und Konzentrationsleistung bei einfachen Wahrnehmungsaufgaben über relativ kurze Zeiträume.
Theoretische Grundlagen
(Aufbau auf Ergebnissen der Psych., Eigene Abweichungen des Autors)

'...gewisse allgemeine Voraussetzungen zur Erzielung von Leistungen...' (Brickenkamp 1994 S. 7)
Vermögen des Individuums, '...sich bestimmten (aufgaben-)relevanten internen oder externen Reizen selektiv , d. h. unter Abschirmung gegenüber irrelevanten Stimuli, ununterbrochen zuzuwenden und diese schnell und korrekt zu analysieren'.
Grundvoraussetzung von anderen Fähigkeiten.
Nachvollziehbarkeit der Testkonstuktion

Weiterentwicklung des Durchstreichtests von Bourdon (1895, 1902) bzw. Durchstreichtest ohne Modell (Meili)

Testdurchführung

Durchführungsobjektivität
Instruktion in 94er Auflage (S. 19)
-A: nur 15 Sek pro Zeile f. Hochleistungsfähige Gruppen.(Keine Normen)
-B Nur Gesamtbearbeitungszeit von 4 Minuten ohne Fraktionierung der einzelnen Zeilen.
-C: in Anlehnung an Süllwold (Süllwold 1993) Auf Fehlermöglichkeiten wird hingewiesen.
-D: nur die Nicht-d2 anstreichen. Keine Daten dazu, nur Spekulation.
Transparenz

(Ist aus Beschaffenheit des Verfahrens Auswertung und diagn. Aussage ersichtlich?)

Zumutbarkeit

Dauer kurz. 8-10 Min.
Gruppentest möglich.

Verfälschbarkeit

Wenn Testziel und Auswertungsmodus bekannt ist, ist Verfälschung möglich (z. B. viele Ankreuzfehler (F2) in Kauf nehmen um GZ zu steigern, ganz rechts Ankreuzung machen. Vgl. Oehlschlägel & Moosbrugger (1991).

Störanfälligkeit

(Empfindlichkeit gegenüber aktuellen Zuständen der Person und situativer Faktoren der Umgebung)


Testverwertung

Auswertungsobjektivität

Objektivität der Vorgabe und Auswertung gegeben.

Zuverlässigkeit (Reliabilität: Stabilität, Äquivalenz, innere Konsistenz)

Handbuch
Split Half (1 vs 2 Hälfte) GZ .84 - .96
GZ und GZ-F ausreichend reliabel ~ .90
SB (Schwankungsbreite)
nicht ausreichend reliabel. Stabilitätskoeffizienten von .23 bzw .28 (Brickenkamp, Kurzcharakteristik 1984 ?)
Aus Kurzcharakteristik: Innere Konsistenz, Median und Schwankungsbreite.
GZ.93(.84 - .98)+/- 5.2 SW ()
GZ-F.91(.87 - .97)+/- 5.9 SW ()
Aus Kurzcharakteristik: Retest Rel. 6 Monate. (Aus Brickenkamp & Rump (1966))
GZ.92 - .88+/- 5.5 -> +/- 6.8 SW
GZ-F.89 - .71+/- 6.5 -> +/- 10.6 SW
F%.61 - .51+/-12.4 -> +/- 13.9 SW
SB.28 - .23+/-16.6 -> +/- 17.2 SW

(Fay 1995)

innere Konsistenz
GZ ..84 - .98
GZ - F.87 - .97
KL.94
F.94 - .96 (Rohwert), .96 (F%)
SB.95
Retest (5 Std - 40 Monate)
GZ.24 - .92
GZ-F.50 - .92
KL.74 - .89
F.37 - .59
F%.37 - .61
SB.49 - .52
Korrelation GZ, GZ-F, KL: .87 - .98

Gültigkeit (Validität)

Logisch valide.
Zum KLT .58 im Mittel.
Zwei verschieden Aspekte der Konzentrationsleisung werden erfaßt:
Menge
Fehler.
Bei Erwachsenen unabhängig von Intelligenz.
Aber: Vergleich Süllwood: Spezielle Konzentrationsleistung. Süllwoods Aufmerksamkeitsumfang ist z. B. unabhängig von d2 Leistung.
(Fay 1995)
24 Seiten Validitätsuntersuchungen. 45% der Untersuchungen aus dem Klinischen Bereich (Psychiatrie, Neurologie, Klinische und Medizinische Psychologie).


Normierung

Verteilungsform
Angaben zu Altersunterschieden,
Geschlechtsunterschiede
Normen 9 - 60 Jahre
Kinder und Jugendliche n=3132 Schülerinnen und Schüler
Erwachsene n>3000.
Volksschüler 9 - 15 Jahre,
Berufschüler 15 - 19 Jahre,
Oberschüler, 11 - 19 Jahre,
Erwachsene, 19 - 40 Jahre,
40 - 50 Jahre,
50 - 60 Jahre
Handbuch: ' ... gründen sich auf Stichproben, die eine Vielfalt von gelernten, angelernten und ungelernten Berufen, von unterschiedlichen Bildungsgraden und sozioökonomischen Schichten umfassen. Zahlenmäßig überwiegen in einem annähernd repräsentativen Verhältnis der mittlere und untere soziale Status. Die meisten Probanden wohnen im Raum Nordwestdeutschland. ... Unster Stichproben bestehen - der Frequenz des Instituts für Sicherheit entsprechend - vorwiegend aus männlichen Konsultanten'.

KL Normen werden als vorläufig bezeichnet (Handbuch S. 22)

Bandbreite

(Ausmaß der Enge oder Vielfalt des Verfahrens gegenüber unterschiedlichen Fragestellungen, Gruppen- und Prognosezeiträumen)

Informationsausschöpfung

(Menge und Qualität der Indikatoren, die bezogen auf verschiedene Ziele, Anlässe oder Probandengruppen begründet aus den Testantworten abgeleitet werden.)

Änderungssensitivität

Testevaluation

Ökonomie

Wegen Kürze gut.

Fairness
Akzeptanz
Vergleichbarkeit

z. B. mit KLT aber viel kürzer

Bewährung

Standard-Konzentrationstest.
Einer der meistbenutzten Tests überhaupt. Nach repräsentativer Befragung von 1500 bundesdeutschen Diplom-Psychologen (Schorr & Brugger, 1990, zit. nach Oehlschlägel und Moosbrugger, 1991) ist der d2 der dritthäufigst benutzte psychologische Test.


Bemerkungen, Kritik

Paralleltest

Mit u und n einfach zu konstruieren.
Paralleltest Übereinstimmung:
Mengenleistung .84,
Fehlerzahl .82
Alter: sehr alt. (1962, 1975) aber Einflüsse dieses Alters auf Rel. und Val. schwer vorstellbar.
Aktuelle Diskussion (Anfang der 90er Jahre) zwischen vor allem Oehlschläger und Moosbrugger gegen vor allem Brickenkamp.
Es gibt eine neugestaltete (!) Version von 1994 mit einigen neuen Koeffizienten, die wohl das Resultat einer heftigen Auseinandersetzung sind.(Fay 1995)


Kritik:

Artefaktanfällig. Zufallsausfüller haben Vorteile. Verbesserungsvorschlag: Fehler stärker wichten. (Oehlschlägel und Moosbrugger, Diagnostica 1991)


Sehr spezifisch. Nur kleiner Aspekt des Konstruktes Konzentration.

Die Kontroverse um den d2

Richtig bearbeitet ist nicht gleich konzentriert bearbeitet: Die Kritik von (Oehlschlägel and Moosbrugger 1991)
-Völlig fehlende Sorgfalt müßte in 0 resultieren: tut es aber nicht. z. B. bei reinem Raten.
-Verschiedene denkbare Bearbeitungsstile mit deren Konsequenz auf das Ergebnis und mit Korrekturvorschlägen werden vorgestellt.
-GZ-2F wird vorgeschlagen als Maß.

Brickenkamps Erwiederung (Brickenkamp 1991)
-die fraglichen Pbn fallen wegen der hohen Fehlerzahl eh auf.
-Hohe Korrelation von GZ-F und GZ-2F (r=.96)
-GZ-2F ist nicht reliabler als der GZ-F
-Emp. Befunde: insgesamt ein valides Instrument.
-Meßwert von 0 bei völlig fehlender Eigenschaft ist auch bei vielen Intelligenztests nicht gegeben. Relative Position der Pb zueinander ist relevant.
-Fehlerzahl als Indikator des Persönlichkeitskonstruktes 'Sorgfalt' ist mit Retest Rel. zwischen .51 und .75 (6-23 Monate) relativ hoch verglichen mit anderen Persönlichkeitseigenschaften.



Süllwood: Report Psychologie(Süllwold 1993):
-Instruktionswidriges Verhalten ist möglich. Bei Kenntnis z. B. bei 'Stop' schnell noch ein Item relativ weit rechts ankreuzen.
-Man könnte richtige/falsche unterschiedlich ankreuzen lassen (z. B. durchstreichen, umrahmen). Rechnergestützte Version bietet immer nur ein Item/Zeitpunkt.
-Kein zeilenweises Zeitlimit sondern Gesamtzeitlimit. Bietet weniger Schummelmöglichkeiten (wird z. B. bei TMS so gemacht).
-Pro Zeile werden natürlich die Items nicht mitgerechnet, die man schon bearbeitet hat, aber die korrekt NICHT durchgestrichen wurden. Das schlägt sich negativ bei dem GZ Wert nieder. Ausweg: Strich - nächste Zeile. Resultiert in durchschnittlich 5-6 Zeichen mehr ohne irgendwelche Durchführprobleme.

-Süllwold Tafeln: Bildschirm oder Tafel,

-ca 50 ein und zweistellige Zahlen mit Unterbrechungen
-2, 3, 5, 7, 11, 14, 16, 17, 22, 24 ...
-Auch mit Buchstaben gemischt

--auch gemischte Reihenfolgen (5, A, 8, D, 9, E, 11, G,
-Bei d2 ist Suchrichtung (Aufmerksamkeitsrichtung) festgelegt.
-Aufmerksamkeitsumfang als Fähigkeit, viele Objekte simultan auf einer 'hohen Bewußtseinsebene' wahrzunehmen ist viel relevanter und viel. Der Aufmerksamkeitsumfang korreliert mit Durchstreichtests im Mittel zu .27
-Orthogonale Eigenschaften.Aufmerksamkeitsumfang und Konzentrationsfähigkeit.
-Aufmerksamkeitsumfang ist sehr emotionsabhängig (neg. schränkt ein).

Fay: (1992): Übbarkeit bei Durchstreichverfahren
-Hohe Übungsgewinne sind möglich. ca 1/3 der Ausgangsleistung. 10.20 -> 13.10 (änliche Werte in TMS-Ergebnissen).
-Ausgangswerte-Problem, Gerechtigkeitsproblem.
-Relative Position bleibt vor und nach Übung nahezu gleich. Rangkorr. .95
-Konsequenz: Info-Broschüre über Übungstechniken wird bei TMS verschickt.
-Aus Sicht der Bearbeiter effektivste Hilfen sind:

-Vorgabe einer Zeitstrukturierung (
-Entscheidungshilfe im Geschwindigkeits-Genauigkeits-Dilemma
-Einüben paralleler Ver- und Bearbeitung der Items

Diagnostica Testbesprechung v. 1994er Version (Fay 1995)
-Instruktion z. Teil lächerlich.
-KL ist durch logisches Nachdenken ad absurdum führbar. Ein Pb, der in jeder Zeile nur das letzte Target erkennt und markiert erhält denselben Wert wie eine Person, die in jeder Zeile nur das erste Target erkennt. (KL = 14)
-Der Pb wird über die Bewertungsmaßstäbe im unklaren gelassen. Trainierte bzw. informierte Pbn sind im Vorteil.
-GZ-2F wurde übernommen.
-SB ist trotz berechtigter Kritik bereits vor 20 Jahren immer noch drin. Dieselbe SB wird durch ganz verschieden große Abstände korrekt bearbeiteter Zeichen erzeugt.
-Auf Fehlerverteilung sollte als Index grundsätzlich verzichtet werden. (Keinerlei Gütekriterien im Handbuch angegeben).
-Val. gut und ausreichend belegt.
-Keine Eignung für Veränderungsmessung (bereits reine Wiederholung ist ausreichend für deutliche Verbesserung).
-Reliabilitäts-Validitäts Dilemma: Mit hochgradiger Zuverlässigkeit kann ein relativ enger Ausschnitt menschlichen Verhaltens erfaßt werden.


Literatur: