Close

Newsletter

Iscriviti alla Newsletter di Items per ricevere direttamente via e-mail gli ultimi articoli pubblicati.

    * Obbligatorio

    Intelligent vs intelligence testing: la proposta di Alan S. Kaufman

    Nel 1979 Alan S. Kaufman pubblica uno dei più importanti lavori per la valutazione dell’intelligenza:  Intelligent Testing with WISC-R. Nel volume, l’Autore propone una lettura dei punteggi del test, che denomina intelligent testing, basata sul ragionamento clinico. Nel primo capitolo del libro, Kaufman specifica che:

     Nell’interpretazione della WISC-R il punto focale è il bambino e l’obiettivo principale è la comunicazione dei risultati tenendo conto dello specifico background del bambino, dei suoi comportamenti e del suo approccio agli item del test. I punteggi globali perdono parte della loro importanza, all’esaminatore si richiede flessibilità e insight e il test è percepito come un agente di aiuto dinamico, invece di essere considerato uno strumento per il collocamento [NdT, in classi speciali, ecc.], per l’etichettamento o peraltri generi di vessazione scolastica. In sintesi, il testing intelligente è la soluzione e la WISC-R il mezzo (Kaufman, 1979, p. 1). 

    Kaufman ha chiaro che il termine intelligent testing rischia di essere confuso con intelligence testing: “Sapevo che il titolo in molte bibliografie sarebbe stato scritto scorrettamente come «Intelligence testing» […] ma amavo il termine intelligent testing – che era stato coniato da uno dei miei mentori, Alexander Wesman – perché nella mia esperienza come persona che aveva costruito dei test, fatto ricerca e formato psicologi scolastici e clinici, avevo visto così tanto stupid testing” (2009, p. 9). 
    La sua proposta dell’intelligent testing compare in un momento contraddistinto da importanti cambiamenti: la diagnosi di ritardo mentale si basa su nuovi parametri diagnostici, le scoperte genetiche permettono di conoscere l’etiologia di alcuni disturbi evolutivi, compare la categoria diagnostica dei disturbi dell’apprendimento (1961) e la psicopatologia evolutiva compie numerosi progressi.

    La realtà sociopolitica americana è contraddistinta da alcuni eventi, che hanno dirette conseguenze sulle modalità e i principi di assessment: il promulgamento del Civil Rights Act(1964), che porta in primo piano il problema delle minoranze linguistiche e culturali e della loro discriminazione; l’emanazione di leggi che richiedono una valutazione del soggetto con test cognitivi per l’accesso a servizi assistenziali e riabilitativi e rendono indispensabile la stesura di un piano educativo individualizzato per ogni bambino con difficoltà cognitive; l’introduzione di nuovi modelli diagnostici; la comparsa di modelli di intelligenza neuropsicologici e l’interesse sempre maggiore verso le batterie “flessibili”; il dibattito sul bias degli strumenti di misura è particolarmente acceso. 

    Negli anni Settanta lo scopo della misurazione dell’intelligenza è valutare il livello di funzionamento del soggetto in diversi ambiti in modo da formulare precise indicazioni psicoeducative, che meglio rispondano alla realtà clinica del soggetto. Questo evidenzia alcuni aspetti critici: la misurazione di un unico costrutto con un singolo strumento; il rapporto tra diagnosi e strumento; il nesso tra ragionamento clinico e dati; la possibilità di formalizzare la processualità diagnostica. 

    Un costrutto uno strumento

    Torna al menu

    Iniziamo dal primo punto, che riporta a un complesso dibattito. Negli anni Settanta non si è pervenuti a una definizione consensuale di intelligenza; si è passati da una definizione provocatoria, quale quella di Boring (1923, p. 35) – “l’intelligenza è quello che i test misurano” – ad altre definizioni più articolate, che si rifanno a specifici modelli (non solo psicometrici) e a definizioni più applicative come quella di Wechsler. Questo problema oggi ha perso parte della sua centralità, poiché l’oggetto di interesse è la “multicomponenzialità” del costrutto. Si tende, quindi, a differenziare tra intelligenza e specifiche abilità cognitive – come, ad esempio, propongono Sparrow e collaboratori (2000) – o si cerca un’integrazione tra modello psicometrico di ultima generazione (in questo caso, il modello di Cattell, Horn e Carroll (CHC)) e i più recenti modelli neuropsicologici. Un esempio in tal senso può essere il modello integrato proposto da Flanagan e collaboratori (2010). 

    Sempre in questi anni, in cui il clinico ha a disposizione le Scale Stanford-Binet(Terman, 1916; Terman e Merrill, 1937, 1960; Thorndike, Hagen et al., 1986) e Wechsler (Wechsler, 1939, 1949, 1955, 1967, 1974, 1981, 1989), esiste un significativo gap tra modelli di intelligenza psicometrici, primi modelli neuropsicologici (Halstead, 1947; Reitan e Davison, 1974; Lurija, 1962, 1966, 1973) e strumenti. 
    La proposta dell’intelligent testing è realmente innovativa – potremmo dire, geniale – perché, sostituendo il sostantivo “intelligenza” con l’aggettivo “intelligente”, Kaufman consegue tre obiettivi: si sgancia dall’annosa questione dell’intelligenza come costrutto, supera il problema del nesso tra diagnosi e strumento – che riprenderemo nelle righe successive – e introduce una processualità diagnostica, fondata sul ragionamento clinico, evitando così la contrapposizione tra approccio nomotetico e idiografico e privilegiando l’integrazione tra i dati. 

    La relazione tra diagnosi e strumento – come appena accennato – è complessa e farraginosa, perché rischia di diventare una discussione teorica, basata su quello che dovrebbe essere, più che tenere conto di dati di realtà anche sconfortanti. Si perdono quindi di vista alcuni elementi fondamentali che hanno contraddistinto l’agire clinico e che sono in parte tuttora attuali. Ad esempio, si può creare un’indebita equivalenza tra diagnosi intesa come categoria di un sistema classificatorio nosografico-descrittivo e diagnosi etiopatogenetica – cui si dovrebbe far riferimento per formulare delle indicazioni terapeutiche – ma che non è sempre disponibile, perché alcune volte l’etiopatogenesi dei disturbi diagnosticati è solo parzialmente conosciuta. Basti pensare alla diversità di conoscenze sull’etiopatogenesi del ritardo mentale ai tempi di Binet rispetto a oggi. I criteri necessari e sufficienti per l’accesso ai servizi spesso sono diversi da Stato a Stato o da struttura a struttura. Ne consegue che il clinico e i suoi strumenti devono rispondere a parametri diversi determinati da criteri politici, sociali ed economici più che clinici.

    Tra intelligent testing e funzioni cognitive esiste un importante nesso: il test di intelligenza deve essere costruito in base a un modello teorico. Il modello teorico è fondamentale perché determina le linee guida di interpretazione dei risultati. Il nesso tra diagnosi e strumenti è tanto più complesso quanto più gli strumenti a disposizione non rispondono a un modello di intelligenza. Se ci rifacciamo all’elenco di strumenti sopra riportati, sia le Scale Stanford-Binet sia le Scale Wechsler nelle loro diverse edizioni non sono basate su un modello di intelligenza. 
    In realtà, i modelli teorici possono essere applicati a posteriori a un test: questo costituisce al tempo stesso un punto di forza, perché permette al clinico di scegliere il modello teorico che ha maggiore potere esplicativo per i disturbi indagati, ma anche un limite perché lascia aperto uno spazio di aleatorietà. 

    Una nuova processualità diagnostica

    Torna al menu

    Fin qui il problema della relazione tra diagnosi e strumento, che rende prioritario individuare un modo affidabile per risolvere un problema molto complesso. Kaufman ha cercato di dare una risposta facendo proprio l’approccio clinico che ha contraddistinto il lavoro di alcuni Autori (da Wechsler agli psicologi della Menninger Clinic), abbandonando l’approccio psicoeducativo finalizzato a individuare il rimedio per il singolo problema e ampliando il proprio campo di azione. I dati che si ottengono dai test di intelligenza non devono e non possono essere considerati come elementi a sé stanti. Fanno parte di tutti quei dati che il clinico utilizza per formulare una diagnosi che tenga conto del livello di funzionamento del soggetto nei diversi contesti della sua vita, dei suoi punti di forza e di debolezza, del suo funzionamento emotivo, oltre che della sua motivazione e dell’ambiente in cui vive. Questo approccio è più facile negli anni Novanta perché la diatriba eredità versus ambiente – che ha contraddistinto per decenni il dibattito sull’intelligenza – non è rilevante se si vuole capire quello che la persona ha appreso dalle sue esperienze di vita (Kaufman, Lichtenberger, 2006); si concorda che le esperienze cambiano la struttura del cervello e viceversa (Perry, 2002; Perry e Pollard, 1997) ed esiste una corrispondenza sempre maggiore tra modelli neuropsicologici e comportamenti. Il ragionamento clinico è il criterio elettivo che permette di dare organicità a questo modo di procedere. 

    Kaufman formalizza la processualità diagnostica e fa rientrare a pieno titolo l’intelligent testing nel capitolo più vasto del multimethod assessment, gold standard della attuale valutazione clinica. Sostiene, quindi, la necessità di non limitarsi a leggere i risultati secondo un criterio quantitativo più o meno evoluto, ma sottolinea l’importanza di ricercare possibili corrispondenze tra raggruppamenti di subtest, abilità misurate dai subtest e possibili comportamenti più o meno adeguati. Alla lettura quantitativa del dato deve seguire una lettura clinica dello stesso, in cui si individuano, se sono presenti, possibili corrispondenze tra pattern di punteggi ottenuti dai cluster di subtest e modalità di funzionamento in qualche misura disfunzionali. Dopo tutto, la finalità dell’intelligent testing era e rimane quello di “mettere insieme dati empirici, psicometrici, acume clinico, teorie psicologiche e un ragionamento attento, in modo da costruire una valutazione dell’individuo che porta a formulare un intervento in grado di migliorare le circostanze di vita del soggetto” (Reynolds, 2007, p. 1133). 

    Questo approccio incontra notevoli opposizioni. Avviene l’ennesima spaccatura tra psicologi che sostengono un rigoroso approccio psicometrico e psicologi che propugnano la necessità di una lettura clinica dei dati. I diversi ricercatori, come spesso avviene in questi frangenti, assumono posizioni estreme, per cui diventa difficile trovare una mediazione. 
    Anche Kaufman sostiene la necessità di una lettura psicometrica del profilo (1976a, 1976b, 1979), ma ritiene altrettanto necessario individuare i punti di forza e di debolezza ipsativi del soggetto (Cattell, 1944). Il suo iter interpretativo prevede che il clinico, dopo aver interpretato i QI e i Quozienti di deviazione fattoriali, formuli delle ipotesi per spiegare le fluttuazioni tra subtest. 

    L’analisi ipsativa

    Torna al menu

    L’analisi ipsativa diventa terreno di scontro (McDermott, Fantuzzo et al., 1992). Nel 1990 McDermott e collaboratori, che si oppongono all’analisi ipsativa, pubblicano un lavoro intitolato: Just say no to subtest analysis: A critique on Wechsler theory and practice. A loro avviso, i “punti di forza e di debolezza ipsativa non hanno una stabilità statisticamente significativa […] superiore a 1 mese e sono decisamente instabili al di sopra dei 3 anni. […] l’evidenza dimostra che le misure ipsative delle abilità sono significativamente meno attendibili di quanto lo siano le misure di abilità […] basate su valori normativi” (McDermott, Fantuzzo et al., 1992, p. 514). L’elemento di rottura tra clinici e psicometrici è la formulazione di ipotesi basata sull’integrazione di dati quantitativi e qualitativi. Gli psicologi che si riconoscono maggiormente nel modello psicometrico obiettano sulla validità di tali ipotesi. 

    Nel 1994 Kaufman sostiene di essere pervenuto all’inevitabile conclusione che il mio metodo di interpretazione del test di Wechsler è buono e difendibile e che quei ricercatori [NdT, riferito ai ricercatori che sostengono l’approccio psicometrico] semplicemente non lo capiscono o decidono di non capirlo. […] non hanno colto il punto cruciale del libro, la parte che delineava un metodo di valutazione intelligente in modo da incoraggiare gli esaminatori a non interpretare i profili dei subtest o le discrepanze tra QI indipendentemente dal contesto. Per dimostrare il loro punto di vista – e cioè che l’approccio ipsativo avrebbe dovuto essere terribilmente punito – hanno deprivato il metodo di qualsiasi dignità. Gli hanno tolto il cuore e l’anima e hanno mozzato il teschio di uno scheletro (Kaufman, 1994, p. 5). 

    A questi opposti schieramenti si è arrivati nel tentativo di individuare un razionale che permettesse di sistematizzare la lettura dei risultati, problema molto rilevante. Come scrive Cronbach nel 1980, “dal 1969 avevamo capito che si deve validare l’interpretazione dello strumento più che il test e che la validazione di una processualità decisionale differisce dalla validazione di un’interpretazione descrittiva” (Cronbach, 1980, pp. 99-100). 

    Negli anni Quaranta-Cinquanta i dati dei test sono stati spesso interpretati prescindendo da criteri psicometrici, peraltro molti importanti. Erano anni, però, in cui gli strumenti presenti sul mercato non sempre rispettavano gli standard necessari affinché fosse possibile considerare il risultato del test valido e attendibile. Questo ha indubbiamente costituito una minaccia per la misurazione. Sempre in questi anni, in cui la diagnostica psicologica era in una fase pionieristica, si è cercato di vedere se e in quale misura il risultato al test potesse rispondere a interrogativi clinici. Il modo in cui è stato fatto è stato indubbiamente ingenuo, ma non possiamo dimenticare che i test di Binet hanno effettivamente risolto alcuni dei quesiti diagnostici sul ritardo mentale, dando così adito a numerose aspettative. Da qui il tentativo di trovare corrispondenze – spesso improbabili – tra quadri psicopatologici e profili di test come la Wechsler-Bellevue Intelligence Scale (Wechsler, 1939) o di trovare una formula matematica, come l’Indice di deterioramento mentale delle Scale Wechsler per adulti, che permettesse un rapido screening. Nonostante oggi si possa considerare questo Indice solo in un’ottica storica, non per questo si deve perdere di vista l’importanza che ha avuto nel momento in cui è stato proposto e applicato.

    L’analisi ipsativa ha, per certi versi, avuto un iter analogo. Rapaport e collaboratori (1968) hanno cercato di capire se e in quale modo fosse possibile interpretare lo scatter, indice sempre detrattato dagli psicometristi e oggetto di interesse per i clinici, che successivamente è stato formalizzato come analisi ipsativa. Qualcosa di affine è avvenuto per l’interpretazione del punteggio dei singoli subtest. 
    Le critiche degli psicometristi e la concomitante evoluzione dei modelli di intelligenza psicometrici orientati verso una architettura gerarchica composta da molteplici abilità rendono possibile un cambiamento. Si afferma che, per valutare la cosiddetta intelligenza, è necessario misurare diverse abilità cognitive e che una singola abilità deve essere misurata da almeno due subtest. 

    Già Kaufman (1979) aveva affermato che si possono formulare ipotesi interpretative solo per quelle abilità cognitive e quelle variabili non-cognitive, che sono valutate nello stesso modo da almeno due subtest. 

    Ipotesi fondate su due subtest sono più globali e attendibili di quanto non siano ipotesi specifiche del subtest e di solito più preziose perché l’abilità del bambino trascende lo stimolo specifico, il contenuto dell’item e lo stile di risposta allo specifico compito. […] un punto di debolezza nel ragionamento verbale (a confronto con una prestazione migliore agli altri subtest verbali, che richiedono tutti una memoria a breve o a lungo termine) ha implicazioni per le modalità di insegnamento e per il materiale che può essere più efficace nel programma di istruzione del bambino. Per esempio, se la debolezza ipotizzata nella capacità di ragionamento verbale è sostenuta da altri dati testologici e da altre osservazioni, per il bambino probabilmente sarà vantaggioso un approccio che gli permetta di acquisire conoscenze fattuali e concetti senza ricorrere eccessivamente ad abilità di problem-solving. Al tempo stesso, una debolezza nel ragionamento verbale potrebbe essere migliorata […] avvalendosi di tutti i punti di forza che sono emersi durante la somministrazione dei test (Kaufman, 1994, p. 272). 

    Lo spostamento del focus – dal singolo subtest al cluster di subtest che misurano la stessa abilità – è l’elemento che precorre quella che, alla fine degli anni Novanta, sarà la specificità dell’applicazione del modello psicometrico di Cattel, Horn e Carroll (CHC; McGrew, 1997; Carroll, 1997) con il CHC Cross-Battery Assessment (CHC XBA; Flanagan e McGrew, 1997; Flanagan e Ortiz, 2001; Flanagan, Ortiz et al., 2007). 

    L‘intelligent testing è quindi qualcosa di più di uno strumento che aiuta il clinico nell’interpretazione dei punteggi: è un diverso approccio alla lettura dei dati, che si propone – in linea con quello che negli anni successivi diventerà il multimethod assessment – di integrare dati diversi (quantitativi e qualitativi), alcuni dei quali provengono dall’osservazione del paziente, dalla sua reazione alle prove, dalle sue strategie e dei suoi errori. Come scrive Anastasi. 

    L’approccio di base descritto da Kaufman rappresenta senza alcun dubbio uno dei contributi maggiori all’uso clinico dei test di intelligenza. Tuttavia, si dovrebbe riconoscere che questa implementazione ha bisogno di un clinico che sia ben informato in diversi ambiti della psicologia (Anastasi, 1988, p. 484). 


    Bibliografia:

    • Anastasi, A. (1988). Psychological Testing(6thed.). New York: Macmillan. 
    • Boring, E.G. (1923). Intelligence as the tests test it. New Republic, 35, 35-37.
    • Carroll, J.B. (1997). The three-stratum theory of cognitive abilities. In D.P. Flanagan, J.L. Genshaft e P.L. Harrison (a cura di), Contemporary Intellectual Assessment: Theories, Tests, and Issues. New York: Guilford Press. 
    • Cattell, R.B. (1944). Psychological measurement: Normative, ipsative, interactive. Psychological Review, 51,292-303. 
    • Cronbach, L.J. (1980). Validity on parole: How can we go straight?. In W.B. Schrader (a cura di), New Directions for Testing and Measurement. Measuring Achievement: Progress over a Decade (vol. 5). San Francisco, CA: Jossey Bass. 
    • Flanagan, D.P., Alfonso, V.C., Ortiz, S.O. e Dynda, A.M. (2010). Integrating cognitive assessment in school neuropsychological evaluations. In D.C. Miller (a cura di), Best Practices in School Neuropsychology.
    • Guidelines for effective Practice, Assessment, and Evidence-Based Intervention. Hoboken, NJ: Wiley.
    • Flanagan, D.P. e McGrew, K.S. (1997). A cross-battery approach to assessing and interpreting cognitive abilities: Narrowing the gap between practice and cognitive science. In D.P. Flanagan, J.L. Genshaft, e P.L. Harrison (a cura di), Contemporary Intellectual Assessment: Theories, Tests, and Issues. New York: Guilford Press.
    • Flanagan, D.P. e Ortiz, S.O. (2001). Essentials of Cross-Battery Assessment. New York: Wiley. 
    • Flanagan, D.P., Ortiz, S.O. e Alfonso, V.C. (2007). Essentials of Cross-Battery Assessment (2nd ed.). Hoboken, NJ: Wiley.
    • Halstead, W. (1947), Brain and Intelligence: A Qualitative Study of the Frontal Lobes. Chicago, IL: University of Chicago Press. 
    • Kaufman, A.S. (1976a). A four-test short form of the WISC-R. Contemporary Educational Psychology, 1, 180-196.
    • Kaufman, A.S. (1976b). A new approach to the interpretation of test scatter on the WISC-R. Journal of Learning Disabilities, 9, 160-168.
    • Kaufman, A.S. (1979). Intelligent Testing with the WISC-R. New York: Wiley.
    • Kaufman, A.S. (1994). Intelligent Testing with the WISC-III. New York: Wiley. 
    • Kaufman, A.S. e Lichtenberger, E.O. (2006). Assessing Adolescent and Adult Intelligence (3rd ed.). Hoboken: Wiley. 
    • Kaufman, J.C. (2009). Intelligent Testing. Integrating Psychological Theory and Clinical Practice. New York: Cambridge University Press. 
    • Lurija, A.R. (1962). Le funzioni corticali superiori nell’uomo (tr. it. Giunti, Firenze, 1967).
    • Lurija, A.R. (1966). Human Brain and Psychological Processes. New York: Harper & Row.
    • Lurija, A.R. (1973). Come lavora il cervello (tr. it. Il Mulino, Bologna, 1977). 
    • McDermott, P.A., Fantuzzo, J.W. e Glutting, J.J. (1990). Just say no to subtest analysis: A critique on Wechsler theory and practice. Journal of Psychoeducational Assessment, 8, 290-302. 
    • McDermott, P.A., Fantuzzo, J.W., Glutting, J.J., Watkins, M.W. e Baggaley, R.A. (1992). Illusions of meaning in the ipsativa assessment of children’s ability. Journal of Special Education, 25, 504-526.
    • McGrew, K.S. (1997). Analysis of the major intelligence batteries according to a proposed comprehensive Gf-Gc framework. In D.P. Flanagan, J.L. Genshaft e P.L. Harrison (a cura di), Contemporary Intellectual Assessment: Theories, Tests, and Issues. New York: Guilford Press.
    • Perry, B.D. (2002). Childhood experience and the expression of genetic potential: What childhood neglect tells us about nature and nurture. Brain and Mind, 3, 79-100. 
    • Perry, B.D. e Pollard, D. (1997). Altered Brain Development Following Global Neglect in Early Childhood.
    • Proceedings from Annual Meeting, Society for Neurscience. New Orleans, LA. 
    • Rapaport, D., Gill, M.M. e Schafer, R. (1968). Reattivi psicodiagnostici (tr. it. Boringhieri, Torino, 1975).
    • Reitan, R.M. e Davison, L.A. (1974). Clinical Neuropsychology. New York: Hemisphere. 
    • Reynolds, C.R. (2007). Intelligent testing. In C.R. Reynolds e E. Fletcher-Janzen (a cura di) (2007), Encyclopedia of Special Education (3th ed.). Hoboken, NJ: Wiley & Sons.
    • Sparrow, S.S. e Davis, M. (2000). Recent advances in the assessment of intelligence and cognition. Journal of Child Psychology and Psychiatry and Allied Disciplines, 41 (1), 117-131. 
    • Terman, L.M. (1916). The Measurement of Intelligence: An Explanation of and a Complete Guide for the Use of the Stanford Revision and Extension of the Binet-Simon Intelligence Scale. Boston, MA: Houghton Mifflin Co.
    • Terman, L.M. e Merrill, M.A. (1937). Measuring Intelligence. A Guide to the Administration of the New Revised Stanford-Binet Tests of Intelligence. Boston, MA: Houghton Mifflin.
    • Terman, L.M. e Merrill, M.A. (1960). Stanford-Binet Intelligence Scale Third Revision, Form L-M. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1968. 
    • Thorndike, R.L., Hagen, E.P. e Sattler, J.M. (1986). Stanford-Binet Intelligence Scale – Fourth Edition (SB IV).
    • Itasca, IL: Riverside Publishing. 
    • Wechsler, D. (1939). Scala d’Intelligenza Wechsler-Bellevue, Forma I. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1957. 
    • Wechsler, D. (1949). WISC. Scala d’Intelligenza Wechsler per Bambini. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1956.
    • Wechsler, D. (1955). WAIS. Scala d’Intelligenza Wechsler per Adulti. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1974. 
    • Wechsler, D. (1967). WPPSI. Scala di Intelligenza Wechsler a Livello Prescolare e di Scuola Elementare. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1973.
    • Wechsler, D. (1974). WISC-R. Scala d’Intelligenza Wechsler per Bambini-Riveduta. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1986.
    • Wechsler, D. (1981). WAIS-R. Scala d’Intelligenza Wechsler per Adulti-Riveduta. Tr. it. Giunti O.S. Organizzazioni Speciali, Firenze, 1997. 
    • Wechsler, D. (1989). Wechsler Preschool and Primary Scale of Intelligence-Revised (WPPSI-R). San Antonio, TX: The Psychological Corporation. 

    I link sono stati apposti dalla Redazione; i siti cui essi rimandano erano in atto al momento della pubblicazione dell’articolo.