Nästan alla stora kända AI-verktyg visar tydliga tecken på begynnande demens. Ju äldre Chat GPT, desto vimsigare.
Att fråga en AI-tjänst som Chat GPT om råd, både privat och på jobbet, blir allt vanligare. Studier har visat att AI ofta är ett bra stöd och ibland till och med bättre än läkare på att ställa diagnoser.
Men nu har amerikanska forskare skärskådat några av de vanligaste stora språkmodellerna – chattrobotarna – och kommit fram till att de inte är kognitivt pålitliga. De uppvisar nämligen klara tecken på begynnande demenssjukdom enligt en studie.
Forskarna lät några olika chattrobotar – Chat GPT version 4 och 4o, Claude 3.5 “Sonnet” och Gemini version 1 och 1.5 – göra ett test som används för att upptäcka demens hos människor.
Siffror i ordning
I testet ingår exempelvis att dra en linje mellan olika nummer, rita en urtavla med siffror i rätt ordning och rita in ett visst klockslag, återge en geometrisk form och minnestest.
Ingen av chattrobotarna fick full pott och de flesta hamnade strax under gränsen för vad som hos människor klassas som mindre kognitiv nedsättning. Precis som hos människor presterade äldre versioner av chattrobotarna sämre än yngre.
Vad gäller språk, uppmärksamhet och abstraktionsförmåga glänste chattrobotarna. Värre var det när det gällde att visa empati eller att tolka komplexa visuella bilder. I uppgifter som krävde både visuellt fokus och abstrakt tänkande blev det svårt. De var också usla på att visa empati.
Ingen ersättning än
Forskarna påpekar att de är fullt medvetna om skillnaderna mellan mänskliga hjärnor och språkmodeller. Men, skriver de, fynden riktar ljuset på hur dåliga de är på exekutiva och visuella uppgifter. Det pekar mot att chattrobotarna inte bör ersätta mänskliga läkare i dagsläget.
Studien har publicerats i den vetenskapliga tidskriften BMJ:s julupplaga som är känd för att innehålla forskning av mer lättsam karaktär.