Efficiëntie, andere belasting voor zorgverleners en miscommunicatie met AI?
De verwachtingen van AI en LLM’s in de zorg zijn groot, van het verlichten van administratieve lasten voor zorgverleners tot het toegankelijker maken van medisch advies voor burgers/patiënten. Maar hoe zit dit met de impact en de uitdagingen in de praktijk? Drie recente studies geven een interessant inzicht.
AI voor zorgverleners: Efficiëntie, maar een nieuwe soort belasting?
Minder registratielast dankzij ambient listening (Speech2Summary/Text).
Een studie uit JAMA Network Open onderzocht ambient listening voot consulten en toonde aan dat zorgverleners minder tijd kwijt waren aan verslaglegging en dat hun tevredenheid toenam. Deze voordelen varieerden echter per groep, zo bleken geslacht en specialisme invloed te hebben op de ervaren effectiviteit. Dit geeft wel potentie voor AI als een tool tegen administratieve lasten, voor wie daar behoefte aan heeft.
⚠️ Nieuwe belasting: het controleren van AI output.
Een artikel in NEJM AI waarschuwt dat de winst in efficiëntie minder kan worden door een nieuwe vorm van belasting.
De wisselende nauwkeurigheid van LLM-output vereist zorgvuldige controle door artsen.
Dit kan zorgen voor een verhoogde belasting door het constante nalezen van AI output. Maar er is ook een risico op overmatig vertrouwen op AI output. Alleen de verantwoordelijkheid en aansprakelijkheid voor fouten blijven bij de zorgverlener liggen.
⚕️ AI voor de patiënt: Kennis genoeg, maar begrijpen we elkaar?
In University of Oxford onderzocht ze of LLM’s burgers kunnen helpen bij medisch zelfadvies. De bevindingen:
– LLM’s zoals GPT-4o beschikken over indrukwekkende medische kennis (tot 95% juiste diagnoses bij testscenario’s).
– Wanneer echte mensen deze modellen gebruikten, vonden ze in minder dan 34,5% van de gevallen de juiste aandoening, soms zelfs slechter dan via eigen zoek opdrachten (bv. via Google) of eigen kennis.
Het probleem zit daarbij in de interactie: gebruikers geven onvolledige input, de AI communiceert soms onduidelijk of vaag, en correcte suggesties worden niet altijd herkend of opgevolgd.
Standaard benchmarktests voorspellen deze praktijkproblemen niet, waardoor ’theoretisch succes’ niet altijd leidt tot betere zorgbeslissingen in de praktijk.
Voorbij de hype, naar verantwoorde innovatie… dat vraagt om een kritische houding, realistische verwachtingen en een focus op veilige, bruikbare en ondersteunende AI:
– Regie door mens, ‘Human in the loop’: De effectiviteit van AI staat of valt met menselijke interactie.
– Praktijk testen: Hoge scores op benchmarks vertalen zich niet automatisch naar succes in de complexe praktijk. Testen en validatie in praktijksituaties zijn essentieel.
– Transparantie & verantwoordelijkheid: Beperkingen en risico’s moeten helder zijn, zowel voor patiëntveiligheid als de zorgverleners.
—
Gedeelde link bij LinkedIn bericht:
Originele LinkedIn bericht: https://www.linkedin.com/feed/update/urn%3Ali%3Ashare%3A7330521480327237632
