Tag: benchmark

  • PhysicianBench: AI faalt op klinische EPD-taken

    door

    in

    PhysicianBench: Het beste AI-model slaagt voor minder dan de helft van de klinische EPD-taken. Het gemiddelde over 3 pogingen is nog veel lager… Stanford University publiceerde begin mei PhysicianBench. PhysicianBench test taken waarbij een AI-agent meerdere opeenvolgende stappen uitvoert in het EPD, waarbij elke stap voortbouwt op de vorige. Diagnose interpreteren, medicatie controleren, verwijzing plaatsen,…