Tag: benchmark
-
PhysicianBench: AI faalt op klinische EPD-taken
PhysicianBench: Het beste AI-model slaagt voor minder dan de helft van de klinische EPD-taken. Het gemiddelde over 3 pogingen is nog veel lager… Stanford University publiceerde begin mei PhysicianBench. PhysicianBench test taken waarbij een AI-agent meerdere opeenvolgende stappen uitvoert in het EPD, waarbij elke stap voortbouwt op de vorige. Diagnose interpreteren, medicatie controleren, verwijzing plaatsen,…
