Studie zeigt Ungenauigkeit von AI Chatbot ChatGPT bei pädiatrischen Diagnosen

Eine kürzlich durchgeführte Studie hat ergeben, dass der AI Chatbot ChatGPT, der vom Sprachmodell GPT-3.5 betrieben wird, bei der Diagnosestellung von pädiatrischen Fällen äußerst ungenau ist. Die Forscher untersuchten 100 pädiatrische Fälle und stellten fest, dass ChatGPT bei 83% von ihnen eine falsche Diagnose stellte. Die Studie, die in der Zeitschrift JAMA Pediatrics veröffentlicht wurde, ist die erste, die die Fähigkeit von ChatGPT zur Diagnosestellung bei pädiatrischen Fällen untersucht.

In früheren Untersuchungen konnte GPT-4, ein neueres Sprachmodell, nur bei 39% schwieriger medizinischer Fälle, einschließlich solcher, die sowohl Erwachsene als auch Kinder betrafen, eine korrekte Diagnose stellen. Dies zeigt, dass es noch einen langen Weg zur Entwicklung genauer AI Chatbots für medizinische Diagnosen gibt.

Während der Studie baten die Forscher ChatGPT, für jeden Fall eine Differentialdiagnose und eine endgültige Diagnose zu stellen. Allerdings stellte ChatGPT bei 72 von 100 Fällen falsche Diagnosen. In einigen Fällen waren die Antworten des Chatbots klinisch relevant, aber zu allgemein, um als korrekte Diagnose zu gelten.

Ein Fall, der in der Studie hervorgehoben wurde, betraf einen Teenager mit Autismus, der Symptome eines Hautausschlags und Steifheit der Gelenke zeigte. Während der ursprüngliche Arzt den Teenager mit Skorbut diagnostizierte, stellte ChatGPT die Diagnose einer immun-thrombozytopenischen Purpura, einer Störung der Blutgerinnung. Ein weiterer Fall betraf ein Baby mit einem abfließenden Abszess an der Seite des Halses. Während der ursprüngliche Arzt dies dem Branchiootorenalen (BOR)-Syndrom zuschrieb, behauptete ChatGPT, dass das Baby einen branchiogenen Schlitzfistelzyste habe.

Es gab jedoch einige Fälle, in denen ChatGPT zu derselben Diagnose wie die Ärzte kam. Zum Beispiel stimmte ChatGPT in einem Fall einer 15-jährigen Mädchen mit idiopathischem intrakraniellen Hypertonus (IIH) mit der ursprünglichen Diagnose des Arztes von Morbus Addison überein.

Die Forscher räumten ein, dass große Sprachmodelle wie ChatGPT immer noch als administratives Werkzeug für Ärzte, z. B. für Notizen, einen Wert haben. Die Studie verdeutlicht jedoch die Grenzen von AI Chatbots bei der genauen Diagnosestellung, insbesondere im Erkennen von Zusammenhängen zwischen medizinischen Störungen.

Darüber hinaus betonten die Forscher die Notwendigkeit einer selektiveren Schulung und eines verbesserten Zugangs zu Echtzeit-Medizininformationen, um die diagnostische Genauigkeit von AI Chatbots in Zukunft zu verbessern.

Zusammenfassend lässt sich sagen, dass AI Chatbots zwar Potenzial in der Gesundheitsbranche haben, jedoch weitere Forschung und Entwicklung erforderlich sind, um deren Zuverlässigkeit und Genauigkeit bei der Diagnose von pädiatrischen Fällen zu gewährleisten.

The source of the article is from the blog queerfeed.com.br

Privacy policy
Contact