ChatGPT przewyższa lekarzy w dostarczaniu wysokiej jakości, empatycznych odpowiedzi na pytania pacjentów, wynika z ustaleń opublikowanych 28 kwietnia w JAMA Internal Medicine.
Zespół kierowany przez dr Johna Ayersa z Qualcomm Institute na Uniwersytecie Kalifornijskim w San Diego wykazał, że pracownicy ochrony zdrowia preferowali odpowiedzi ChatGPT w prawie 80% przypadków i ocenili odpowiedzi chatbota jako lepsze pod względem jakości i empatii.
Zastosowanie ChatGPT w medycynie zostało podjęte w ostatnich miesiącach, a debata trwała na temat potencjalnych zastosowań klinicznych i badawczych, m.in w radiologii. Dodatkowo ostatnie badania dotyczące ChatGPT w radiologii wykazało potencjał dużego modelu językowego, jak również niedociągnięć w dziedzinie. Zespół Ayers zauważył, że zdolność ChatGPT do udzielania odpowiedzi na pytania pacjentów jest niezbadana.
Aby wypełnić lukę w wiedzy, badacze przetestowali zdolność modelu do odpowiadania na pytania dotyczące opieki zdrowotnej pacjentów za pomocą wysokiej jakości, odpowiednio empatycznych odpowiedzi i porównali je z odpowiedziami lekarzy. Wykorzystali niezidentyfikowaną bazę danych pytań z publicznego forum mediów społecznościowych, aby losowo wybrać 195 przypadków z 2022 r., w których zweryfikowany lekarz odpowiedział na pytanie publiczne. Odpowiedzi Chatbota zostały wygenerowane poprzez wprowadzenie pierwotnego pytania do nowej sesji.
Zespół odkrył, że grupa licencjonowanych oceniających pracowników ochrony zdrowia w 78,6% z 585 ocen preferowała odpowiedzi chatbota od odpowiedzi lekarzy. W skali od jednego do pięciu mierzącej jakość odpowiedzi, grupa oceniająca podała 78,5% odpowiedzi ChatGPT o jakości „dobrej” lub „bardzo dobrej” w porównaniu z 22,1% odpowiedzi lekarzy. Ocenili również odpowiedzi ChatGPT jako „empatyczne” lub „bardzo empatyczne” w 45,1% odpowiedzi w porównaniu z 4,6% odpowiedzi lekarzy.
Pomimo ograniczeń badania i „częstego przesadzania z nowymi technologiami”, ocena, w jaki sposób asystenci AI, tacy jak ChatGPT, pomagają w interakcjach z pacjentami, jest obiecująca w zakresie poprawy wyników zarówno klinicystów, jak i pacjentów – ale zdaniem Ayersa i współpracowników potrzebne są dalsze badania.