AI Menantang Ahli Sonograf dalam Penilaian Fungsi Jantung

Dr David Ouyang

Untuk pasien yang menjalani ekokardiogram untuk menilai fraksi ejeksi ventrikel kiri (LVEF), evaluasi awal dengan kecerdasan buatan (AI) adalah noninferior dan bahkan lebih unggul daripada evaluasi oleh sonografer dalam studi buta dan acak.

Lebih dari 3500 studi ekokardiografi disaring, dan proporsi studi yang secara substansial dikoreksi setelah ditinjau oleh ahli jantung adalah 16,8% pada kelompok AI dan 27,2% pada kelompok sonografer, menunjukkan keunggulan AI.

Perbedaan absolut rata-rata antara penilaian LVEF awal dan akhir adalah 2,79% pada kelompok AI versus 3,77% pada kelompok sonografer, sekali lagi menunjukkan keunggulan AI.

“Kami terkejut bahwa AI bekerja lebih baik daripada sonografer,” David Ouyang, MD, seorang ahli jantung di Institut Jantung Smidt, Cedars-Sinai, Los Angeles, California, dan seorang peneliti di Divisi Kecerdasan Buatan dalam Kedokteran di rumah sakit tersebut, kepada theheart.org | Kardiologi Medscape.

“Kami awalnya hanya berharap untuk menunjukkan bahwa AI dan ahli sonograf setara, tetapi terkejut karena menunjukkan bahwa AI lebih unggul,” katanya. “Dalam beberapa hal, AI ini lulus uji Turing untuk membaca video ekokardiogram.”

Namun, katanya, “Kami sangat ingin dokter tetap bertanggung jawab. Mereka masih perlu meninjau dan mengonfirmasi temuan, meskipun AI dapat membuatnya lebih cepat dan lebih tepat. AI membutuhkan pengawasan dokter.”

Studi ini dipublikasikan secara online 5 April di Nature.

Sonografi atau AI?

Para peneliti menilai interpretasi awal oleh AI dan ahli sonograf dari studi ekokardiografi yang diputar di institusi berbeda pada tahun 2019.

Secara total, 1740 dari studi ekokardiografi secara acak ditugaskan untuk kelompok AI dan 1755 untuk kelompok sonographer. Pasien berusia rata-rata 66 tahun; 57% adalah perempuan; dan 58% adalah kulit putih non-Hispanik; 14%, Hitam; 12%, Hispanik; 8%, Asia; dan 8%, lainnya atau tidak diketahui.

Titik akhir primer adalah perubahan LVEF antara penilaian AI awal atau sonografer dan penilaian akhir ahli jantung, dievaluasi berdasarkan proporsi studi dengan perubahan substansial (perubahan lebih besar dari 5%).

Selain itu, setelah menyelesaikan setiap studi, ahli jantung diminta untuk memprediksi apakah sonografer atau AI membuat interpretasi awal.

Secara keseluruhan, ahli jantung tidak dapat membedakan penilaian mana yang dibuat oleh AI dan mana yang dibuat oleh sonografer. Mereka memprediksi dengan benar metode penilaian awal untuk 32,3% studi, salah menebak untuk 24,2%, dan tidak yakin untuk 43,4%.

Perubahan substansial antara penilaian awal dan akhir dibuat pada 16,8% studi pada kelompok AI versus 27,2% pada kelompok sonografi; dengan kata lain, ahli jantung lebih sering setuju dengan penilaian awal AI.

Perbedaan absolut rata-rata antara penilaian awal dan akhir LVEF adalah 2,79% untuk AI versus 3,77% untuk sonografer.

Perbedaan absolut rata-rata antara penilaian ahli jantung sebelumnya dan akhir adalah 6,29% untuk AI dan 7,23% untuk sonografer.

Selain itu, menurut penulis, alur kerja yang dipandu AI menghemat waktu baik untuk sonografer maupun ahli jantung.

Keterbatasan studi termasuk populasi pusat tunggal, kurangnya kekuatan untuk menilai hasil jangka panjang berdasarkan perbedaan dalam penilaian LVEF, dan kebutuhan akan lebih banyak contoh pelatihan untuk model AI.

Para penulis juga mencatat bahwa ahli sonograf berpengalaman digunakan sebagai pembanding aktif untuk penilaian LVEF awal, tetapi “tingkat pengalaman dan jenis pelatihan yang berbeda dapat mengubah dampak relatif AI dibandingkan dengan penilaian dokter.”

“Kami menerapkan algoritme ini dalam praktik klinis umum di Cedars dan juga berusaha mendapatkan persetujuan Badan Pengawas Obat dan Makanan AS untuk penggunaan umum,” kata Ouyang. “AI semacam ini, setelah dilatih di lebih dari 100 ribu video, harus digeneralisasikan ke sebagian besar institusi. Menurut kami, ini adalah validasi kuat bahwa setelah model mendapatkan data yang cukup, mereka dapat menggeneralisasi.”

Kekuatan, Tapi Terbatas untuk Saat Ini

Mengomentari studi untuk theheart.org | Medscape Cardiology, Y. Chandrashekhar, MD, editor-in-chief JACC: Cardiovascular Imaging, mengatakan: “Buah yang menggantung rendah untuk AI kemungkinan akan meningkatkan logistik dan hasil, misalnya, menggunakan AI untuk mengotomatisasi dan mengoptimalkan banyak proses yang terjadi sebelum dokter mulai membaca studi, seperti protokol tes, akuisisi gambar, mungkin denoising gambar, dan membuat laporan ‘pra-baca’ awal.”

“Penafsiran gambar yang sepenuhnya otonom dan pelaporan multiparameter melalui AI akan tetap menjadi cawan suci selama bertahun-tahun dan harus mengatasi berbagai metodologi, validasi eksternal, kemampuan generalisasi, dan rintangan peraturan sebelum membuahkan hasil klinis,” lanjutnya.

Meskipun kekuatan penelitian ini membutakan dan pengacakan, katanya, “itu akhirnya menjawab pertanyaan yang agak terbatas – EF sebagai laporan ‘pra-baca’,” yang diketahui dari penelitian sebelumnya layak dilakukan.

Dengan demikian, penelitian saat ini adalah “demonstrasi tentang apa yang diketahui AI paling baik dilakukan, dalam tugas terbatas dan parameter pengujian, daripada apa yang secara realistis dapat menggantikannya dalam membaca alur kerja ahli jantung,” katanya. “Ahli jantung masih perlu membaca dan membuat penentuan EF terlepas dari apa yang tertulis di ‘pre-read.’ Seperti yang terstruktur saat ini, itu tidak membuat ahli jantung menjadi lebih efisien atau optimal.”

Douglas Mann, pemimpin redaksi JACC: Basic to Translational Science, juga mengomentari temuan tersebut. “Setidaknya ada 50 pengukuran lain yang memakan waktu dan melelahkan bagi ahli sonograf dan ahli jantung untuk membaca secara manual pada gema 2D. Akan lebih menarik untuk melihat bagaimana AI melakukannya dengan pengukuran selain LVEF, yang merupakan bar yang relatif rendah, ” dia berkata.

“Dokter seringkali harus membuat interpretasi klinis berdasarkan gambar yang kurang ideal,” catatnya. “AI dilatih pada gambar yang optimal, dan…ini mewakili AI yang tidak diketahui secara signifikan dalam pengaturan klinis.” Fakta bahwa gambar yang secara teknis sulit dikeluarkan dari studi saat ini “secara signifikan membuat studi ini bias mendukung AI.”

Berkenaan dengan masa depan AI dalam bidang kardiologi, Mann mengatakan: “Meskipun mungkin ada saatnya teknologi AI menggantikan apa yang dapat dilakukan oleh teknisi atau dokter ahli, semua teknologi AI saat ini hanya sebagus kumpulan data yang digunakannya. Sementara batasan ini dapat hilang seiring perkembangan teknologi, pada saat penulisan, AI masih belum ada.”

Chandrashekhar berkata: “Tetap terlibat dan pantau terus. Ini adalah area menarik yang penuh dengan kemajuan luar biasa kuat yang turun dengan kecepatan tinggi. Banyak dari inovasi ini akan mengubah cara Anda berfungsi sebagai dokter di masa depan. Beberapa klinis aktivitas (misalnya, aktivitas yang sebagian besar bergantung pada pengenalan pola) secara bertahap akan digantikan oleh AI, tetapi lebih banyak lagi yang memiliki potensi untuk dioptimalkan atau bahkan ditingkatkan, dengan manfaat yang signifikan bagi dokter dan pasien.”

Tidak ada pendanaan eksternal yang diperoleh untuk penelitian ini. Ouyang dan dua rekan penulis telah melaporkan memegang paten sementara untuk model AI yang diterbitkan sebelumnya. Chandrashekhar dan Mann telah melaporkan tidak ada hubungan keuangan yang relevan.

Alam. Diterbitkan online 5 April 2023. Teks lengkap

Ikuti Marilynn Larkin di Twitter: @MarilynnL.

Lebih lanjut dari theheart.org | Medscape Cardiology, ikuti kami di Twitter dan Facebook.