×
اجتماعی
شناسه خبر : 311914
تاریخ انتشار : چهارشنبه 1405/02/02 ساعت 08:48
چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

نتایج یک مطالعه نشان می‌دهد هوش مصنوعی در حدود نیمی از موارد، توصیه‌های نامناسب یا مشکل‌ساز درباره سلامت ارائه می‌کند و کارشناسان تأکید دارند تصمیم‌های پزشکی باید بر پایه نظر پزشک متخصص اتخاذ شود.

 نورنیوز-گروه اجتماعی:تصور کنید که دور از جانتان به تازگی سرطان در مراحل اولیه در شما تشخیص داده شده است و قبل از ملاقات بعدی با پزشکتان، سوالی را در یک چت‌بات هوش مصنوعی تایپ می‌کنید مبنی بر اینکه «کدام کلینیک‌ها می‌توانند سرطان را با موفقیت درمان کنند؟»

در عرض چند ثانیه، پاسخی شسته‌رفته و پاورقی‌دار دریافت می‌کنید که انگار توسط یک پزشک متخصص نوشته شده است.

به ادعاهایی که بی‌اساس هستند، پاورقی‌ها به جایی نمی‌رسند و چت‌بات هرگز اشاره نمی‌کند که خود سوال ممکن است سوال اشتباهی برای پرسیدن باشد.

این سناریو فرضی نیست. تقریباً می‌توان گفت این همان چیزی است که تیمی متشکل از هفت محقق هنگام قرار دادن پنج چت‌بات محبوب جهان در یک تست استرس سیستماتیک اطلاعات سلامت به آن دست یافتند و نتایج آن در مجله BMJ Open منتشر شده است.

از هر کدام از چت‌بات‌های ChatGPT، Gemini، Grok، Meta AI و DeepSeek، 50 سوال در مورد سلامت و پزشکی در مورد سرطان، واکسن‌ها، سلول‌های بنیادی، تغذیه و عملکرد ورزشی پرسیده شد.

دو متخصص به طور مستقل هر پاسخ را ارزیابی کردند. آنها دریافتند که تقریباً 20 درصد از پاسخ‌ها «بسیار مشکل‌ساز»، نیمی از آنها «مشکل‌ساز» و 30 درصد «تا حدودی مشکل‌ساز» بودند.

هیچ یک از چت‌بات‌ها به طور قابل اعتمادی فهرست‌های مرجع کاملاً دقیقی تولید نکردند و تنها دو مورد از 250 سوال به طور کامل از پاسخ دادن امتناع ورزیدند.

در مجموع، هر پنج چت‌بات تقریباً عملکرد یکسانی داشتند. گراک(Grok) بدترین عملکرد را داشت که 58 درصد از پاسخ‌هایش به عنوان «مشکل‌ساز» علامت‌گذاری شد، بالاتر از ChatGPT با 52 درصد و Meta AI با 50 درصد.

با این حال، عملکرد بر اساس موضوع متفاوت بود. چت‌بات‌ها به بهترین شکل واکسن‌ها و سرطان را مدیریت کردند که زمینه‌هایی با بدنه‌های تحقیقاتی بزرگ و ساختاریافته هستند. با این حال تقریباً یک چهارم مواقع پاسخ‌های مشکل‌دار ارائه دادند.

آنها بیشتر در مورد تغذیه و عملکرد ورزشی، حوزه‌هایی که مملو از توصیه‌های متناقض آنلاین هستند و شواهد دقیق در عمل کمتر است، دچار مشکل شدند.

سوالات با پایان باز جایی بودند که واقعاً اوضاع به هم می‌ریخت. 32 درصد از این پاسخ‌ها بسیار مشکل‌ساز ارزیابی شدند، در حالی که فقط 7 درصد برای پاسخ‌های بسته این مشکل را داشتند. این تمایز اهمیت دارد، زیرا اکثر پرسش‌های مربوط به سلامت در دنیای واقعی، پرسش‌های با پایان باز هستند.

مردم از چت‌بات‌ها سوالات درست یا غلط نمی‌پرسند. آنها چیزهایی مانند این می‌پرسند که «کدام مکمل‌ها برای سلامت به صورت کلی بهترین هستند؟» این نوع پرسش، پاسخی روان و مطمئن اما بالقوه مضر را می‌طلبد.

هنگامی که محققان از هر چت‌بات فهرست 10 مرجع علمی را خواستند، میانگین امتیاز کامل بودن آن فهرست فقط 40 درصد بود.

هیچ چت‌باتی در 25 تلاش، حتی یک فهرست مرجع کاملاً دقیق هم ارائه نکرد. خطاها از نویسندگان اشتباه و لینک‌های خراب گرفته تا مقالات کاملاً ساختگی متغیر بود.

این یک خطر خاص است، زیرا منابع مانند مدرک به نظر می‌رسند. یک خواننده غیرحرفه‌ای که یک فهرست استناد با قالب‌بندی منظم را می‌بیند، دلیل کمی برای شک به محتوای آن دارد.

چرا چت‌بات‌ها اشتباه می‌کنند؟

یک دلیل ساده وجود دارد که چرا چت‌بات‌ها پاسخ‌های پزشکی را اشتباه می‌دهند. مدل‌های زبانی همه چیز را نمی‌دانند. آنها بر اساس داده‌های آموزشی و زمینه خود، محتمل‌ترین کلمه بعدی از نظر آماری را پیش‌بینی می‌کنند. آنها شواهد را نمی‌سنجند یا قضاوت ارزشی نمی‌کنند.

مطالب آموزشی آنها شامل مقالات داوری‌شده و همچنین محتوای رِدیت، وبلاگ‌های سلامت و استدلال‌های رسانه‌های اجتماعی است.

محققان سوالات خنثی نپرسیدند. آنها عمداً دستورالعمل‌هایی را طراحی کردند که چت‌بات‌ها را به سمت ارائه پاسخ‌های گمراه‌کننده سوق دهد. این یک تکنیک استاندارد تست استرس در تحقیقات ایمنی هوش مصنوعی است که به عنوان «تیم قرمز» شناخته می‌شود.

این بدان معناست که میزان خطا احتمالاً بیش از آنچه با عبارات خنثی‌تر مواجه می‌شوید، است. این مطالعه همچنین نسخه‌های رایگان هر مدل موجود در فوریه 2025 را آزمایش کرد. نسخه‌های پولی و نسخه‌های جدیدتر ممکن است عملکرد بهتری داشته باشند.

با این حال، اکثر مردم از این نسخه‌های رایگان استفاده می‌کنند و اکثر سوالات مربوط به سلامت با دقت بیان نشده‌اند. شرایط مطالعه نشان می‌دهد که مردم واقعاً چگونه از این ابزارها استفاده می‌کنند.

یافته‌های مقاله به صورت جداگانه وجود ندارند. آنها در میان مجموعه‌ای رو به رشد از شواهد قرار می‌گیرند که تصویری منسجم را ترسیم می‌کنند.

مطالعه‌ای در فوریه 2026 در مجله Nature Medicine نکته‌ای شگفت‌انگیز را نشان داد. خود چت‌بات‌ها تقریباً در ۹۵ درصد مواقع می‌توانستند پاسخ پزشکی صحیح را دریافت کنند، اما وقتی افراد واقعی از همین چت‌بات‌ها استفاده می‌کردند، فقط کمتر از ۳۵ درصد مواقع به پاسخ صحیح می‌رسیدند که بهتر از افرادی که اصلاً از آنها استفاده نمی‌کردند، نبود.

به عبارت ساده، مسئله فقط این نیست که آیا چت‌بات پاسخ صحیح را ارائه می‌دهد یا خیر، بلکه این است که آیا کاربران روزمره می‌توانند آن پاسخ را به درستی درک و استفاده کنند یا خیر.

یک مطالعه اخیر که در مجله Jama Network Open منتشر شده است، ۲۱ مدل هوش مصنوعی پیشرو را آزمایش کرد. محققان از آنها خواستند که تشخیص‌های پزشکی احتمالی را بررسی کنند.

وقتی به مدل‌ها فقط جزئیات اولیه مانند سن، جنسیت و علائم بیمار داده می‌شد، آنها در بیش از ۸۰ درصد مواقع در ارائه مجموعه صحیحی از شرایط ممکن شکست می‌خوردند، اما هنگامی که محققان یافته‌های معاینه و نتایج آزمایشگاهی را وارد کردند، دقت به بالای ۹۰ درصد رسید.

در همین حال، یک مطالعه دیگر در ایالات متحده که در مجله Nature Communications Medicine منتشر شده است، نشان داد که چت‌بات‌ها به راحتی اصطلاحات پزشکی ساختگی را تکرار و حتی در مورد آنها توضیح می‌دهند.

روی هم رفته، این مطالعات نشان می‌دهند که نقاط ضعف موجود در مطالعه جدید، ویژگی‌های یک روش تجربی نیستند، بلکه منعکس کننده چیزی اساسی‌تر در مورد جایگاه امروز فناوری هستند.

این چت‌بات‌ها از بین نمی‌روند و نباید هم بروند. آنها می‌توانند موضوعات پیچیده را خلاصه کنند، به تهیه سوالات برای پزشکان کمک کنند و به عنوان نقطه شروعی برای تحقیق عمل کنند، اما این مطالعه به روشنی بیان می‌کند که نباید با آنها به عنوان مراجع پزشکی مستقل رفتار شود.

اگر از یکی از این چت‌بات‌ها برای مشاوره پزشکی استفاده می‌کنید، هرگونه ادعای سلامتی که ارائه می‌دهد را بررسی کنید، ارجاعات آن را به عنوان پیشنهادهایی برای بررسی به جای واقعیت در نظر نگیرید و توجه کنید که پاسخ، مطمئن به نظر می‌رسد، اما هیچ سلب مسئولیتی ارائه نمی‌دهد.


اخبار مرتبط
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
دوشنبه 1405/02/07 ساعت 09:33
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
یک پژوهش تازه نشان می‌دهد کاربران پاسخ‌های سریع چت‌بات‌ها را عجولانه می‌دانند و اندکی تأخیر در ارائه پاسخ باعث می‌شود همان پاسخ‌ها دقیق‌تر، باکیفیت‌تر و «هوشمندانه‌تر» ارزیابی شود.
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
جمعه 1405/02/04 ساعت 22:31
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
یک شبکه اجتماعی علمی جدید با نام Agent4Science راه‌اندازی شده که در آن تنها عامل‌های مبتنی بر هوش مصنوعی می‌توانند مقالات پژوهشی را منتشر کرده و درباره آن‌ها به بحث بپردازند.
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
جمعه 1405/02/04 ساعت 21:40
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
تراشه‌ طراحی‌شده توسط دکتر «بابک باخیت» که با الهام از مغز ساخته شده است، می‌تواند مصرف انرژی هوش مصنوعی را کاهش دهد و ماشین‌ها را هوشمندتر و سازگارتر کند.
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
دوشنبه 1405/01/24 ساعت 17:14
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
در حالی که چین و روسیه و دیگران رقابت خود را بر سر سلاح‌ها و سیستم‌های نظامی مبتنی بر هوش مصنوعی افزایش داده‌اند، مقامات دفاعی آمریکا اذعان کرده‌اند که در این مسیر عقب افتاده‌اند.
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
دوشنبه 1405/01/24 ساعت 01:05
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
نهادهای مالی انگلیس شامل بانک مرکزی، نهاد ناظر مالی و وزارت خزانه‌داری این کشور، در حال برگزاری نشست‌های فوری با مرکز ملی امنیت سایبری هستند تا خطرات احتمالی ناشی از جدیدترین مدل هوش مصنوعی شرکت آنتروپیک را ارزیابی کنند.
نظرات

آخرین اخبار
حضور عراقچی در برنامه گفتگوی ویژه خبری امشب
سی‌ان‌ان: عقب‌نشینی و ترس ترامپ از نقشه سرقت اورانیوم ایران
پرسپولیس به روند صدور مجوز حرفه‌ای معترض شد
مرتضی نعمت اللهی پیشکسوت مجسمه‌سازی اصفهان درگذشت
قدرت‌نمایی ایران در خلیج فارس نماد اقتدار نیروهای مسلح است
تیراندازی در وست وال استریت با یک کشته و 11 زخمی/ فرد مهاجم کشته شد
منبع آگاه : وزیر خارجه پاکستان عازم ژنو می شود
هشدار سی‌ان‌ان درباره بحران سوخت در آمریکا
گروسی: اولویت راستی‌آزمایی است!
بقایی:جلسه نهادهای ذی‌ربط برای بررسی متن پیش نویس تفاهم اولیه در حال برگزاری است
بازنشر پیام عراقچی از سوی ترامپ/ترامپ: پیام وزیر خارجه ایران درباره توافق مثبت بود
بارش‌های سیل‌آسا در راه شمال کشور
دوازده روز جنگ، یکسال مقاومت ملی
مهار آتش‌سوزی در ارتفاعات دشتی بوشهر
کریس رایت ادعا کرد: خروج روزانه حدود 7 میلیون بشکه نفت از خلیج فارس
خوزستان روی خط آتش؛ کدام شهرها امروز رکورد گرما را شکستند؟
پیام تند پوتین به غرب: هرگز با روسیه وارد جنگ نشوید
پاسخ عضو تیم رسانه‌ای مذاکرات به ادعای نبویان درباره تنگه هرمز
پاکستان از پایان نگارش توافق صلح ایران و آمریکا خبر داد
پیام پزشکیان به پوتین به مناسبت روز ملی روسیه
حمله حزب الله به نظامیان اسرائیلی
نورویدئو | ایران یک سال پس از آن دوازده روز
خط‌ونشان رونالدو برای مدعیان جام جهانی
فرمانده‌ای که دنبال «کار» بود نه «نام»+فیلم
وزیر جنگ اسرائیل: از لبنان، سوریه و غزه عقب نشینی نمی کنیم!
دریادار سیاری: دستمان روی ماشه است/هرگز به دنبال سلاح هسته‌ای نیستیم
ونس: خبری از پول نقد بابت امضای توافق با ایران نیست!
استارمر: استعفا نمی‌دهم، می‌جنگم!
خنثی‌سازی مهمات در ملارد/ شهروندان نگران نباشند
تنیسور میزبان هم حریف ملی‌پوش ایران نشد
واکنش تند سرمربی نروژ به رفتار توهین‌آمیز مقامات آمریکایی
عراقچی: جزئیات تفاهم‌نامه اسلام‌آباد در زمان مناسب منتشر می‌شود
خبر خوش از بازگشت 30 میلیون مترمکعب گاز به شبکه
پزشکیان: مصرف بهینه را به گفتمان تبدیل کنیم
سه نشانه بازی روانی ترامپ با ایران و آمریکا
عراق از شکست طرح ترور چند مقام ارشد امنیتی خبر داد
گام جدید برای نیروهای شرکتی؛ طرح تبدیل وضعیت به دولت رسید
کارشکنی آمریکا در عدم صدور ویزای بازیکنان فلسطین
اردوغان: منطقه بهای سنگینی بابت جنگ علیه ایران می‌پردازد
تقویم آزمون‌های نهایی منتشر شد/ یازدهمی‌ها و دوازدهمی‌ها آماده شوند+جدول
شوک ترامپ به مذاکرات؛ چرا رئیس‌جمهور آمریکا توافق را «دروغ» خواند؟
چک سفید امضای آمریکا برای لهستان
عضو کمیسیون امنیت ملی: حتی متحدان ترامپ هم به او اعتماد ندارند
اوکراین در پی دریافت کمک نظامی میلیارد دلاری جدید از متحدانش
نخست‌وزیر عراق: سلاح فقط در دست دولت است
هشدار جدی اسرائیل به ساکنان مناطق جنوب لبنان؛ هرچه زودتر تخلیه کنید!
ایتالیا: جنگ ایران جنگ ما نیست
پشت‌پرده محموله خیالی 3 میلیارد دلاری امارات به ایران
منبع آگاه: ادعای امضای توافق در روز یکشنبه در ژنو کذب محض است
یوزها زیر ذره‌بین سزار راموس