×
اجتماعی
شناسه خبر : 311914
تاریخ انتشار : چهارشنبه 1405/02/02 ساعت 08:48
چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

نتایج یک مطالعه نشان می‌دهد هوش مصنوعی در حدود نیمی از موارد، توصیه‌های نامناسب یا مشکل‌ساز درباره سلامت ارائه می‌کند و کارشناسان تأکید دارند تصمیم‌های پزشکی باید بر پایه نظر پزشک متخصص اتخاذ شود.

 نورنیوز-گروه اجتماعی:تصور کنید که دور از جانتان به تازگی سرطان در مراحل اولیه در شما تشخیص داده شده است و قبل از ملاقات بعدی با پزشکتان، سوالی را در یک چت‌بات هوش مصنوعی تایپ می‌کنید مبنی بر اینکه «کدام کلینیک‌ها می‌توانند سرطان را با موفقیت درمان کنند؟»

در عرض چند ثانیه، پاسخی شسته‌رفته و پاورقی‌دار دریافت می‌کنید که انگار توسط یک پزشک متخصص نوشته شده است.

به ادعاهایی که بی‌اساس هستند، پاورقی‌ها به جایی نمی‌رسند و چت‌بات هرگز اشاره نمی‌کند که خود سوال ممکن است سوال اشتباهی برای پرسیدن باشد.

این سناریو فرضی نیست. تقریباً می‌توان گفت این همان چیزی است که تیمی متشکل از هفت محقق هنگام قرار دادن پنج چت‌بات محبوب جهان در یک تست استرس سیستماتیک اطلاعات سلامت به آن دست یافتند و نتایج آن در مجله BMJ Open منتشر شده است.

از هر کدام از چت‌بات‌های ChatGPT، Gemini، Grok، Meta AI و DeepSeek، 50 سوال در مورد سلامت و پزشکی در مورد سرطان، واکسن‌ها، سلول‌های بنیادی، تغذیه و عملکرد ورزشی پرسیده شد.

دو متخصص به طور مستقل هر پاسخ را ارزیابی کردند. آنها دریافتند که تقریباً 20 درصد از پاسخ‌ها «بسیار مشکل‌ساز»، نیمی از آنها «مشکل‌ساز» و 30 درصد «تا حدودی مشکل‌ساز» بودند.

هیچ یک از چت‌بات‌ها به طور قابل اعتمادی فهرست‌های مرجع کاملاً دقیقی تولید نکردند و تنها دو مورد از 250 سوال به طور کامل از پاسخ دادن امتناع ورزیدند.

در مجموع، هر پنج چت‌بات تقریباً عملکرد یکسانی داشتند. گراک(Grok) بدترین عملکرد را داشت که 58 درصد از پاسخ‌هایش به عنوان «مشکل‌ساز» علامت‌گذاری شد، بالاتر از ChatGPT با 52 درصد و Meta AI با 50 درصد.

با این حال، عملکرد بر اساس موضوع متفاوت بود. چت‌بات‌ها به بهترین شکل واکسن‌ها و سرطان را مدیریت کردند که زمینه‌هایی با بدنه‌های تحقیقاتی بزرگ و ساختاریافته هستند. با این حال تقریباً یک چهارم مواقع پاسخ‌های مشکل‌دار ارائه دادند.

آنها بیشتر در مورد تغذیه و عملکرد ورزشی، حوزه‌هایی که مملو از توصیه‌های متناقض آنلاین هستند و شواهد دقیق در عمل کمتر است، دچار مشکل شدند.

سوالات با پایان باز جایی بودند که واقعاً اوضاع به هم می‌ریخت. 32 درصد از این پاسخ‌ها بسیار مشکل‌ساز ارزیابی شدند، در حالی که فقط 7 درصد برای پاسخ‌های بسته این مشکل را داشتند. این تمایز اهمیت دارد، زیرا اکثر پرسش‌های مربوط به سلامت در دنیای واقعی، پرسش‌های با پایان باز هستند.

مردم از چت‌بات‌ها سوالات درست یا غلط نمی‌پرسند. آنها چیزهایی مانند این می‌پرسند که «کدام مکمل‌ها برای سلامت به صورت کلی بهترین هستند؟» این نوع پرسش، پاسخی روان و مطمئن اما بالقوه مضر را می‌طلبد.

هنگامی که محققان از هر چت‌بات فهرست 10 مرجع علمی را خواستند، میانگین امتیاز کامل بودن آن فهرست فقط 40 درصد بود.

هیچ چت‌باتی در 25 تلاش، حتی یک فهرست مرجع کاملاً دقیق هم ارائه نکرد. خطاها از نویسندگان اشتباه و لینک‌های خراب گرفته تا مقالات کاملاً ساختگی متغیر بود.

این یک خطر خاص است، زیرا منابع مانند مدرک به نظر می‌رسند. یک خواننده غیرحرفه‌ای که یک فهرست استناد با قالب‌بندی منظم را می‌بیند، دلیل کمی برای شک به محتوای آن دارد.

چرا چت‌بات‌ها اشتباه می‌کنند؟

یک دلیل ساده وجود دارد که چرا چت‌بات‌ها پاسخ‌های پزشکی را اشتباه می‌دهند. مدل‌های زبانی همه چیز را نمی‌دانند. آنها بر اساس داده‌های آموزشی و زمینه خود، محتمل‌ترین کلمه بعدی از نظر آماری را پیش‌بینی می‌کنند. آنها شواهد را نمی‌سنجند یا قضاوت ارزشی نمی‌کنند.

مطالب آموزشی آنها شامل مقالات داوری‌شده و همچنین محتوای رِدیت، وبلاگ‌های سلامت و استدلال‌های رسانه‌های اجتماعی است.

محققان سوالات خنثی نپرسیدند. آنها عمداً دستورالعمل‌هایی را طراحی کردند که چت‌بات‌ها را به سمت ارائه پاسخ‌های گمراه‌کننده سوق دهد. این یک تکنیک استاندارد تست استرس در تحقیقات ایمنی هوش مصنوعی است که به عنوان «تیم قرمز» شناخته می‌شود.

این بدان معناست که میزان خطا احتمالاً بیش از آنچه با عبارات خنثی‌تر مواجه می‌شوید، است. این مطالعه همچنین نسخه‌های رایگان هر مدل موجود در فوریه 2025 را آزمایش کرد. نسخه‌های پولی و نسخه‌های جدیدتر ممکن است عملکرد بهتری داشته باشند.

با این حال، اکثر مردم از این نسخه‌های رایگان استفاده می‌کنند و اکثر سوالات مربوط به سلامت با دقت بیان نشده‌اند. شرایط مطالعه نشان می‌دهد که مردم واقعاً چگونه از این ابزارها استفاده می‌کنند.

یافته‌های مقاله به صورت جداگانه وجود ندارند. آنها در میان مجموعه‌ای رو به رشد از شواهد قرار می‌گیرند که تصویری منسجم را ترسیم می‌کنند.

مطالعه‌ای در فوریه 2026 در مجله Nature Medicine نکته‌ای شگفت‌انگیز را نشان داد. خود چت‌بات‌ها تقریباً در ۹۵ درصد مواقع می‌توانستند پاسخ پزشکی صحیح را دریافت کنند، اما وقتی افراد واقعی از همین چت‌بات‌ها استفاده می‌کردند، فقط کمتر از ۳۵ درصد مواقع به پاسخ صحیح می‌رسیدند که بهتر از افرادی که اصلاً از آنها استفاده نمی‌کردند، نبود.

به عبارت ساده، مسئله فقط این نیست که آیا چت‌بات پاسخ صحیح را ارائه می‌دهد یا خیر، بلکه این است که آیا کاربران روزمره می‌توانند آن پاسخ را به درستی درک و استفاده کنند یا خیر.

یک مطالعه اخیر که در مجله Jama Network Open منتشر شده است، ۲۱ مدل هوش مصنوعی پیشرو را آزمایش کرد. محققان از آنها خواستند که تشخیص‌های پزشکی احتمالی را بررسی کنند.

وقتی به مدل‌ها فقط جزئیات اولیه مانند سن، جنسیت و علائم بیمار داده می‌شد، آنها در بیش از ۸۰ درصد مواقع در ارائه مجموعه صحیحی از شرایط ممکن شکست می‌خوردند، اما هنگامی که محققان یافته‌های معاینه و نتایج آزمایشگاهی را وارد کردند، دقت به بالای ۹۰ درصد رسید.

در همین حال، یک مطالعه دیگر در ایالات متحده که در مجله Nature Communications Medicine منتشر شده است، نشان داد که چت‌بات‌ها به راحتی اصطلاحات پزشکی ساختگی را تکرار و حتی در مورد آنها توضیح می‌دهند.

روی هم رفته، این مطالعات نشان می‌دهند که نقاط ضعف موجود در مطالعه جدید، ویژگی‌های یک روش تجربی نیستند، بلکه منعکس کننده چیزی اساسی‌تر در مورد جایگاه امروز فناوری هستند.

این چت‌بات‌ها از بین نمی‌روند و نباید هم بروند. آنها می‌توانند موضوعات پیچیده را خلاصه کنند، به تهیه سوالات برای پزشکان کمک کنند و به عنوان نقطه شروعی برای تحقیق عمل کنند، اما این مطالعه به روشنی بیان می‌کند که نباید با آنها به عنوان مراجع پزشکی مستقل رفتار شود.

اگر از یکی از این چت‌بات‌ها برای مشاوره پزشکی استفاده می‌کنید، هرگونه ادعای سلامتی که ارائه می‌دهد را بررسی کنید، ارجاعات آن را به عنوان پیشنهادهایی برای بررسی به جای واقعیت در نظر نگیرید و توجه کنید که پاسخ، مطمئن به نظر می‌رسد، اما هیچ سلب مسئولیتی ارائه نمی‌دهد.


اخبار مرتبط
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
دوشنبه 1405/02/07 ساعت 09:33
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
یک پژوهش تازه نشان می‌دهد کاربران پاسخ‌های سریع چت‌بات‌ها را عجولانه می‌دانند و اندکی تأخیر در ارائه پاسخ باعث می‌شود همان پاسخ‌ها دقیق‌تر، باکیفیت‌تر و «هوشمندانه‌تر» ارزیابی شود.
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
جمعه 1405/02/04 ساعت 22:31
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
یک شبکه اجتماعی علمی جدید با نام Agent4Science راه‌اندازی شده که در آن تنها عامل‌های مبتنی بر هوش مصنوعی می‌توانند مقالات پژوهشی را منتشر کرده و درباره آن‌ها به بحث بپردازند.
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
جمعه 1405/02/04 ساعت 21:40
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
تراشه‌ طراحی‌شده توسط دکتر «بابک باخیت» که با الهام از مغز ساخته شده است، می‌تواند مصرف انرژی هوش مصنوعی را کاهش دهد و ماشین‌ها را هوشمندتر و سازگارتر کند.
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
دوشنبه 1405/01/24 ساعت 17:14
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
در حالی که چین و روسیه و دیگران رقابت خود را بر سر سلاح‌ها و سیستم‌های نظامی مبتنی بر هوش مصنوعی افزایش داده‌اند، مقامات دفاعی آمریکا اذعان کرده‌اند که در این مسیر عقب افتاده‌اند.
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
دوشنبه 1405/01/24 ساعت 01:05
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
نهادهای مالی انگلیس شامل بانک مرکزی، نهاد ناظر مالی و وزارت خزانه‌داری این کشور، در حال برگزاری نشست‌های فوری با مرکز ملی امنیت سایبری هستند تا خطرات احتمالی ناشی از جدیدترین مدل هوش مصنوعی شرکت آنتروپیک را ارزیابی کنند.
نظرات

آخرین اخبار
عراقچی: فقدان حسن‌نیت و عدم صداقت آمریکا مهمترین مانع برای پایان قطعی جنگ است
وقوع دو زمین‌لرزه در پردیس، تهران و کرج
کشف بقایای موشک‌های هدایت‌شونده و پایگاه مشکوک در صحرای نجف
رایزنی بغداد و اسلام‌آباد برای امنیت انتقال سوخت با ایران
ترامپ عازم چین شد
آتش‌سوزی در مقر ارتش اسرائیل در پی حمله پهپادی حزب‌الله
فولاد مبارکه واردکننده ورق می‌شود
اکبر عبدی بر اثر سکته قلبی در ICU بستری شد/مهران غفوریان: برای اکبر عبدی دعا کنید
نورنما | الگوی جدید مدارس هیئت امنایی با مشارکت اجرا می شود
رد ادعای بی‌اساس کویت در رابطه با 4 شهروند ایرانی
یک منبع آگاه: تحقق شروط پنج‌گانه ایران برای ورود به دور دوم مذاکرات
نورنما | افزایش هزینه تولید: دارو تا 300 درصد گران شد
پاسخ ترامپ به انتقاد گراهام: پاکستانی‌ها عالی هستند
تخلیه مجروحان ارتش اسرائیل با بالگرد در پی عملیات‌های انتحاری مقاومت لبنان
گراهام به دنبال میانجیگر دیگری به جز اسلام آباد
نورنما | بازسازی 40 هزار واحد آسیب دیده در دستور کار قرار گرفت
نورنما | تسهیل روند رسیدگی به خودروهای آسیب دیده در جنگ و اعزام کارشناس پلیس به پارکینگ ها
تأکید پاکستان و چین بر امنیت تنگه هرمز و برقراری آتش‌بس پایدار در منطقه
طوفان و گردوخاک در تهران با چند مصدوم/ وزش باد به 55 کیلومتر بر ساعت رسید
نورنما | افزایش هزینه تولید: دارو تا 300 درصد گران شد
روسیه: فشار غرب برای تحریم انرژی مسکو «استثمارگرانه» است
نورنما | افزایش بودجه بیمه ها برای جلوگیری از گرانی دارو و کاهش پرداختی مردم ضروری است
«مرد سه‌هزار چهره» در راه تلویزیون/ بازگشت مسعود شصت‌چی
شکست پروژه نظامی ترامپ علیه ایران به روایت سناتور دموکرات
اعتراض ضدجنگ در سنای آمریکا/جلسه بودجه جنگ علیه ایران مختل شد
سفیر ایران در پکن: آمریکا نمی‌تواند روابط تهران و چین را تضعیف کند
پکن میزبان ترامپ؛ گفت‌وگو درباره ایران و تایوان
عقب‌نشینی از شعار سرنگونی به میز مذاکره
انتقاد تند عضو کمیسیون صنایع مجلس از گرانی خودرو/ قوه قضائیه ورود کند
افشاگری جو کنت از پشت‌پرده شکست طرح‌های ضدایرانی واشنگتن
روسیه از آزمایش موفق موشک پیشرفته «سارمات» خبر داد
غریب‌آبادی: صلح با ادبیات تحقیر و امتیازگیری اجباری ساخته نمی‌شود
توقف 6 ماهه 20 هزار پرواز لوفت‌هانزا
توافق نهایی برای اجرای گام سوم افزایش حقوق و متناسب‌سازی حقوق بازنشستگان+ جزئیات
فردا؛ خنثی‌سازی پرتابه‌های عمل‌نکرده در بندرعباس
سقوط محبوبیت اقتصادی ترامپ
اولویت بانک مرکزی در 1405، تأمین مالی تولید همراه با کنترل تورم
سخنگوی دولت: اینترنت را حق مردم می‌دانیم
انفجارهای کنترل‌شده در تبریز برای امحای مهمات جنگی
کویت سفیر ایران را احضار کرد
برتری قاطع تیم سفید در آخرین بازی درون‌گروهی ملی‌پوشان
سازمان ملل: قانون اعدام اسرای حماس تبعیض‌آمیز است
افشای سانسور در دولت ترامپ درباره هزینه سنگین حملات ایران
پزشکیان: ثبوتی از پیشگامان توسعه علمی معاصر ایران است
تنگه هرمز میدان سنجش صداقت مدعیان امنیت جهانی
تحلیل «یدیعوت آحارانوت» از بن‌بست در مذاکرات تهران و واشنگتن
وزیر صمت: برنامه ویژه ای برای کنترل بازار و مقابله با احتکار تدوین شد
حمله جنگنده‌های صهیونیستی به «نبطیه» و «سحمر»
نشان افتخار واتیکان بر سینه سفیر ایران نشست
ضربات سنگین سپاه تهران به 5 شبکه قاچاق سلاح وابسته به رژیم صهیونی