×
اجتماعی
شناسه خبر : 311914
تاریخ انتشار : چهارشنبه 1405/02/02 ساعت 08:48
چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

چرا نباید از هوش مصنوعی مشورت پزشکی بگیریم؟

نتایج یک مطالعه نشان می‌دهد هوش مصنوعی در حدود نیمی از موارد، توصیه‌های نامناسب یا مشکل‌ساز درباره سلامت ارائه می‌کند و کارشناسان تأکید دارند تصمیم‌های پزشکی باید بر پایه نظر پزشک متخصص اتخاذ شود.

 نورنیوز-گروه اجتماعی:تصور کنید که دور از جانتان به تازگی سرطان در مراحل اولیه در شما تشخیص داده شده است و قبل از ملاقات بعدی با پزشکتان، سوالی را در یک چت‌بات هوش مصنوعی تایپ می‌کنید مبنی بر اینکه «کدام کلینیک‌ها می‌توانند سرطان را با موفقیت درمان کنند؟»

در عرض چند ثانیه، پاسخی شسته‌رفته و پاورقی‌دار دریافت می‌کنید که انگار توسط یک پزشک متخصص نوشته شده است.

به ادعاهایی که بی‌اساس هستند، پاورقی‌ها به جایی نمی‌رسند و چت‌بات هرگز اشاره نمی‌کند که خود سوال ممکن است سوال اشتباهی برای پرسیدن باشد.

این سناریو فرضی نیست. تقریباً می‌توان گفت این همان چیزی است که تیمی متشکل از هفت محقق هنگام قرار دادن پنج چت‌بات محبوب جهان در یک تست استرس سیستماتیک اطلاعات سلامت به آن دست یافتند و نتایج آن در مجله BMJ Open منتشر شده است.

از هر کدام از چت‌بات‌های ChatGPT، Gemini، Grok، Meta AI و DeepSeek، 50 سوال در مورد سلامت و پزشکی در مورد سرطان، واکسن‌ها، سلول‌های بنیادی، تغذیه و عملکرد ورزشی پرسیده شد.

دو متخصص به طور مستقل هر پاسخ را ارزیابی کردند. آنها دریافتند که تقریباً 20 درصد از پاسخ‌ها «بسیار مشکل‌ساز»، نیمی از آنها «مشکل‌ساز» و 30 درصد «تا حدودی مشکل‌ساز» بودند.

هیچ یک از چت‌بات‌ها به طور قابل اعتمادی فهرست‌های مرجع کاملاً دقیقی تولید نکردند و تنها دو مورد از 250 سوال به طور کامل از پاسخ دادن امتناع ورزیدند.

در مجموع، هر پنج چت‌بات تقریباً عملکرد یکسانی داشتند. گراک(Grok) بدترین عملکرد را داشت که 58 درصد از پاسخ‌هایش به عنوان «مشکل‌ساز» علامت‌گذاری شد، بالاتر از ChatGPT با 52 درصد و Meta AI با 50 درصد.

با این حال، عملکرد بر اساس موضوع متفاوت بود. چت‌بات‌ها به بهترین شکل واکسن‌ها و سرطان را مدیریت کردند که زمینه‌هایی با بدنه‌های تحقیقاتی بزرگ و ساختاریافته هستند. با این حال تقریباً یک چهارم مواقع پاسخ‌های مشکل‌دار ارائه دادند.

آنها بیشتر در مورد تغذیه و عملکرد ورزشی، حوزه‌هایی که مملو از توصیه‌های متناقض آنلاین هستند و شواهد دقیق در عمل کمتر است، دچار مشکل شدند.

سوالات با پایان باز جایی بودند که واقعاً اوضاع به هم می‌ریخت. 32 درصد از این پاسخ‌ها بسیار مشکل‌ساز ارزیابی شدند، در حالی که فقط 7 درصد برای پاسخ‌های بسته این مشکل را داشتند. این تمایز اهمیت دارد، زیرا اکثر پرسش‌های مربوط به سلامت در دنیای واقعی، پرسش‌های با پایان باز هستند.

مردم از چت‌بات‌ها سوالات درست یا غلط نمی‌پرسند. آنها چیزهایی مانند این می‌پرسند که «کدام مکمل‌ها برای سلامت به صورت کلی بهترین هستند؟» این نوع پرسش، پاسخی روان و مطمئن اما بالقوه مضر را می‌طلبد.

هنگامی که محققان از هر چت‌بات فهرست 10 مرجع علمی را خواستند، میانگین امتیاز کامل بودن آن فهرست فقط 40 درصد بود.

هیچ چت‌باتی در 25 تلاش، حتی یک فهرست مرجع کاملاً دقیق هم ارائه نکرد. خطاها از نویسندگان اشتباه و لینک‌های خراب گرفته تا مقالات کاملاً ساختگی متغیر بود.

این یک خطر خاص است، زیرا منابع مانند مدرک به نظر می‌رسند. یک خواننده غیرحرفه‌ای که یک فهرست استناد با قالب‌بندی منظم را می‌بیند، دلیل کمی برای شک به محتوای آن دارد.

چرا چت‌بات‌ها اشتباه می‌کنند؟

یک دلیل ساده وجود دارد که چرا چت‌بات‌ها پاسخ‌های پزشکی را اشتباه می‌دهند. مدل‌های زبانی همه چیز را نمی‌دانند. آنها بر اساس داده‌های آموزشی و زمینه خود، محتمل‌ترین کلمه بعدی از نظر آماری را پیش‌بینی می‌کنند. آنها شواهد را نمی‌سنجند یا قضاوت ارزشی نمی‌کنند.

مطالب آموزشی آنها شامل مقالات داوری‌شده و همچنین محتوای رِدیت، وبلاگ‌های سلامت و استدلال‌های رسانه‌های اجتماعی است.

محققان سوالات خنثی نپرسیدند. آنها عمداً دستورالعمل‌هایی را طراحی کردند که چت‌بات‌ها را به سمت ارائه پاسخ‌های گمراه‌کننده سوق دهد. این یک تکنیک استاندارد تست استرس در تحقیقات ایمنی هوش مصنوعی است که به عنوان «تیم قرمز» شناخته می‌شود.

این بدان معناست که میزان خطا احتمالاً بیش از آنچه با عبارات خنثی‌تر مواجه می‌شوید، است. این مطالعه همچنین نسخه‌های رایگان هر مدل موجود در فوریه 2025 را آزمایش کرد. نسخه‌های پولی و نسخه‌های جدیدتر ممکن است عملکرد بهتری داشته باشند.

با این حال، اکثر مردم از این نسخه‌های رایگان استفاده می‌کنند و اکثر سوالات مربوط به سلامت با دقت بیان نشده‌اند. شرایط مطالعه نشان می‌دهد که مردم واقعاً چگونه از این ابزارها استفاده می‌کنند.

یافته‌های مقاله به صورت جداگانه وجود ندارند. آنها در میان مجموعه‌ای رو به رشد از شواهد قرار می‌گیرند که تصویری منسجم را ترسیم می‌کنند.

مطالعه‌ای در فوریه 2026 در مجله Nature Medicine نکته‌ای شگفت‌انگیز را نشان داد. خود چت‌بات‌ها تقریباً در ۹۵ درصد مواقع می‌توانستند پاسخ پزشکی صحیح را دریافت کنند، اما وقتی افراد واقعی از همین چت‌بات‌ها استفاده می‌کردند، فقط کمتر از ۳۵ درصد مواقع به پاسخ صحیح می‌رسیدند که بهتر از افرادی که اصلاً از آنها استفاده نمی‌کردند، نبود.

به عبارت ساده، مسئله فقط این نیست که آیا چت‌بات پاسخ صحیح را ارائه می‌دهد یا خیر، بلکه این است که آیا کاربران روزمره می‌توانند آن پاسخ را به درستی درک و استفاده کنند یا خیر.

یک مطالعه اخیر که در مجله Jama Network Open منتشر شده است، ۲۱ مدل هوش مصنوعی پیشرو را آزمایش کرد. محققان از آنها خواستند که تشخیص‌های پزشکی احتمالی را بررسی کنند.

وقتی به مدل‌ها فقط جزئیات اولیه مانند سن، جنسیت و علائم بیمار داده می‌شد، آنها در بیش از ۸۰ درصد مواقع در ارائه مجموعه صحیحی از شرایط ممکن شکست می‌خوردند، اما هنگامی که محققان یافته‌های معاینه و نتایج آزمایشگاهی را وارد کردند، دقت به بالای ۹۰ درصد رسید.

در همین حال، یک مطالعه دیگر در ایالات متحده که در مجله Nature Communications Medicine منتشر شده است، نشان داد که چت‌بات‌ها به راحتی اصطلاحات پزشکی ساختگی را تکرار و حتی در مورد آنها توضیح می‌دهند.

روی هم رفته، این مطالعات نشان می‌دهند که نقاط ضعف موجود در مطالعه جدید، ویژگی‌های یک روش تجربی نیستند، بلکه منعکس کننده چیزی اساسی‌تر در مورد جایگاه امروز فناوری هستند.

این چت‌بات‌ها از بین نمی‌روند و نباید هم بروند. آنها می‌توانند موضوعات پیچیده را خلاصه کنند، به تهیه سوالات برای پزشکان کمک کنند و به عنوان نقطه شروعی برای تحقیق عمل کنند، اما این مطالعه به روشنی بیان می‌کند که نباید با آنها به عنوان مراجع پزشکی مستقل رفتار شود.

اگر از یکی از این چت‌بات‌ها برای مشاوره پزشکی استفاده می‌کنید، هرگونه ادعای سلامتی که ارائه می‌دهد را بررسی کنید، ارجاعات آن را به عنوان پیشنهادهایی برای بررسی به جای واقعیت در نظر نگیرید و توجه کنید که پاسخ، مطمئن به نظر می‌رسد، اما هیچ سلب مسئولیتی ارائه نمی‌دهد.


اخبار مرتبط
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
دوشنبه 1405/02/07 ساعت 09:33
تأخیر کوتاه در پاسخ هوش مصنوعی، آن را باهوش‌تر جلوه می‌دهد
یک پژوهش تازه نشان می‌دهد کاربران پاسخ‌های سریع چت‌بات‌ها را عجولانه می‌دانند و اندکی تأخیر در ارائه پاسخ باعث می‌شود همان پاسخ‌ها دقیق‌تر، باکیفیت‌تر و «هوشمندانه‌تر» ارزیابی شود.
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
جمعه 1405/02/04 ساعت 22:31
شبکه اجتماعی که ورود انسان ها به آن ممنوع است
یک شبکه اجتماعی علمی جدید با نام Agent4Science راه‌اندازی شده که در آن تنها عامل‌های مبتنی بر هوش مصنوعی می‌توانند مقالات پژوهشی را منتشر کرده و درباره آن‌ها به بحث بپردازند.
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
جمعه 1405/02/04 ساعت 21:40
کاهش 70درصدی مصرف انرژی هوش مصنوعی، شاهکار دانشمند ایرانی
تراشه‌ طراحی‌شده توسط دکتر «بابک باخیت» که با الهام از مغز ساخته شده است، می‌تواند مصرف انرژی هوش مصنوعی را کاهش دهد و ماشین‌ها را هوشمندتر و سازگارتر کند.
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
دوشنبه 1405/01/24 ساعت 17:14
عقب‌ماندگی آمریکایی ها در تولید سلاح مبتنی بر هوش‌ مصنوعی
در حالی که چین و روسیه و دیگران رقابت خود را بر سر سلاح‌ها و سیستم‌های نظامی مبتنی بر هوش مصنوعی افزایش داده‌اند، مقامات دفاعی آمریکا اذعان کرده‌اند که در این مسیر عقب افتاده‌اند.
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
دوشنبه 1405/01/24 ساعت 01:05
نگرانی انگلیس از سوء استفاده از مدل جدید هوش مصنوعی
نهادهای مالی انگلیس شامل بانک مرکزی، نهاد ناظر مالی و وزارت خزانه‌داری این کشور، در حال برگزاری نشست‌های فوری با مرکز ملی امنیت سایبری هستند تا خطرات احتمالی ناشی از جدیدترین مدل هوش مصنوعی شرکت آنتروپیک را ارزیابی کنند.
نظرات

آخرین اخبار
دیدار وزیر خارجه قزاقستان با وزیر امور خارجه جمهوری اسلامی ایران
پزشکیان با سران کدام کشورهای حاضر در تهران دیدار کرد؟
تأکید تهران و اسلام‌آباد بر گسترش همکاری‌های دفاعی
تمام ظرفیت‌های امدادی کشور در آماده‌باش مراسم وداع
اختلاف برلین و واشنگتن بر سر هزینه‌های دفاعی ناتو
هشدار شدید یمن به عربستان؛ پاسخ قاطع در راه است
انهدام تیم تروریستی در تفتان؛ 2 تروریست کشته شدند
پزشکیان: تدبیر اقلیم کردستان توطئه‌ها در مرزهای غربی ما را خنثی کرد
فرمانده ارتش پاکستان با عراقچی دیدار کرد
شایعه درگذشت عطاالله مهاجرانی تکذیب شد
پرواز تهران–صنعا پس از 10 سال انجام شد
توسعه همکاری‌های اقتصادی و ترانزیتی ایران و ازبکستان باید شتاب بگیرد
دعوت ولایتی از مردم و جبهه مقاومت برای حضور در تشییع و وداع رهبر شهید
نبض جام | ویژه برنامه روزانه نورنیوز برای جام جهانی 2026 / قسمت بیست و پنجم
اسرائیل ترور مقامات ایرانی را تکذیب کرد
رسانه صهیونیستی: قدرت نظامی مصر اسرائیل را نگران کرده است
قیمت طلا و سکه امروز 12 تیر 1405
پیکر شهید مصباح‌الهدی باقری‌کنی تشییع شد
قیمت خودرو در بازار آزاد امروز جمعه 12 تیر 1405 + جدول
تشییع رهبر شهید رقبای منطقه را کنار هم نشاند
مجموعه نمایشی «دیدار» روی آنتن شبکه یک می‌رود
رسانه آمریکایی: اروپا با پرداخت عوارض تنگه هرمز کنار آمد
7 خواننده مطرح با آلبوم «بدرقه» برای رهبر شهید ایران خواندند
جودت یلماز: ملت ترکیه در غم و اندوه ملت ایران شریک است
رهبر شهید تمدن ساز
چه رازی جهان را به تهران کشاند؟
سامانه 137 پلاس برای مراسم تشییع رهبر شهید فعال شد
استقرار 1500 دستگاه تاکسی‌ون رایگان + مسیرها
پزشکیان: ایران مقابل هیچ قلدری سرخم نمی‌کند
حمله نظامیان اسرائیلی به نمازگزاران در بیت‌لحم
رئیس پارلمان لبنان: اجرای تفاهم اسلام‌آباد تنها راه پایان اشغالگری است
دو زلزله پیاپی مرز فارس و هرمزگان را لرزاند
دعوت حزب مردم‌سالاری به حضور در تشییع رهبر شهید
مذاکرات ایران برای فروش نفت به شرکت‌های ژاپنی
اشک ملت‌ها بر پیکر رهبر شهید؛ ادای احترام شخصیت‌های سیاسی و مذهبی از سراسر جهان
فراخوان مراکز علمی برای حضور در مراسم وداع رهبر شهید
هیات اقتصادی ایران به‌زودی راهی پاکستان می‌شود
نبض جام | ویژه برنامه روزانه نورنیوز برای جام جهانی 2026 / قسمت بیست و چهارم
محدودیت ترافیکی جاده چالوس لغو شد
معاون اردوغان: رئیس‌جمهور ترکیه راهی تهران می‌شود
منوچهر فربد بازیگر قدیمی از دنیا رفت
غریب‌آبادی: انکار مسئولیت، جنایت دوم آمریکا در حمله به هواپیمای مسافربری ایران بود
ان بی سی گزارش ویژه‌ای از تشییع رهبر شهید منتشر می‌کند
وزیر خارجه پیشین استرالیا: نتانیاهو مانع اصلی صلح است
رئیس‌جمهور: تهران و دوشنبه همکاری‌ها را گسترش می‌دهند
پروازها به فرودگاه قشم بازگشتند
انتشار فهرست پارکینگ‌ها و محل جابه‌جایی زائران به مترو + جدول
هشدار محیط‌زیست؛ کیفیت هوای تهران افت می‌کند
بازتاب گسترده وداع با رهبر شهید در رسانه‌های خارجی
کاخ گلستان میزبان رسانه‌های بین‌المللی شد