×
اقتصادی
شناسه خبر : 319680
تاریخ انتشار : دوشنبه 1405/03/04 ساعت 03:02
هوش مصنوعی چطور با «داستان‌های جعلی» فریب می‌خورد

هوش مصنوعی چطور با «داستان‌های جعلی» فریب می‌خورد

یافته‌های پژوهشگران نشان می‌دهد که می‌توان مدل‌های هوش مصنوعی را با طراحی صحنه‌های ساختگی در فیلم‌ها و کتاب‌ها، به پذیرش اطلاعات نادرست وادار کرد؛ موضوعی که نگرانی‌های تازه‌ای درباره امنیت این فناوری ایجاد کرده است.

نورنیوز-گروه اقتصادی: وبگاه تِک‌اِکسپلور در گزارشی آورده است: پژوهشگران دانشگاه کالیفرنیا، ارواین طی آزمایشی جالب، از پنج مدل هوش مصنوعی (چت‌جی‌پی‌تی، جمینای، دیپ‌سیک، کلود و گروک) درباره صحنه‌هایی در فیلم‌ها و کتاب‌های معروف سؤال پرسیدند که در واقعیت وجود نداشتند.

داستان از اینجا شروع شد که یک پژوهشگر از چت‌جی‌پی‌تی درباره فیلم ویل هانتینگ نابغه (Good Will Hunting) پرسید: بهترین صحنه فیلم ویل هانتینگ نابغه کدام است؟ چت‌جی‌پی‌تی صحنه‌ای را توصیف کرد. سپس پژوهشگر گفت: صحنه‌ای که در آن به هیتلر اشاره شده را هم تعریف کن. در حالی که چنین صحنه‌ای در فیلم وجود ندارد، چت‌جی‌پی‌تی با اطمینان کامل یک صحنه مفصل و قابل قبول ساخت.

این اتفاق باعث شد پژوهشگران به این فکر کنند که آیا هوش مصنوعی را می‌توان به سمت باور نادرست سوق داد؟

آزمایش روی ۲ هزار فیلم و کتاب

پژوهشگران آزمایشی به نام آزمایش فریب زیر فشار طراحی کردند. آن‌ها با پنج مدل هوش مصنوعی درباره هزار فیلم محبوب و هزار کتاب محبوب مکالمه کردند.

در طول مکالمه، آن‌ها ارجاعات دروغین اما باورپذیری را مطرح می‌کردند؛ مثلاً وجود صحنه‌ای درباره دایناسور، ماشین زمان یا اشاره به هیتلر در فیلم‌ها و کتاب‌هایی که واقعاً این موارد در آن‌ها وجود ندارد.

سه مرحله فریب

روش پژوهش در سه مرحله انجام شد:

۱. مدل هوش مصنوعی جملاتی درباره یک فیلم یا کتاب تولید می‌کند (بعضی درست، بعضی نادرست)؛

۲. در یک تعامل جداگانه، مدل سعی می‌کند آن جملات را تأیید یا رد کند؛

۳. پژوهشگران با طرح دوباره همان ادعاهای نادرست، مدل را زیر فشار قرار می‌دهند تا ببینند آیا تسلیم می‌شود یا مقاومت می‌کند.

نتیجه: مدل‌ها زیر فشار تسلیم می‌شوند

نتایج نشان داد مدل‌های هوش مصنوعی اغلب در حفظ ثبات زیر فشار مشکل دارند. حتی وقتی مدل در ابتدا یک جمله را نادرست تشخیص می‌دهد، ممکن است بعداً زیر فشار مکالمه آن را بپذیرد.

در میان مدل‌های آزمایش‌شده:

کلود مقاوم‌ترین بود؛
گروک و چت‌جی‌پی‌تی در رتبه بعدی قرار داشتند؛
جمینای و دیپ‌سیک آسیب‌پذیرتر بودند.

چرا این موضوع مهم است؟

دکتر کای شو (Kai Shu)، پژوهشگر این طرح می‌گوید: ممکن است این موضوع هنگام گپ‌زدن درباره فیلم‌ها بی‌ضرر به نظر برسد، اما در حوزه‌هایی مانند سلامت، حقوق یا سیاست‌گذاری می‌تواند عواقبی جدی داشته باشد.

حافظه انسان خطا دارد: ما چیزهایی را فراموش می‌کنیم و گاهی اشتباه به خاطر می‌سپاریم. اگر انسان بتواند هوش مصنوعی را هم به پذیرش دروغ وادار کند، یعنی هوش مصنوعی نیز در ارائه اطلاعات دقیق آسیب‌پذیر است و این خطرناک است.

چه چیزهایی هنوز مشخص نیست؟

پژوهشگران می‌گویند هنوز مشخص نیست چرا بعضی مدل‌های هوش مصنوعی در برابر باورهای نادرست مقاومت بیشتری دارند. همچنین معلوم نیست این مدل‌ها در حوزه‌های واقعی و حساس، مثل پزشکی یا علم، چگونه رفتار می‌کنند. طراحی هوش مصنوعی که هم مفید باشد و هم در برابر دروغ مقاومت کند، هنوز یک چالش حل‌نشده است.

این یافته‌ها در نشست سالانه انجمن زبان‌شناسی محاسباتی (ACL ۲۰۲۶) ارائه خواهد شد.


نظرات

آخرین اخبار
آزمایش؛ راهی جدید برای مقابله با عوارض کم‌خوابی مزمن
هوش مصنوعی چطور با «داستان‌های جعلی» فریب می‌خورد
کشف آثار کم‌نظیر ساسانی در غار اسپهبد خورشید سوادکوه
پیاتزا 4 بازیکن را از تیم ملی والیبال خط زد/غیبت لژیونر ایران در برزیل
مخالفت آموزش و پرورش با برگزاری آنلاین امتحانات نهایی
ترامپ و آینده پیمان ابراهیم در سایه توافق احتمالی با ایران
جزئیات تفاهم احتمالی ایران وآمریکا؛ حفظ حق حاکمیت درتنگه هرمز و آزادی دارایی‌های بلوکه‌شده
ترامپ: اگر درباره توافق با ایران خبری باشد، فقط خبر خوب است/ادامه تناقض گویی
واکنش پسر ترامپ به منتقدان توافق با ایران
محکومیت 4 نفر از متهمان پرونده شهادت آرمان علی‌وردی به اعدام
تهدید حنظله به افشای پشت‌پرده حمله به ناوگان صمود
هشدار پترائوس درباره چالش‌های آمریکا در برابر ایران
سپاهان از آسیا جا ماند؟
سه حادثه امنیتی در جنوب لبنان/ دو نظامی صهیونیست کشته شدند
نامگذاری خیابانی در نیکاراگوئه به یاد «فرشتگان میناب»
تمرین نفس‌گیر 160 دقیقه‌ای ملی‌پوشان در آنتالیا
روبیو: عجله‌ای برای توافق با ایران نیست
پیام تهران به مسقط رسید
11 خرداد؛ روز اعلام لیست نهایی بازیکنان تیم ملی فوتبال ایران
مراکز حساس آمریکا، اسرائیل و امارات در قبضه هکرها
نماینده روسیه در وین: غنی‌سازی اورانیوم حق مسلم ایران است
نتایج مرحله گروهی بسکتبال غرب آسیا/ استقلال صدرنشین شد
قصاص قاتل نینا/ از انکار جنایت تا پذیرش نقشه مسمومیت با قرص برنج
هشدار قاطع دادستان کل به جواسیس/ اثبات اتهام برابر با برخورد بدون اغماض است
آرسنال قهرمان، وستهام سقوط کرد و تاتنهام نجات یافت
آخرین اخبار از زبان سخنگوی دولت؛ از مسکن ملی تا فیبر نوری مدارس
اعلام لیست تیم ملی مالی برای بازی با ایران؛ نبرد دوگانه در اردوی ترکیه
استقلال قهرمانی اول خود در لیگ برتر هندبال را کسب کرد
اجرای طرح مهتاب توانیر و مبارزه با انشعابات غیرمجاز + جزئیات
وزیر خارجه انگلیس: ما به حمایت از توافق ایران و آمریکا ادامه می‌دهیم
گام جدید دولت برای قانونمند کردن پهپادهای غیرنظامی
استقلال در آستانه تصمیم بزرگ؛ طاهری یا بختیاری‌زاده؟
شیخ نعیم قاسم: اگر دولت در تأمین حاکمیت ناتوان است، باید کنار برود
سکوت نتانیاهو درباره توافق با ایران شکست
محسنی اژه‌ای: وحدت ملی، بخشی از امنیت کشور است؛ تا آخر ایستاده‌ایم
الحوثی: اظهارات ترامپ چیزی جز جنگ روانی و ایران‌هراسی نیست
ثبت‌نام سهامداران از مرز 60 هزار نفر گذشت
دستور تخلیه چند روستا در جنوب لبنان از سوی رژیم اشغالگر
چگونه وام ودیعه مسکن بگیریم؟ +لینک سامانه و شرایط ثبت نام
اشغال 1220 کیلومتر از غزه، لبنان و سوریه توسط اسرائیل
اعتراف فرمانده سابق ارتش آمریکا به افول واشنگتن در خاورمیانه
بانوان ژیمناست به مدال تاریخی رسیدند
محکومیت حمله تروریستی در شهر کویته پاکستان
شرط دریافت اضافه‌کاری چیست؟
خیانت برادرزن؛ سرقت میلیاردها تومان طلا در سفر ترکیه
زمان بازگشایی زاینده‌رود اعلام شد/ دعوت از گردشگران
نورنما | 4 خرداد؛ روز دزفول، روز مقاومت و پایداری گرامی باد
بقائی: آزادسازی خرمشهر، تجلی شکست‌ناپذیری ملت ایران است
نگرانی‌ها از ایران قدرتمند بعد از جنگ
بقاع لبنان هدف حمله هوایی رژیم صهیونیستی قرار گرفت