×
اقتصادی
شناسه خبر : 319680
تاریخ انتشار : دوشنبه 1405/03/04 ساعت 03:02
هوش مصنوعی چطور با «داستان‌های جعلی» فریب می‌خورد

هوش مصنوعی چطور با «داستان‌های جعلی» فریب می‌خورد

یافته‌های پژوهشگران نشان می‌دهد که می‌توان مدل‌های هوش مصنوعی را با طراحی صحنه‌های ساختگی در فیلم‌ها و کتاب‌ها، به پذیرش اطلاعات نادرست وادار کرد؛ موضوعی که نگرانی‌های تازه‌ای درباره امنیت این فناوری ایجاد کرده است.

نورنیوز-گروه اقتصادی: وبگاه تِک‌اِکسپلور در گزارشی آورده است: پژوهشگران دانشگاه کالیفرنیا، ارواین طی آزمایشی جالب، از پنج مدل هوش مصنوعی (چت‌جی‌پی‌تی، جمینای، دیپ‌سیک، کلود و گروک) درباره صحنه‌هایی در فیلم‌ها و کتاب‌های معروف سؤال پرسیدند که در واقعیت وجود نداشتند.

داستان از اینجا شروع شد که یک پژوهشگر از چت‌جی‌پی‌تی درباره فیلم ویل هانتینگ نابغه (Good Will Hunting) پرسید: بهترین صحنه فیلم ویل هانتینگ نابغه کدام است؟ چت‌جی‌پی‌تی صحنه‌ای را توصیف کرد. سپس پژوهشگر گفت: صحنه‌ای که در آن به هیتلر اشاره شده را هم تعریف کن. در حالی که چنین صحنه‌ای در فیلم وجود ندارد، چت‌جی‌پی‌تی با اطمینان کامل یک صحنه مفصل و قابل قبول ساخت.

این اتفاق باعث شد پژوهشگران به این فکر کنند که آیا هوش مصنوعی را می‌توان به سمت باور نادرست سوق داد؟

آزمایش روی ۲ هزار فیلم و کتاب

پژوهشگران آزمایشی به نام آزمایش فریب زیر فشار طراحی کردند. آن‌ها با پنج مدل هوش مصنوعی درباره هزار فیلم محبوب و هزار کتاب محبوب مکالمه کردند.

در طول مکالمه، آن‌ها ارجاعات دروغین اما باورپذیری را مطرح می‌کردند؛ مثلاً وجود صحنه‌ای درباره دایناسور، ماشین زمان یا اشاره به هیتلر در فیلم‌ها و کتاب‌هایی که واقعاً این موارد در آن‌ها وجود ندارد.

سه مرحله فریب

روش پژوهش در سه مرحله انجام شد:

۱. مدل هوش مصنوعی جملاتی درباره یک فیلم یا کتاب تولید می‌کند (بعضی درست، بعضی نادرست)؛

۲. در یک تعامل جداگانه، مدل سعی می‌کند آن جملات را تأیید یا رد کند؛

۳. پژوهشگران با طرح دوباره همان ادعاهای نادرست، مدل را زیر فشار قرار می‌دهند تا ببینند آیا تسلیم می‌شود یا مقاومت می‌کند.

نتیجه: مدل‌ها زیر فشار تسلیم می‌شوند

نتایج نشان داد مدل‌های هوش مصنوعی اغلب در حفظ ثبات زیر فشار مشکل دارند. حتی وقتی مدل در ابتدا یک جمله را نادرست تشخیص می‌دهد، ممکن است بعداً زیر فشار مکالمه آن را بپذیرد.

در میان مدل‌های آزمایش‌شده:

کلود مقاوم‌ترین بود؛
گروک و چت‌جی‌پی‌تی در رتبه بعدی قرار داشتند؛
جمینای و دیپ‌سیک آسیب‌پذیرتر بودند.

چرا این موضوع مهم است؟

دکتر کای شو (Kai Shu)، پژوهشگر این طرح می‌گوید: ممکن است این موضوع هنگام گپ‌زدن درباره فیلم‌ها بی‌ضرر به نظر برسد، اما در حوزه‌هایی مانند سلامت، حقوق یا سیاست‌گذاری می‌تواند عواقبی جدی داشته باشد.

حافظه انسان خطا دارد: ما چیزهایی را فراموش می‌کنیم و گاهی اشتباه به خاطر می‌سپاریم. اگر انسان بتواند هوش مصنوعی را هم به پذیرش دروغ وادار کند، یعنی هوش مصنوعی نیز در ارائه اطلاعات دقیق آسیب‌پذیر است و این خطرناک است.

چه چیزهایی هنوز مشخص نیست؟

پژوهشگران می‌گویند هنوز مشخص نیست چرا بعضی مدل‌های هوش مصنوعی در برابر باورهای نادرست مقاومت بیشتری دارند. همچنین معلوم نیست این مدل‌ها در حوزه‌های واقعی و حساس، مثل پزشکی یا علم، چگونه رفتار می‌کنند. طراحی هوش مصنوعی که هم مفید باشد و هم در برابر دروغ مقاومت کند، هنوز یک چالش حل‌نشده است.

این یافته‌ها در نشست سالانه انجمن زبان‌شناسی محاسباتی (ACL ۲۰۲۶) ارائه خواهد شد.


اخبار مرتبط
نظرات

آخرین اخبار
قالیباف خطاب به آمریکا: اگر اراده ندارید، سخن گفتن از ادامه مسیر ممکن نیست
ضاحیه زیر آتش؛ ادعای رژیم صهیونیستی :یکی از شخصیت‌های ارشد حزب‌الله هدف قرار گرفت
نورنما | اقدام پیشگیرانه یک دست فروش از سرقت
جزئیات جدید لباس دانش‌آموزان در سال 1406-1405
پیامدهای جنگ ایران محور مذاکرات گروه هفت
تأکید دولت بر اجرای کامل ابلاغیه‌های ستاد تشییع
عراقچی: اقتدار دیپلماسی ایران بر شانه‌های مردم است
زمان امتحانات نهایی و کنکور تغییر کرد؛ جزئیات تقویم جدید آموزشی اعلام شد
قیمت سکه پارسیان امروز یکشنبه 24 خرداد 1405
هشدار پلیس فتا درباره فروش سوالات سمپاد
جزئیات یک عملیات بزرگ امنیتی؛دستگیری یک مزدور و 126 لیدر میدانی
بهترین توافق چگونه توافقی است؟
جام جهانی روی دور حاشیه؛ آلمان، هلند و ژاپن امشب جام جهانی را گرم می کنند
اولیانوف: توقیف نفتکش روسیه «دزدی دریایی» است
ترکیب ایران مقابل بلژیک در لیگ ملت‌های والیبال اعلام شد
اخطار سازمان بازرسی به بانک‌های کم‌کار در پرداخت وام ازدواج و فرزندآوری
حمله هوایی رژیم صهیونیستی به ضاحیه بیروت
حاجی‌بابایی: وضعیت استخدامی معلمان تعیین تکلیف شود
اژه‌ای : دشمن به مخدوش کردن انسجام ملی چشم دوخته است
ناو «شارل دوگل» منطقه را ترک کرد
زمان قطعی کنکور 1405 اعلام شد
هشدار زرد هواشناسی برای گیلان صادر شد
عطوان: اسرائیل بزرگ‌ترین بازنده جنگ است
مهمات عمل‌نکرده عامل صدای انفجار در آذربایجان شرقی
هیئت قطری به تهران سفر کرده است
جزئیات تفاهم نامه ایران و آمریکا؛از توقف درگیری تا لغو تحریم‌ها
قیمت طلا و سکه امروز یکشنبه 24 خرداد 1405/ بازار طلا کاهشی شد + جدول
تشدید مجازات فروش مواد مخدر در فضای مجازی
آزادراه تهران از دل جنگل و کوه می‌گذرد؛ پروژه‌ای جنجالی در راه است
قیمت دلار و سایر ارزها امروز یکشنبه 24 خرداد 1405 / دلار به کانال پایین‌تر سقوط کرد
سید حسن خمینی: از دعوا و تندگویی هیچ راهی ساخته نمی‌شود
اعتراف مقام سابق اسرائیل به دست بالاتر ایران
جوان 25 ساله در آب‌بندان قائم‌شهر جان باخت + جزئیات حادثه
افشای انتقال صدها میلیون دلار طلای یمن از عدن به امارات
زمان آزمون ارشد 1405 تغییر کرد
گفت‌وگوی پاکستان و ترکیه درباره ایران و آمریکا
مدافع مرزهای ایران آسمانی شد؛ شهادت افسر مرزبانی در نبرد با عناصر پ.ک.ک
طوفان گرد و خاک در راه تهران
نوراینفو | فواید اهدای خون برای اهدا کنندگان
مترو به بیمارستان امام خمینی می‌رسد
سرمربی تیم ملی والیبال زنان: پیشرفت بازیکنان مشهود است
نوراینفو | خطای شناختی که باعث می‌شود فکر کنیم حق با ماست و دیگران را ناعادلانه قضاوت کنیم
جهش شاخص بورس تهران در معاملات امروز
مدار دیپلماسی | روایت رسمی از یک تفاهم
چند درصد از مصدومان جنگ چهل روزه در تهران غیرنظامی بودند؟
اختلال کارت‌های بانک تجارت و صادرات برطرف شد
رهگیری موشک‌های بالستیک ایران غیرممکن است
برنامه های توانیر برای تامین برق پایدار پایتخت؛ هوشمندسازی، صرفه جویی و مشارکت مردمی
معاریو: ایران پیروز بلامنازع است
ایران پس از جنگ، قوی‌تر و سرسخت‌تر از قبل