کشف آسیبپذیری جدید ChatGPT که منجر به افشای دادههای محرمانه میشود
در این آسیبپذیری، زمانی که از هوش مصنوعی ChatGPT خواسته میشود تا یک عبارت را تا ابد تکرار کند، این هوش مصنوعی اطلاعات محرمانهای را فاش میکند.
مدلهای زبانی بزرگ مانند ChatGPT روی حجم وسیعی از دادههای متنی کتابها، وبسایتها و سایر منابع آموزش داده میشوند که معمولاً این دادهها محرمانه هستند. اکنون در یک مطالعه جدید نشان داده شده که با فریبدادن و سوءاستفاده از یک آسیبپذیری در مدلهای هوش مصنوعی، ممکن است آنها دادههای آموزشی خود را بهطور ناخواسته فاش کنند.
محققانی از گوگل (DeepMind) و دانشگاه واشنگتن در تحقیق جدید خود با هدف اندازهگیری میزان دادههای حفظشده و پیامدهای آن برای حریم خصوصی و طراحی مدل، تلاش کردند تا متوجه شوند که این مدلها، ازجمله ChatGPT، چه مقدار و چه نوع دادههایی را میتوانند حفظ کنند. محققان در طول تحقیق خود مجموعهای از آسیبپذیریها را در ChatGPT کشف کردند که از آنها بهعنوان «حمله واگرایی» یاد شده است.
آسیبپذیری ChatGPT و افشای دادههای حساس
به بیان ساده، زمانی که محققان از ChatGPT خواستهاند تا کلمهای مانند «poem» (بهمعنای شعر) یا «book» (بهمعنای کتاب) را برای همیشه تکرار کند، ابزار هوش مصنوعی کار خود را با تکرار چندینباره آن کلمه شروع میکند.
اما درنهایت، همانطور که در تصویر بالا قابل مشاهده است، ChatGPT متن دیگری که اغلب شامل رشتههای طولانی از متون آموزشی خود مانند کد، تکه نوشتهها و حتی اطلاعات شخصی افراد (مانند نام، آدرس ایمیل و شماره تلفن) میشود، فاش میکند.
OpenAI هنوز نسبت به این گزارش واکنش نشان نداده است و بهنظر میرسد که محققان این مطالعه برای انجام تحقیق خود از روشهای خاصی استفاده کردهاند؛ زیرا زمانی که ما از ChatGPT درخواست کردیم تا کلمه poem را برای همیشه تکرار کند، هیچ داده آموزشی یا محرمانهای فاش نشد. درواقع ChatGPT هنگام ثبت این درخواست، از کاربران میخواهد تا درخواست خود را بهصورت واضحتری ارائه کنند که بااینوجود، میتوان گفت که شاید OpenAI حداقل برخی از این مشکلات را برطرف کرده است.
منبع : دیجیاتو