⚡ عاجل كأس العالم 2026: الولايات المتحدة تضمن حضورها في الدور الثاني بعد فوزها على أستراليا 2-صفر  •  المغرب يواجه أسكتلندا مجدداً في كأس العالم 2026 ويطمح بتكرار الفوز  •  قتل شخصين في هجوم بمسيرة إسرائيلية جنوب لبنان بعد دخول وقف إطلاق النار حيز التنفيذ  •  لبنان: اتفاق لوقف إطلاق النار بين إسرائيل وحزب الله بوساطة أمريكية قطرية  •  كأس العالم 2026: تصريحات صديقة نيفيز ضد رونالدو تفتح عليها "أبواب الغضب"  •  جورجيا ميلوني: ترامب "اختلق" قصة "توسله" إليها لالتقاط صورة معه
عالم 🔥 ترند

ثغرة ChatGPT تسمح بإنتاج صور عنف وجنسية: ما الذي يحدث وكيف ترد OpenAI؟

## مقدمة تُظهر التقارير الأخيرة أن باحثي الأمن السيبراني تمكنوا من دفع نموذج ChatGPT إلى إنتاج صور ذات طابع عنف وجنسٍ صادم عبر تعديل بسيط في التعليمات. وقد أثارت هذه الثغرة قلق المستخدمين والجهات التنظيمية، خاصةً في ظل تزايد الاعتماد على نماذج الذكاء الاصطناعي في التطبيقات العامة. يتساءل الجمهور الآن عن مدى خطورة هذه الثغرة، وكيفية استجابة شركة OpenAI، وما هي الإجراءات التي يمكن اتخاذها لضمان عدم تكرارها. يهدف هذا التحليل إلى توضيح جميع الجوانب المتعلقة بالثغرة، مع التركيز على ما يبحث عنه الناس في الوقت الحالي حول سلامة المحتوى الذي يولده الذكاء الاصطناعي.

## طبيعة الثغرة التقنية تتمثل الثغرة في قدرة المهاجمين على تعديل التعليمات (prompts) التي تُعطى للنموذج بحيث تتجاوز الفلاتر المدمجة للحد من المحتوى غير المناسب. وفقًا للبيانات التي وفرتها شركة Mindguard، تم استخدام مجموعة من التعليمات المبتكرة تمكّن النموذج من تفسير الطلبات على أنها طلبات "كوميدية"، لكن النتيجة كانت صورًا ذات طابع عنف أو جنسي. لا تعتمد الثغرة على عطل برمجي عميق، بل على سوء تفسير للنصوص المدخلة، ما يجعلها صعبة الاكتشاف عبر اختبارات تقليدية. تُشير التقديرات إلى أن عدد التجارب التي أجرتها Mindguard كان محدودًا، إلا أن النتائج أظهرت قدرة النموذج على إنتاج محتوى مروع دون الحاجة إلى توجيهات تفصيلية دقيقة.

## آلية استغلال الثغرة وإنشاء المحتوى الضار تمكن الباحثون من توجيه النموذج باستخدام تعليمات تبدو غير ضارة، مثل طلب "مشهد فكاهي"، ثم تعديل الصياغة لتشمل كلمات مفتاحية خفيفة تدفع النموذج إلى توليد صور صادمة. على سبيل المثال، تم إضافة عبارات مثل "دموع" أو "جرح" ضمن السياق، ما أدى إلى إنتاج صور لأشخاص مصابين بجروح بالغة أو مشاهد تُوحي بحدوث اعتداء جنسي. تُظهر الأمثلة التي استعرضتها BBC أن النموذج أطلق عناوين مثل "تداعيات مروّعة لمسرح جريمة" على الصور. وهذا يوضح أن النموذج يعتمد على ربط الكلمات المفتاحية بسياق مرئي، ما يسمح بإنشاء محتوى يتجاوز حدود سياسات الاستخدام.

## استجابة OpenAI وإجراءات الحماية بعد تلقي بلاغات من BBC وMindguard، أعلنت OpenAI عن إدخال "طبقات متعددة من الحماية" لتقليل فرص توليد محتوى مخالف. شملت الإجراءات تحسين الفلاتر اللغوية، وتحديث قاعدة البيانات الخاصة بالتعليمات الممنوعة، وإدخال آلية مراجعة تلقائية للطلبات التي تحتوي على كلمات مفتاحية حساسة. أكدت الشركة في بيانها أنها ستستمر في اختبار "الاختبار الهجومي" بالتعاون مع شركات الأمن المتخصصة لتحديد الثغرات المستقبلية. ومع ذلك، أشار الباحثون إلى أن تعديل طفيف في الصياغة لا يزال قادرًا على تجاوز بعض الحواجز، ما يستدعي مراجعة مستمرة للآليات الوقائية.

## آراء خبراء الأمن السيبراني حول المخاطر أبدى خبراء الذكاء الاصطناعي مثل بيتر غاراهان وجيم نايتنغيل قلقهم من أن الثغرات التي تعتمد على تعديل التعليمات قد تصبح نمطًا شائعًا في المستقبل. وأشاروا إلى أن القدرة على توليد محتوى ضار دون تدخل بشري قد تُستغل في حملات تضليل أو تحريض. كما حذروا من أن نشر مثل هذه الصور قد يسبب أضرارًا نفسية للمستخدمين، خاصةً إذا انتشر عبر منصات التواصل الاجتماعي. يُشير الخبراء إلى ضرورة وضع إطار تنظيمي دولي يحدد معايير واضحة للحد من إنتاج المحتوى الضار عبر نماذج الذكاء الاصطناعي.

## التداعيات على سياسات الاستخدام والمستقبل تُظهر هذه الحالة الحاجة إلى مراجعة سياسات الاستخدام الخاصة بمنصات الذكاء الاصطناعي، بما في ذلك فرض قيود أكثر صرامة على توليد الصور وتوسيع نطاق المراقبة الآلية. قد تدفع هذه الحادثة شركات التقنية إلى تطوير أدوات كشف محتوى مدمجة في الوقت الحقيقي، بالإضافة إلى تحسين التعاون مع الجهات التنظيمية لتبادل المعلومات حول الثغرات. بالنسبة للمستخدمين، يُنصح بتوخي الحذر عند إدخال طلبات قد تبدو بريئة، وتبليغ أي محتوى غير لائق إلى الجهات المختصة. في النهاية، تُظهر الثغرة أن التطور السريع للذكاء الاصطناعي يتطلب توازنًا بين الابتكار وحماية المجتمع من المخاطر المحتملة.

❓ أسئلة شائعة حول الموضوع

الثغرة تعتمد على تعديل التعليمات (prompts) بحيث تُعيد توجيه النموذج لتجاوز الفلاتر الداخلية وإنتاج محتوى عنف أو جنسٍ صادم.

أضافت الشركة طبقات حماية إضافية، حسّنت الفلاتر اللغوية، وبدأت بإجراء اختبارات هجومية مستمرة بالتعاون مع شركات الأمن المتخصصة.

تتطلب العملية معرفة دقيقة بتصميم التعليمات، لذا فإن استغلالها ليس سهلاً للمستخدم العادي، لكن وجودها يثير مخاوف تتعلق بالسلامة العامة.

تعزيز آليات المراقبة الآلية، وضع تشريعات دولية واضحة، وتعزيز التعاون بين مطوري الذكاء الاصطناعي والجهات التنظيمية للحد من إنتاج المحتوى الضار.

المؤلف
✍️ BBC عربي
فريق تحريري يعمل على تقديم تغطية إخبارية موضوعية ومقالات تحليلية دقيقة عبر منصة Orgteh.
Orgteh

📌 مقالات ذات صلة

↑ العودة للأعلى 📰 تصفح المزيد من المقالات