Vinnytsia Times

ШІ навчився "ховати" образи у мемах і картинках: популярні фільтри виявилися безсилими

Опубліковано: 2026-04-17 14:09:46 | Категорія: Всі новини
Фото новини
ШІ-генератори навчилися вбудовувати токсичні написи у меми так, що їх практично неможливо відмодерувати ШІ-креатори, серед яких і Stable Diffusion, опинилися у центрі скандалу через небезпечну вразливість. Виявилося, що стандартні системи безпеки "осліпли": вони розпізнають візуальну картинку, проте абсолютно "не розуміють" змісту тексту, який ШІ "вшиває" у зображення. Про це пише РБК-Україна з посиланням на дослідження CISPA. Більше цікавого: Без російської озвучки та з Москвою у вогні: що відомо про Metro 2039 Вчені пояснили, чому проблема виявилася значно глибшою, ніж вважалося: сучасні детектори (NSFW) налаштовані на пошук візуальних заборон, однак ігнорують семантику. Що це означає: Зброя проти ШІ-токсика Щоб зупинити поширення небезпечних зображень, було розроблено датасет ToxicBench, який виклали у вільний доступ на GitHub. Як працює технологія? Налаштування ШІ по-новому Замість того, щоб будувати зовнішні фільтри, автори змінили самі внутрішні шари моделі. Це дозволило зберегти фотореалізм та швидкість генерації, водночас зробивши ШІ "вихованим". Дослідники наголошують: ToxicBench є критично важливим для освітніх платформ та публічних сервісів, які використовують відкриті моделі ШІ. Наступним кроком вчених стане повне очищення відеогенераторів нового покоління від будь-якого токсичного впливу. Ще більше цікавого: