В 2021 году DALL-E произвёл фурор, создавая «авокадное кресло в стиле Баухаус». Казалось — забавная игрушка. В 2024-м генеративный ИИ создаёт рекламные кампании, обложки журналов, архитектурные концепты, учебные иллюстрации и видеоролики. Творческие профессии никогда не будут прежними.
Как работает диффузионная модель
Большинство современных генераторов изображений (Stable Diffusion, DALL-E 3, Midjourney) основаны на диффузионных моделях. Принцип: модель обучается на процессе «зашумления» — постепенного превращения чистого изображения в случайный шум — и учится обращать этот процесс.
При генерации: начинаем со случайного шума и итеративно «убираем» шум в направлении, заданном текстовым описанием (промптом). Текст кодируется через языковую модель (CLIP), которая связывает слова с визуальными концептами.
// GenAI рынок изображений и видео (2024)
Влияние на творческие профессии
Иллюстраторы стоковых изображений — категория, пострадавшая первой и сильнее всего. Shutterstock и Getty Image интегрировали GenAI — спрос на стандартные иллюстрации упал. Концепт-художники в игровой индустрии — частично автоматизированы (быстрый прототип через AI, доработка человеком).
Что устойчиво: уникальный художественный стиль с репутацией, искусство как высказывание (не просто визуал), режиссёрское мышление и нарратив. GenAI — мощный инструмент в руках умеющего ставить задачи, но не замена творческого видения.
Проблема синтетических медиа
Если ИИ генерирует неотличимые от реальных фото, видео и аудио — как мы можем доверять любым медиа? Это вопрос не будущего, а настоящего. C2PA (Content Provenance and Authenticity) — стандарт цифровой подписи для подтверждения происхождения контента. Adobe, Microsoft, Google поддержали его. Но широкого внедрения пока нет.