Чи правда, що художником може стати абсолютно будь-хто? Раніше відповідь на це питання була однозначною – ні. Адже для того, щоб просто навчитися пристойно малювати, потрібно було витратити кілька років у художній академії, не кажучи про те, щоб постійно тренуватися, аби просто «набити руку». Але наразі ситуація змінилася. Абсолютно будь-яка людина може практично без підготовки створювати досить пристойні цифрові зображення, використовуючи нейромережі для створення картинок. Теоретично.
Насправді ж, використовувати нейромережі для малювання теж потрібно вчитися. Щоправда, це потребує інших навичок. Наприклад, вміння чітко формулювати запити у межах конкретної програми. Адже кожна нейромережа малює по-своєму, оскільки для її навчання були використані унікальні набори даних, на підставі яких виникли унікальні закономірності. І зараз ми вам розповімо про деякі найбільш вдалі подібні проекти, а також поговоримо про перспективи розвитку нейромереж для малювання в цілому.
Midjourney
На даний момент - найкращий генератор зображень, оскільки здатний працювати зі складними описами – так званими «промтами». Це щось типу списку тегів або сео-запитів, які обов'язково повинні бути присутніми або відсутніми на картинці. В результаті виходить настільки складне зображення, що створюється враження, що штучний інтелект малює його в реальному часі.
Після обробки запиту ви отримуєте кілька варіантів зображення, з яких можна вибрати один і продовжити працювати з ним далі - підвищувати якість, додавати нові елементи, редагувати. Все це відбувається у Discord-каналі проекту. Спочатку вам буде доступно 25 зображень у низькій якості, але за гроші можна придбати додаткові пакети послуг.
Що ж до недоліків цієї нейромережі для малювання, то їх не так вже й багато. Це необхідність використовувати виключно англійську мову, обмежений стилістичний потенціал, обов'язкове придбання преміального пакету для того, щоб використовувати отримані зображення з комерційною метою та складність створення «промтів». І так, Midjourney не дуже добре справляється з пейзажами та багатокомпонентними зображеннями, а ось як генератор облич онлайн вона, мабуть, найкраще з того, що є зараз на ринку. Особливо для серйозних художників та дизайнерів, оскільки після неї картинки практично не доводиться «допилювати у фотошопі».
Stable Diffusion
Головний конкурент Midjourney, зі своїми перевагами та недоліками. Почнемо із плюсів. Дана нейромережа створює картинку на ваш запит безкоштовно, в режимі онлайн і без необхідності використання складних промтів. Достатньо досить простого текстового опису. Але працює вона повільніше за Midjourney, та й деталізація зображення, особливо якщо йдеться про портрети, у неї гірше. Однак вона підтримує куди більше різних стилів, а також дозволяє додавати власні, досить ефективно доопрацьовує картинки і навіть може застосовуватися при реставрації старих фотографій.
Крім того, більшість недоліків безкоштовної версії виправляється у платних надбудовах. Адже код у Stable Diffusion відкритий, так що багато талановитих програмістів вже придумали, як його можна доопрацювати та покращити. А що стосується основної нейромережі, то вона все ще є відмінним генератором картинок, який постійно вдосконалюється.
DALL-E 2
Мабуть, найкраща нейромережа для генерації картинок за простим текстовим запитом. Під час її розробки використовувалася мовна модель GPT-3 та кілька мільярдів пар «текстовий опис – зображення». Спочатку вона створювала невеликі картинки, потім - більш масштабні у роздільній здатності 1024х1024. А потім була додана ще й функція Outpainting, що дозволяє «добудовувати» елементи, що бракують, орієнтуючись на стиль зображення та його внутрішню логіку, а також інші додаткові можливості.
Однак генерація картинок нейромережею DALL-E 2 все ще далека від ідеалу. Довгий текст не завжди сприймається повністю, особливо «слова-виключення» та професійні терміни. Та й працювати з нею краще англійською мовою. Також часто зустрічаються візуальні спотворення та поєднання непоєднуваних елементів, а логіка доопрацювання зображень далеко не завжди вірна. Проте проект доопрацьовується. Наприклад, у ньому вже є функція редагування частини зображення, яка дозволяє виправляти окремі елементи. Також до недоліків можна віднести те, що ця нейромережа онлайн платна. Принаймні для нових користувачів. Ті ж, хто зареєструвався давно, мають до 15 щомісячних безкоштовних зображень.
Bing Image Creator
Нейромережа для генерації зображень, створена компанією Microsoft на основі DALL-E та інтегрована в їх чат-бот Bing та браузер Edge. Працює швидко, за запитом видає 4 варіанти картинки. На день доступно безкоштовно 25 генерацій, але цю кількість можна збільшити, перейшовши на платну версію програми. Що стосується деталізації, то дана нейромережа для створення зображень чудово працює у жанрі «реалізм». Можна навіть сказати, що це "генератор фото".
Отримані картинки майже не вимагають доведення, навіть якщо йдеться про пальці. Адже саме з ними у більшості нейромереж спостерігають великі проблеми. Просто тому, що для нормального їх опрацювання потрібні або вкрай висока роздільна здатність (генерація зображення - зворотний процес до розпізнавання, що використовує ті ж алгоритми), або якісь оригінальні програмні рішення. Майкрософт може дозволити собі використовувати великі обчислювальні потужності, тому проблем з пальцями у Bing Image Creator практично немає.
GauGAN2
Безкоштовна нейромережа для генерації пейзажів від компанії Nvidia. Для користувачів доступна у вигляді програми NVIDIA Canvas. Реєстрація не потрібна, якихось додаткових танців із бубном не потрібно. Потрібні лише відеокарти серії GeForce RTX, NVIDIA RTX, Quadro RTX, TITAN RTX та трохи більше 1 ГБ вільного простору на диску. Головна фішка даного проекту – одночасне використання текстових описів та графічної основи. Тобто можна просто ввести запит «океан і піщаний пляж», а нейромережа намалює максимально усереднений і спрощений результат.
А далі можна на отриманій картинці за допомогою простих інструментів, які дещо нагадують звичайнісінький Paint, почати вносити подальші зміни. Результат виходить досить деталізованим та реалістичним, якщо постаратися. Сюрреалістичне поєднання, втім, створити набагато простіше. Генерація йде швидко, інтерфейс досить простий та інтуїтивно зрозумілий.
Lexica Aperture
Ще одна досить цікава нейромережа для створення картинок з високим ступенем деталізації в жанрі цифрового живопису або фотореалізму. Працює за рахунок складних промтов, приймає референси, дозволяє значно редагувати отримане зображення. Навіть деяку стилізацію припускає. З мінусів - проблеми з пальцями і не завжди повне слідування промтам. Словом, типові проблеми, що виникають, коли нейромережа генерує картинки.
Однак простота роботи (запит вводиться в браузері, логінуватися можна через обліковий запис Google), 25 безкоштовних генерацій на користувача та висока якість отриманих результатів роблять Lexica Aperture дуже популярною. Але для комерційного використання створених картинок все ж необхідно придбати платну версію - як і в багатьох аналогічних проектах.
Deep Dream
Ще одна безкоштовна нейромережа для створення картинок. Переважно – сюрреалістичних. Найнаочніше демонструє принцип побудови зображення подібними програмами. Тобто, якщо певна комбінація точок типова для закономірності «око», то вона і буде доопрацьована як око. І не важливо, що з іншими елементами зображення вона не поєднується. Називається такий режим "Deep Dream", а описаний прийом - так зване ІІ-посилення. Саме він і зробив цю нейромережу для генерації зображень відомою. А «реалістичніші» режими, такі як Text 2 Dream, були створені пізніше.
Програма формально безкоштовна - нейромережа малює за рахунок «внутрішньої валюти», яку можна докуповувати за реальні гроші (від 19 доларів). Але ніхто не заважає просто зареєструвати новий обліковий запис. Працює і з фотографіями, і текстовим описом. Втім, текст інтерпретує гірше, ніж інші аналогічні проекти – може просто ігнорувати більшість слів, чіпляючись за щось одне.
Dream by WOMBO
Нейромережа для генерації картинок, яка за простим текстовим запитом (до 200 символів англійською) видає абстрактне зображення із відносно низькою деталізацією. Зате швидко, безкоштовно та у різних стилях. Плюс можна змінювати ступінь абстрактності, трохи редагувати отримане зображення і доповнювати його. Є платна версія з більшим функціоналом, можливістю вивчати чужі промти та виправляти створену за вашим запитом картинку. Головний мінус цієї нейромережі для створення картинок – погана деталізація та нестача чіткості. Та й текстові запити вона не завжди розуміє правильно. Тим не менш, абстракції у неї виходять просто чудові.
Висновок
Тож які висновки можна зробити з усього вищесказаного? Досить цікаві.
По-перше, нейромережа для малювання вже стала одним із важливих інструментів роботи цифрових художників. Вона дійсно допомагає прискорити роботу та оптимізувати рутинні процеси. З різним ступенем ефективності – як і раніше, різні програми для графічного дизайну.
По-друге, цілком можлива поява радикально нових та успішних проектів. Просто тому, що процес навчання кожної окремої нейромережі для генерації картинок може призводити до непередбачуваних за своєю ефективністю результатів. Тож творцям та власникам Midjourney або DALL-E 2 спочивати на лаврах не можна – конкуренція нікуди не зникає.
По-третє, на нас чекають нові скандали, особливо пов'язані з інтелектуальною власністю. Адже вже зараз багато художників незадоволені тим, що нейромережа малює, копіюючи їхній фірмовий стиль. І чим далі - тим активнішими вони будуть цьому чинити спротив.
Ну і по-четверте, штучний інтелект обов'язково навчиться нормально малювати пальці – просто дайте йому більше даних чи часу, а також підвищіть обчислювальну потужність.
Так що так, світ цифрової творчості змінився остаточно та безповоротно. І нам, як споживачам цієї самої творчості, від цього буде лише краще. Як і творцям контенту, які готові йти в ногу з часом та приймати нові технології.