Гонка мозгов — ХитМедиа – Пространство молодой журналистики

Время чтения: 6 минуты

Согласно исследованию, проведенному четыре года назад компанией MarketsandMarkets, к 2024-му размер рынка нейросетей должен был вырасти почти до $300 млн. В начале 2023 года СМИ уже публиковали новости о том, что Microsoft инвестирует $10 млрд в разработчика чат-бота на основе искусственного интеллекта – OpenAI. Количество разнообразных сервисов-нейросетей неуклонно растет, а в медиапространстве все чаще встречается дискуссия о том, какие профессии они смогут заменить. В этой статье расскажем про самые интересные прикладные способности искусственного интеллекта.

Переводчики

Нейросети уже давно применяются в сервисах автоматического перевода, таких как Google Translate, Яндекс Переводчик и Microsoft Translator. Однако настоящий прорыв в этой области сделала небольшая немецкая компания DeepL со своим одноименным переводчиком.

Нейросети могут быть построены на основе разных архитектур, каждая из которых лучше подходит для решения определенной задачи. Поиск нужной комбинации алгоритмов – ключ к более точной работе ИИ. Большинство переводчиков до недавнего времени использовали рекуррентные нейронные сети, но их начала вытеснять новая модель машинного обучения – трансформер, которую активно использует Google.

DeepL не раскрывает свою технологию перевода, хотя в ранних рекламных кампаниях сообщалось о применении сверточных нейронных сетей, которые предназначены скорее для распознавания визуальных образов, а не текста. На официальном сайте также есть информация о том, что компания использует некоторые механизмы ранее упомянутой архитектуры трансформер. Собственные тесты разработчиков и сравнения, проведенные обычными пользователями, показывают, что DeepL действительно переводит гораздо точнее, потому что способен улавливать контекст:

Сравнение взято с сайта gadgets-news.ru, жирным выделен неверный перевод, а курсивом – неточный.

Стоит отметить, что переводчик от Google был значительно улучшен после внедрения архитектуры трансформер, однако DeepL переводит практически безошибочно.

Среди сервисов-нейросетей есть и такие, которые способны перевести и озвучить видео, удалив голос говорящего и оставив оригинальные шумы. Например, Neurodub AI может распознать речь на 70 языках:

Рабочее окно на сайте Neurodub. Видео было взято из личного архива автора статьи. Красным обведены исправленная ошибка и всплывающая строка-предупреждение.

Иногда нейросеть допускает ошибки, но их можно исправить вручную. На картинке выше видно, что ИИ неверно распознал название университета и вместо «ВШЭ» услышал «шея». После редактирования текста в боковом меню нужно нажать кнопку «Apply changes», и видео будет переозвучено правильно. К сожалению, сервис платный (1 минута – 1 доллар), но первые 15 минут можно опробовать в тестовом режиме.

Фото, картинки, логотипы

В марте 2023 года разработчики Midjourney – популярной нейросети для генерирования изображений – закрыли бесплатный доступ по причине злоупотреблений с дипфейками¹. Пользователи социальных сетей распространяли фотографии арестованного Дональда Трампа и Папы Франциска в модном пуховике.

Фейковая фотография Папы Франциска, сгенерированная с помощью Midjourney.

Фейк об аресте Дональда Трампа. Фотографию распространяли в социальных сетях.

Помимо Midjourney существует еще множество сервисов для генерации картинок, таких как Stable Diffusion, Craiyon, Starryai. Эти нейросети создают изображения по ключевым словам-подсказкам, так называемым «промптам»². Если не уметь правильно ими пользоваться, то ИИ может некорректно понимать запрос пользователя и генерировать нечто труднораспознаваемое.

Нейросети также способны создавать логотипы. Принцип действия у таких сервисов гораздо проще, чем у предыдущих: достаточно ввести название бренда, выбрать несколько понравившихся цветов, иконок – и готово. Вот несколько примеров, сгенерированных с помощью сайтов Brandmark.io и Looka:

Логотипы сгенерированы на основе имени автора статьи, тематики «Университет» и нескольких пастельных цветов.

А нейросети на сайтах Colorize.cc и MyHeritage.com могут улучшить качество фотографии или даже раскрасить старую черно-белую:

Написать текст

ChatGPT – пожалуй, самый известный чат-бот, который может написать даже диплом. Он основан на языковой модели GPT-3.5 и используется для генерации текстов, которые выглядят так, будто их автор – человек.

Написание текстов с помощью нейросетей имеет свои особенности: они не могут просто повторять существующие фразы. ИИ генерирует новые тексты на основе статистических параметров и паттернов, обнаруживаемых в массивах данных, на которых они были обучены. В результате, тексты, созданные нейросетями, могут быть оригинальными, но содержать ошибки и неточности. Кстати, этот абзац почти полностью написан с помощью ChatGPT: пришлось только исправить некоторые грамматические и речевые ошибки.

Механика взаимодействия с чат-ботом строится на запросах и ответах. Отличные друг от друга темы желательно вести в разных «чатах».

Некоторые нейросети, например Rytr, работают не как чат-боты, а используют четкое техническое задание, составленное пользователем. На сайте нужно выбрать «тон речи», язык, «формат контента» и вписать ключевые слова. После указания настроек искусственный интеллект сгенерирует образец текста, который предложит дополнить самостоятельно.

Детекторы искусственного интеллекта

В связи с появлением сервисов, которые могут написать текст за человека, возникла и потребность проверять работы на антиплагиат. Проблема в том, что с помощью обычного софта нельзя определить, например, написал ли студент эссе сам или воспользовался ИИ. Более того, газета The New York Times обратила внимание на то, что даже писатели и преподаватели не могут отличить образцы письменных работ ChatGPT от ученических, поэтому в школах Нью-Йорка запретили использование ИИ от OpenAI.

Результат проверки текста, сгенерированного ChatGPT, на сайте Writer.

Для этого были разработаны специальные сервисы, которые, как ни странно, тоже работают с помощью нейросетей. Одни из таких: AI Content Detector от Writer и AI Text Classifier от уже упомянутой OpenAI. Тем не менее детекторы искусственного интеллекта пока что обладают малой точностью в определении работы нейросетей. AI Text Classifier, например, успешно идентифицировал только 26% текстов, написанных с помощью ИИ. Кроме того, этот детектор не справится со своей задачей, если текст даже немного, но был отредактирован, написан либо детьми, либо на другом языке и содержит менее тысячи символов.

Несмотря на незначительные успехи в этой области, параллельно уже развиваются сервисы, маскирующие работу нейросетей. Вот как справился Stealthwriter AI с рерайтом ответа ChatGPT на мой вопрос о том, обидится ли тот, если автор не упомянет его в статье (текст приведен в неизмененном виде):

Из-за отсутствия эмоций, как Искусственный Интеллект, я не могу обидеться. Я хочу помочь вам и дать точные ответы на ваши вопросы. Мне не важно, будете ли вы включать упоминание моей помощи в вашу статью или нет. Если мои знания и советы смогут помочь вам в написании статьи, я буду только рад.

Оригинальный текст:

Как Искусственный Интеллект, я не испытываю эмоций, поэтому не могу обидеться. Моя главная цель — помочь вам и дать максимально точные и полезные ответы на ваши вопросы. Если вы решите не упоминать мою помощь в своей статье, это не будет для меня проблемой. Я буду рад, если мои знания и советы смогут помочь вам в написании вашей статьи.

Какой вариант больше похож на «сделано человеком» – вопрос субъективный.

Искусственный интеллект действительно вышел на новый уровень: нейросети теперь способны выполнять некоторые задачи быстрее человека, а иногда даже качественнее. Тем не менее они все еще допускают ошибки, а где-то вовсе далеки от успеха. Бояться захвата мира роботами не нужно. Наверное.

Views All Time

788

Views Today

Ростислав Ширяев

Методика синтеза изображения, основанная на искусственном интеллекте
от англ. Prompt engineering – концепция искусственного интеллекта, в частности обработки естественного языка