Компания, разработавшая чат-бот ChatGPT, сделала новый скачок в области генеративного искусственного интеллекта (ИИ), представив нейросеть, которая мгновенно преобразует текст в короткие видеоролики.
Новый инструмент, получивший название Sora, – не первый в своем роде. Среди других компаний, продемонстрировавших подобную технологию, – Google, Meta и стартап Runway ML.
Но высокое качество видео, продемонстрированное OpenAI после того как генеральный директор Сэм Альтман попросил пользователей социальных сетей присылать идеи для письменных подсказок, поразило наблюдателей и одновременно вызвало опасения по поводу этических и социальных последствий.
“Обучающая кулинарная сессия по приготовлению домашних ньокки, проводимая бабушкой, влиятельной в социальных сетях, на деревенской тосканской кухне с кинематографическим освещением”, – предложил на сайте X, бывшем Twitter, фотограф-фрилансер из Нью-Гэмпшира (США).
Через некоторое время Альтман ответил на это реалистичным видео, на котором было изображено то, что описано в подсказке.
OpenAI консультируется с художниками
Инструмент еще не доступен для публичного пользования, и OpenAI раскрыла лишь ограниченную информацию о том, как он был создан.
Компания, на которую подали в суд некоторые авторы и The New York Times из-за использования защищенных авторским правом произведений для обучения ChatGPT, также не раскрыла, какие изображения и видео были использованы для обучения Sora.
Компания платит какие-то сумму The Associated Press за лицензирование ее текстового архива новостей.
“Мы сотрудничаем с экспертами в таких областях, как дезинформация, ненавистный контент и предвзятость, – они будут тестировать модель в неблагоприятных условиях, – говорится в сообщении компании. – Мы также создаем инструменты для выявления недостоверного контента, например классификатор, который позволяет определить, что видео было сгенерировано Sora”.