Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое

Подборки

Рассказываем о новинках в мире нейросетей за месяц. Новые технологии воссоздают музыку по МРТ мозга, угадывают пароли по звуку и имеют политические взгляды. Сегодня мы посещаем самый странный зоопарк, создаём видеоролики по текстовому описанию и разбираемся в тонкостях озвучки видео.


Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое

ДАРЬЯ ТИХОМИРОВА

Автор-фрилансер

Что почитать

«Brain2Music: как нейросеть распознаёт мелодии по МРТ мозга», Хабр

Приготовьтесь: учёные из Google, Осакского университета, NICT и Araya Inc. провели эксперимент, в котором записали музыку, которую человек воспроизводит в мозгу, по результатам фМРТ‑сканирования. Больше примеров — в оригинальной статье на GitHub, кратко об эксперименте рассказал пользователь mr-pickles.

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое
В левой колонке приводится оригинальная мелодия, в трёх колонках справа — результат работы нейросети

«Японский супермаркет начал снимать посетителей, чтобы показывать им таргетированную рекламу», Inc.

Система генеративного ИИ получает данные о том, какие витрины вы рассматривали дольше всего, на какие товары обращали внимание и что держали в руках. На основе этих данных генерируется аватар, который предлагает вам приобрести товары, потенциально интересные именно вам.

«Искусственный интеллект может удалённо отслеживать набор текста по звукам клавиатуры», DSM

Технология из шпионских фильмов ожила: с точностью до 95% ИИ понимает, что было напечатано на клавиатуре, по звуку клавиш. Предварительно нейросеть нужно обучить на звуках конкретной клавиатуры — для теста группа учёных использовала MacBook Pro.

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое
Так нейросеть видит различия между звуком набранной клавиши и его передачей через Zoom

«У языковых моделей есть политические взгляды — исследование», Tproger

Учёные из Вашингтонского университета, Университета Карнеги-Меллона и Сианьского университета Цзяотун изучили 14 языковых моделей на предмет их политических взглядов, реакции на дезинформирующие тексты и попробовали их «перевоспитать». Рафаил Агазода рассказал, какие модели оказались наиболее консервативными и что, по мнению учёных, можно сделать с политической предвзятостью.

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое
Так расположились по шкале политических координат разные языковые модели. Кто по идеологическому мировоззрению ваша любимая нейросеть?

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое Курсы по теме

Python для анализа данных — освоите ключевой инструмент для анализа данных и машинного обучения

Data Scientist: с нуля до middle — построите карьеру в анализе данных и обучении нейронных сетей

Deep Learning — углубите свою экспертизу в работе с нейросетями


Что посмотреть

Голографический зоопарк

Компания Axiom Holographics открыла в Австралии первый зоопарк, животных которого можно увидеть только в специальных очках. Система отслеживает вашу локацию и с помощью графического движка Unlimited Detail генерирует животных (включая динозавров) и их места обитания.

Парк Юрского периода ещё никогда не выглядел настолько реалистично

Not quite reality

NerF — нейросеть от NVIDIA, которая создаёт 3D-сцены из двумерных изображений. С её помощью пользователь создал кинематографичное видео о локациях по соседству и искривил отдельные сцены — они эффектны.

Довольно сюрреалистичное зрелище 🙂


Что попробовать

Wav2lip-2

Перевести видеоролик на другой язык и озвучить так, чтобы движения губ совпадали с речью — искусство. Стартап Synchronicity создал нейросеть на основе GPT-4, 11labs и wav2lip-2 API, которая переводит видео и воссоздаёт голос спикера вместе с липсинком. По ссылке можно запросить ранний доступ к API.

Пример работы сервиса

PlayHT

Сервис позволяет озвучить видео с помощью нейросетей. Загрузите текст, выберите язык и один из 900 голосов, задайте стиль, эмоции и другие настройки и наслаждайтесь результатом.

Codeium

Инструмент для разработчиков, который упростит создание кода: подскажет, что написать дальше, и ответит на вопросы. Расширение поддерживает 70 языков программирования и 20 редакторов кода — стоит попробовать.

Короткое демо от разработчиков сервиса

InstaVerse

Хотите превратить 2D-картинку в глубокую и наполненную деталями локацию? Поучаствуйте в альфа-тестировании InstaVerse: создайте картинку, например, в Midjourney, создайте для неё карту глубины и загрузите оба файла в Instaverse.

Pika Labs

Text-to-Video-платформа, которая генерирует гифки по вашим текстам и картинкам. После нажатия на кнопку Join beta вы окажетесь в Discord, где нужно будет выбрать любую ветку Generate и ввести запрос.

Короткий ролик, полностью сгенерированный с помощью Pika Labs

Synthical

На сайте собрали статьи из баз Arxiv, Biorxiv, Medrxiv и Chemrxiv, и это ещё не всё. Помимо того, что вы можете найти научную статью почти на любую тему, её можно упростить с помощью ИИ: выделить нужный кусочек и нажать Simplify.

MyMap

Инструмент помогает структурировать брейнштормы и потоки креативных идей — теперь и с ChatGPT. Задайте чат-боту любой вопрос и используйте ответы в своей презентации.

Живая демонстрация работы инструмента


Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Новинки в мире нейросетей: Brain2Music, NerF, Pika Labs и многое другое

ДАРЬЯ ТИХОМИРОВА

Автор-фрилансер

Оцените статью

Средняя оценка 5 / 5. Всего проголосовало 2