Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022

Книжная полка

Меняем положение тени на фото с помощью алгоритма, знакомимся с врагами «Доктора Кто» через интерактивную карту метро и считаем людей в космосе — об этом и многом другом в нашем свежем дайджесте.


Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022

Дарья Тихомирова

Автор-фрилансер. Собрала майскую подборку

Что почитать

«At what age do people experience depression for the first time?», Our World in Data

Сегодня о депрессии как о серьёзном диагнозе знают многие. Салони Даттани, исследователь портала Our World in Data, проанализировала работы из области психиатрии и выяснила, в каком возрасте у людей появляются первые симптомы, когда им диагностируют депрессию и как эти значения менялись на протяжении 25 лет.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
У 75% людей первые симптомы депрессии появляются где-то в 34 года. При этом диагноз большинству страдающих этим расстройством ставят только после 46 лет

«Flamingo: мультимодальная модель от DeepMind», Uproger

DeepMind анонсировала новую нейросеть Flamingo — она способна обучиться всего на нескольких примерах вместо привычных десятков тысяч, чтобы эффективно выполнить задачу. Подробности — в конспекте от Uproger и оригинальной статье от DeepMind.

«Companies are using AI to monitor your mood during sales calls. Zoom might be next», Protocol

Чтобы продать товар, нужно тонко чувствовать эмоции клиента и уверенно вести диалог. В этом компаниям помогает ИИ: он анализирует настроение потенциального покупателя во время звонка и мгновенно советует оператору изменить поведение. О технологии и её возможном внедрении в Zoom рассказывает Кейт Кайе.

«Сбер представил mGPT — версию нейросети GPT-3, способную генерировать тексты на 61 языке», VC

SberDevices анонсировала многоязычную версию нейросети GPT-3 — mGPT. Это первая в мире генеративную модель, которая поддерживает 61 язык. Её можно использовать как для генерации текста, так и для решения других задач обработки естественного языка. Существует две версии: базовая, с 1,3 миллиарда параметров, и расширенная, с 13 миллиардами параметров. Сгенерировать текст самостоятельно можно в Google Colab.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022 Курсы по теме

«Аналитик данных» — станете универсальным аналитиком, который сможет работать в любой сфере

«Deep Learning» — научитесь реализовывать NLP с нуля и строить языковые модели 

«Искусственный интеллект: создайте свою первую нейросеть» — узнаете, как устроены нейросети, в каких сферах они применяются и самостоятельно обучите математическую модель


Что посмотреть

Музыкальное пиратство

Дата-журналист Феликс Рихтер показал масштабы музыкального пиратства на основе данных IFPI — Международной федерации производителей фонограмм. В результате опроса 43 000 респондентов из 21 страны выяснилось, что 27% продолжают «пиратить», большая часть из них — люди в возрасте 16–24 лет. Посмотреть исследование целиком можно на странице IFPI.

Карта «Доктора Кто»

Фанатам «Доктора Кто» посвящается! Энтузиасты Reddit собрали карту со всеми врагами доктора в формате лондонского метро. Ветки подземки соответствуют разным докторам, а станции — их недоброжелателям. Если нажать на любого из них, вы окажетесь на странице онлайн-энциклопедии сериала, посвящённой персонажу.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
Вот так выглядит карта метро Лондона, а теперь ещё и карта злодеев из «Доктора Кто». Рассмотреть её можно здесь

Wait But Why

Тим Урбан, один из основателей сайта Wait But Why, создал очередную диаграмму, где показал, как мало лет существует наша цивилизация. «Всё, что мы называем цивилизацией, было изобретено за последние 500 поколений — слишком короткий срок для того, чтобы наши тела и мозг успели переоптимизироваться. Мы кучка приматов в совершенно неестественной среде, которая старается изо всех сил», — добавляет автор.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
Ваша прапра-и-ещё-74-раза-прабабушка могла быть другом Иисуса, считает Тим. Действительно, почему бы и нет

An Orrery of Black Holes and Their Companions

NASA опубликовала визуализацию с чёрными дырами и их спутниками. На видео — 22 наиболее изученные двойные системы Млечного пути и Большого Магелланова облака. Белая сфера — это выжившая звезда, её вещество перетягивает на себя чёрная дыра рядом. Алая область — это диск, образовавшийся вокруг чёрной дыры из того самого вещества звезды-компаньона.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
На картинке движение чёрных дыр и спутников тоже можно представить благодаря орбитам, но лучше посмотреть видео

OutCast

Инженеры Adobe представили алгоритм, который позволяет менять положение света и теней на фотографии. Другими словами, управлять временем ? Алгоритмы обрабатывают фото и создают 2D-набросок, на основе которого генерируется 3D-карта объектов, света и теней, определяется источник света на оригинальном изображении. При смещении ползунка светотеневой рисунок на 3D-карте пересчитывается, и её новый вариант совмещается с первоначальной фотографией.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
Слева находятся оригинальные фотографии, справа — переделанные с помощью алгоритма. Поиграться с ползунками можно здесь

Что попробовать

How Many People are in Space Right Now

Сайт показывает, сколько человек находится в космосе прямо сейчас. Рядом с каждым космонавтом — количество дней в невесомости и ссылка на биографию в Википедии. Сейчас в космосе — 10 человек, трое из них — россияне.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022
Российский космонавт Олег Артемьев провёл в космосе уже 421 день. Впечатляет!

Are You the Asshole

Большую популярность на Reddit приобрёл один бот: вы описываете ему ситуацию из жизни, а в ответ получаете честное мнение о вашем поступке и совет — оптимистичный, грубый или нейтральный. В основе бота — три генеративные модели текста, обученные на текстах самого Reddit.


Что посетить

Митап «Аналитика для всех»

Формат: онлайн

Когда: 28 мая, 12:00 мск

Место встречи специалистов из российских и зарубежных компаний, которые используют аналитику в своей работе и готовы поделиться опытом. Спикеры из Ozon, «Глобалгеосинт», «БазисСофт» и IPification обсудят тренды индустрии, проведут Q&A-сессию и помогут составить пошаговый гайд по развитию карьеры в сфере работы с данными.


Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Data Science-дайджест: что почитать, посмотреть и попробовать в мае 2022

Дарья Тихомирова

Автор-фрилансер. Собрала майскую подборку

Оцените статью

Средняя оценка 5 / 5. Всего проголосовало 3