В мире накопилось большое количество данных, которые могут быть полезны, если их правильно обработать и визуализировать. Дата-журналист — специалист, который собирает и анализирует эту информацию, извлекает важные инсайты и подаёт их читателям в понятном виде.
Собрали 10 интересных вопросов об этой профессии и задали их Андрею Дорожному — дата-журналисту, дизайнеру инфографики, создателю собственной дата-студии и преподавателю Нетологии.
Как вы объяснили бабушке, чем занимаетесь?
Я не то что бабушке, я своим друзьям иногда не могу объяснить, чем занимаюсь 🙂
Дата-журналистика находится на стыке анализа данных и журналистики. Я не могу сказать, что работаю именно в IT, но это и не журналистика в её привычном понимании. Поэтому я говорю, что рисую графики на основе больших данных. Такую формулировку обычно понимают.
Чем дата-журналист отличается от обычного журналиста?
Давайте сначала разберёмся, что такое дата-журналистика. Проще говоря, это метод журналистики, в основе которого лежит сбор, анализ, обработка и визуализация данных.
Обычный журналист работает с интервью, статьями, пресс-релизами и документами. Мой основной источник инсайтов ― это данные. Я анализирую большие и маленькие данные и с их помощью нахожу важные истории, которые затем публикую на различных площадках.
Главное, что есть в слове дата-журналистика, ― это журналистика. А данные и их анализ ― это всего лишь метод.
На какую тему сделать статью, чтобы точно было много просмотров?
Если вы зайдёте в любой агрегатор новостей или в Яндекс.Дзен, то увидите, что на самом деле читают россияне. Тексты про смерть, секс, оружие и фарму — всегда самые популярные.
Но иногда нужно рассказать совсем другую историю, которая требует понимания социальных проблем и конфликтов. И в этом состоит сложность, поскольку новость о разводе какой-нибудь поп-звезды всегда будет собирать больше просмотров, чем важный социальный репортаж о какой-либо проблеме.
Наша задача — представить историю таким образом, чтобы она была интересна и понятна читателю. Мы стремимся, чтобы пользователь читал не только то, что ему нравится, но и то, что нам необходимо до него донести.
Часто ли вы встречаете 146% в результатах исследований?
Да, такое возможно в двух случаях:
- Вы проводите опрос, в котором можно выбрать не один вариант ответа, а несколько. Например, есть вопрос: «Где вы любите отдыхать?», и есть ответы: в Москве, в Турции, в Египте и у себя на даче. Человек может назвать и Турцию, и дачу, поскольку отдыхает и там, и там. В итоге суммарно получится больше 100%.
- Вы рассматриваете историю с ростом бизнеса. Допустим, в прошлом году пекарня испекла 100 пирожков, а в этом — 250. Получается, объём производства вырос на 150%.
Бывает и так, что данные неправильно собраны или подсчитаны. В таких случаях 146% получается ошибочно.
Как понять, что источники данных надёжные?
Данные могут врать так же, как и люди. Конечно, это происходит не потому, что данные хотят денег или власти, просто их неправильно собрали или неверно посчитали.
Избежать этого можно единственным способом — нужно понять, как источник собирал данные и каким образом дата-журналист работал с ними.
Например, когда вы начинаете работать с каким-нибудь датасетом, важно понимать, кто его собирал и какую методологию сбора данных при этом использовал. На сайте Росстата у каждого датасета или опроса есть описание методологии. Зная выборку и погрешность, мы можем сказать читателю: «Вот, есть методология, по ней мы и шли».
Датасет — набор данных, объединённых в отдельное целое для решения определённой задачи.
Таким образом, с любого события можно собрать разные данные. Задача дата-журналиста — сделать методологию более прозрачной и максимально приближённой к реальности. Однако это недостижимая вещь, поскольку данные — нечто отличное от реальных явлений.
В то же время надо понимать, как с этими данными взаимодействовали дата-журналисты. Например, какой процент от какого целого числа был посчитан, как рассчитывалось изменение этого показателя, менялась ли методология сбора данных и так далее.
Ошибка может быть как со стороны источника данных, так и со стороны дата-журналиста. Если её допустил источник, исправить это практически нереально, можно только защититься методологией. Если журналист — ему стоит проверить, верно ли он анализировал данные.
- Научитесь видеть истории, скрытые в массивах данных
- Узнаете, как работать с данными и анализировать информацию в Python
- Изучите сложные виды визуализаций и научитесь работать с расширенной версией Tableau
Самая странная инфографика, которую вы видели?
Расскажу не про самую странную, но про одну из самых древних инфографик. Её сделал в XIX веке французский инженер Шарль Жозеф Минар. Он долгое время руководил строительством портов и железных дорог, а когда вышел на пенсию, стал рисовать карты и визуализации. Вот одна из самых известных его работ:
Это карта похода Наполеона на Россию. Толщина коричневой линии показывает, как менялась численность французской армии: в начале пути линия толстая, но по мере приближения к Москве она сужается и в конце становится совсем тонкой.
Есть ещё чёрная линия — она показывает путь отступления Наполеона. Здесь хорошо видно, как постепенно таяла численность армии. К моменту перехода реки Неман от французского войска осталось буквально несколько сотен человек.
Несмотря на то что эта инфографика была сделана очень давно, она до сих пор волнует специалистов и вдохновляет их на создание новых работ. Это заслуживает уважения.
Почему ещё не открыли факультеты дата-журналистики?
А их открыли 🙂
В Москве есть магистерская программа «Журналистика данных» в Высшей школе экономики. Она существует около 5–6 лет.
Ещё есть несколько онлайн-платформ, которые обучают дата-журналистике. В частности, у Нетологии есть профессия «Дата-журналист». Она состоит из трёх блоков: первый связан с анализом данных на Python, второй — с инструментом Tableau, и третий блок — за него отвечаю я — называется «Дата-сторителлинг», где мы учимся превращать данные в истории.
Так что дата-журналистике можно учиться в России. И вполне успешно.
Что делать, если допустили ошибку в цифрах, а статья уже вышла?
Если статья вышла в интернете, то мы всегда можем что-то покрутить и исправить. Но лучше такого не делать. Цифры ― это очень важно. Их необходимо проверять и редактору, и журналисту, чтобы до читателя доходили правильные выводы, сделанные в процессе исследования.
Помогает ли статистика делать покупки в супермаркете?
Да, мои друзья постоянно смеются, что я сильно заморачиваюсь этим делом.
Однажды я скачал все свои расходы из банковского приложения, перевёл их в Excel и визуализировал. Выяснилось, что мои основные траты приходятся на отрезок с 00:00 пятницы до 13:00 субботы. Соответственно, максимальное количество денег я тратил на бары и развлечения.
Стало понятно, что надо быть аккуратнее с расходами, поскольку всю неделю я тратил меньше денег — как будто копил их, а потом всё сэкономленное просаживал в пятницу вечером.
Ещё один пример: как-то раз я покупал себе подержанный айфон. Я скачал все объявления о продаже и выяснил, в каком диапазоне находятся цены на каждую модель. Зная, сколько у меня денег, я принял решение о покупке определённом айфона.
Что нельзя посчитать?
Очень много всего нельзя посчитать. Например, любовь. Конечно, можно попробовать измерить её в подаренных айфонах, машинах или в чём-то ещё. Но это будет, скорее всего, некорректно.
Также невозможно посчитать то, что произошло в прошлом. Мы никогда не узнаем, как относились россияне к снегу в XIX веке, потому что не можем провести социологический опрос среди этих людей. Момент упущен.
Когда мы записываем разговор на видео, данные собираются — они существуют. Если мы говорим с собеседником один на один, информация нигде, кроме нашего мозга, не фиксируется.
Сейчас с этим стало проще. Мы научились собирать и хранить данные, появились доступные инструменты для их обработки. Я очень завидую молодому поколению: у них появились сервисы, которые с самого детства собирают о человеке информацию, необходимую при принятии решений. Например, медицинские данные. Если мои находятся в какой-то потрёпанной карточке, то у современных детей всё хранится в цифровом виде.
Это очень интересно и позволяет нам создавать ещё больше дата-историй, лучше понимать людей и изучать то, что происходит вокруг.
Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.