10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать

Современные профессии

В мире накопилось большое количество данных, которые могут быть полезны, если их правильно обработать и визуализировать. Дата-журналист — специалист, который собирает и анализирует эту информацию, извлекает важные инсайты и подаёт их читателям в понятном виде.

Собрали 10 интересных вопросов об этой профессии и задали их Андрею Дорожному — дата-журналисту, дизайнеру инфографики, создателю собственной дата-студии и преподавателю Нетологии.


10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать

Андрей Дорожный

Дата-журналист, специалист по визуализации данных

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Как вы объяснили бабушке, чем занимаетесь?

Я не то что бабушке, я своим друзьям иногда не могу объяснить, чем занимаюсь 🙂

Дата-журналистика находится на стыке анализа данных и журналистики. Я не могу сказать, что работаю именно в IT, но это и не журналистика в её привычном понимании. Поэтому я говорю, что рисую графики на основе больших данных. Такую формулировку обычно понимают.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Чем дата-журналист отличается от обычного журналиста?

Давайте сначала разберёмся, что такое дата-журналистика. Проще говоря, это метод журналистики, в основе которого лежит сбор, анализ, обработка и визуализация данных.

Обычный журналист работает с интервью, статьями, пресс-релизами и документами. Мой основной источник инсайтов ― это данные. Я анализирую большие и маленькие данные и с их помощью нахожу важные истории, которые затем публикую на различных площадках.

Главное, что есть в слове дата-журналистика, ― это журналистика. А данные и их анализ ― это всего лишь метод.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать На какую тему сделать статью, чтобы точно было много просмотров?

Если вы зайдёте в любой агрегатор новостей или в Яндекс.Дзен, то увидите, что на самом деле читают россияне. Тексты про смерть, секс, оружие и фарму — всегда самые популярные.

Но иногда нужно рассказать совсем другую историю, которая требует понимания социальных проблем и конфликтов. И в этом состоит сложность, поскольку новость о разводе какой-нибудь поп-звезды всегда будет собирать больше просмотров, чем важный социальный репортаж о какой-либо проблеме.

Наша задача — представить историю таким образом, чтобы она была интересна и понятна читателю. Мы стремимся, чтобы пользователь читал не только то, что ему нравится, но и то, что нам необходимо до него донести.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Часто ли вы встречаете 146% в результатах исследований? 

Да, такое возможно в двух случаях:

  • Вы проводите опрос, в котором можно выбрать не один вариант ответа, а несколько. Например, есть вопрос: «Где вы любите отдыхать?», и есть ответы: в Москве, в Турции, в Египте и у себя на даче. Человек может назвать и Турцию, и дачу, поскольку отдыхает и там, и там. В итоге суммарно получится больше 100%.
  • Вы рассматриваете историю с ростом бизнеса. Допустим, в прошлом году пекарня испекла 100 пирожков, а в этом — 250. Получается, объём производства вырос на 150%.

Бывает и так, что данные неправильно собраны или подсчитаны. В таких случаях 146% получается ошибочно.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Как понять, что источники данных надёжные?

Данные могут врать так же, как и люди. Конечно, это происходит не потому, что данные хотят денег или власти, просто их неправильно собрали или неверно посчитали.

Избежать этого можно единственным способом — нужно понять, как источник собирал данные и каким образом дата-журналист работал с ними.

Например, когда вы начинаете работать с каким-нибудь датасетом, важно понимать, кто его собирал и какую методологию сбора данных при этом использовал. На сайте Росстата у каждого датасета или опроса есть описание методологии. Зная выборку и погрешность, мы можем сказать читателю: «Вот, есть методология, по ней мы и шли».

Датасет — набор данных, объединённых в отдельное целое для решения определённой задачи.

Таким образом, с любого события можно собрать разные данные. Задача дата-журналиста — сделать методологию более прозрачной и максимально приближённой к реальности. Однако это недостижимая вещь, поскольку данные — нечто отличное от реальных явлений.

В то же время надо понимать, как с этими данными взаимодействовали дата-журналисты. Например, какой процент от какого целого числа был посчитан, как рассчитывалось изменение этого показателя, менялась ли методология сбора данных и так далее.

Ошибка может быть как со стороны источника данных, так и со стороны дата-журналиста. Если её допустил источник, исправить это практически нереально, можно только защититься методологией. Если журналист — ему стоит проверить, верно ли он анализировал данные.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Профессия

Дата-журналист

Узнать больше

  • Научитесь видеть истории, скрытые в массивах данных
  • Узнаете, как работать с данными и анализировать информацию в Python
  • Изучите сложные виды визуализаций и научитесь работать с расширенной версией Tableau

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Самая странная инфографика, которую вы видели?

Расскажу не про самую странную, но про одну из самых древних инфографик. Её сделал в XIX веке французский инженер Шарль Жозеф Минар. Он долгое время руководил строительством портов и железных дорог, а когда вышел на пенсию, стал рисовать карты и визуализации. Вот одна из самых известных его работ:

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать

Это карта похода Наполеона на Россию. Толщина коричневой линии показывает, как менялась численность французской армии: в начале пути линия толстая, но по мере приближения к Москве она сужается и в конце становится совсем тонкой.

Есть ещё чёрная линия — она показывает путь отступления Наполеона. Здесь хорошо видно, как постепенно таяла численность армии. К моменту перехода реки Неман от французского войска осталось буквально несколько сотен человек.

Несмотря на то что эта инфографика была сделана очень давно, она до сих пор волнует специалистов и вдохновляет их на создание новых работ. Это заслуживает уважения.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Почему ещё не открыли факультеты дата-журналистики?

А их открыли 🙂

В Москве есть магистерская программа «Журналистика данных» в Высшей школе экономики. Она существует около 5–6 лет.

Ещё есть несколько онлайн-платформ, которые обучают дата-журналистике. В частности, у Нетологии есть профессия «Дата-журналист». Она состоит из трёх блоков: первый связан с анализом данных на Python, второй — с инструментом Tableau, и третий блок — за него отвечаю я — называется «Дата-сторителлинг», где мы учимся превращать данные в истории.

Так что дата-журналистике можно учиться в России. И вполне успешно.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Что делать, если допустили ошибку в цифрах, а статья уже вышла?

Если статья вышла в интернете, то мы всегда можем что-то покрутить и исправить. Но лучше такого не делать. Цифры ― это очень важно. Их необходимо проверять и редактору, и журналисту, чтобы до читателя доходили правильные выводы, сделанные в процессе исследования.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Помогает ли статистика делать покупки в супермаркете?

Да, мои друзья постоянно смеются, что я сильно заморачиваюсь этим делом.

Однажды я скачал все свои расходы из банковского приложения, перевёл их в Excel и визуализировал. Выяснилось, что мои основные траты приходятся на отрезок с 00:00 пятницы до 13:00 субботы. Соответственно, максимальное количество денег я тратил на бары и развлечения.

Стало понятно, что надо быть аккуратнее с расходами, поскольку всю неделю я тратил меньше денег — как будто копил их, а потом всё сэкономленное просаживал в пятницу вечером.

Ещё один пример: как-то раз я покупал себе подержанный айфон. Я скачал все объявления о продаже и выяснил, в каком диапазоне находятся цены на каждую модель. Зная, сколько у меня денег, я принял решение о покупке определённом айфона.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать Что нельзя посчитать?

Очень много всего нельзя посчитать. Например, любовь. Конечно, можно попробовать измерить её в подаренных айфонах, машинах или в чём-то ещё. Но это будет, скорее всего, некорректно.

Также невозможно посчитать то, что произошло в прошлом. Мы никогда не узнаем, как относились россияне к снегу в XIX веке, потому что не можем провести социологический опрос среди этих людей. Момент упущен.

Когда мы записываем разговор на видео, данные собираются — они существуют. Если мы говорим с собеседником один на один, информация нигде, кроме нашего мозга, не фиксируется.

Сейчас с этим стало проще. Мы научились собирать и хранить данные, появились доступные инструменты для их обработки. Я очень завидую молодому поколению: у них появились сервисы, которые с самого детства собирают о человеке информацию, необходимую при принятии решений. Например, медицинские данные. Если мои находятся в какой-то потрёпанной карточке, то у современных детей всё хранится в цифровом виде.

Это очень интересно и позволяет нам создавать ещё больше дата-историй, лучше понимать людей и изучать то, что происходит вокруг.


Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

10 вопросов дата-журналисту: почему в результатах опроса бывает 146%, как статистика помогает экономить в супермаркете и что всё-таки нельзя посчитать

Андрей Дорожный

Дата-журналист, специалист по визуализации данных

Оцените статью

Средняя оценка 4.9 / 5. Всего проголосовало 11