Схема работы с данными от The Guardian

В одной из глав пособия по журналистике данных для журналистов-расследователей опубликована схема, по которой с данными работает The Guardian.

Кажется, она вполне универсальна. Перевели на русский язык, нарисовали, как смогли:

 

Иными словами, этапы следующие:

  1. Формируем так называемый data-set. Его источники могут быть разные — полученный откуда-то готовый набор данных, новости, повторяющиеся события и пр.
  2. Думаем про набор данных. Задаёмся вопросами: с чем сравнить, какие изменения показать, что вообще всё это значит и чего бы ещё такого поискать, чтобы дополнить мой набор?
  3. Заносим всё в таблицу.
  4. Проверяем данные — какие некорректно считались, где ячейки объединились, где разные единицы измерения. Иные колонки и вовсе не нужны — удаляем. Словом, причёсываем наш массив (на одном из наших вебинаров Ирина Радченко учила делать это с помощью программы OpenRefine).
  5. Пересчитываем при необходимости, перепроверяем.
  6. Отправляем данные в работу — визуализируем с помощью бесплатных инструментов или оформляем с помощью Fusion Tables, отдаём дизайнерам или журналистам, а может — публикуем, как есть (и так бывает).

P.S. Если знаете хороший, удобный и бесплатный онлайн-сервис, позволяющие строить схемы — последовательности, иерархии, взаимосвязи и пр. — напишите нам, пожалуйста.

 

 

 

 

,