TG Telegram Group Link
Channel: Умные и красивые
Back to Bottom
Если вы только недавно начали свой путь в мир визуализации данных, рекомендую data viz catalogue от дизайнера Severino Ribecca. В каталоге подробно объясняют, для чего подходит каждый тип графиков. Еще рассказывают про инструменты, но с фокусом на пакетах/библиотеках для программирования на R, Python и JS, опуская некоторые полезные сайты. Даже про мой любимый graphcommons там нет.

Также есть очень подробный постер на русском языке, который помогает выбрать график в зависимости от того, что именно вы хотите проиллюстрировать и дает рекомендации, как сфокусировать все внимание на идее.

Его создал один из самых известных российских специалистов по инфографикам, Александр Богачев, автор визуализаций для РИА и РБК. Еще он написал одну из самых популярных на русском языке книг по нашей теме - "Графики, которые убеждают всех". У него есть свой канал о визах и блог с инфографиками - его работы очень прикладные, чтобы сосредоточить читателя на смысле. Кстати, многие из них сделаны на вышеупомянутом Flourish!
По воскресеньям отступаю от социальных наук: делюсь дашбордом о Диснее. Оценивают количество серьезных тем в мультфильмах и проработку женских персонажей.

Дашборд красивый и информативный, поэтому в конце марта получил статус "виз дня" от сообщества пользователей Tableau. Как-нибудь обязательно расскажу про этот инструмент, в прошлом году он мне очень пригодился для анализа американских выборов.

Отдельное уважение автор заслуживает за аккуратную адаптацию для смартфонов - в Табло это довольно муторный процесс.
График распределения американских сенаторов по поколениям. При наведении сообщает имя и возраст. Наглядно показано, как старшие поколения задерживаются и этим замедляют обновление всего органа.

Хотелось бы видеть на графике медианный возраст, а то приходится выискивать вручную. Из других источников знаю, что средний возраст - 64.3 года (25 лет назад был 58.4), и всего треть Сената моложе 60.

Как воплощение этого - Берни Сандерс и Митч МакКоннелл (глава консерваторов в Сенате, ныне самый влиятельный республиканец в стране) занимают 6 и 7 место по старшинству.

Дальше уже говорю как американистка.
Не то, чтобы новая кровь помогает решать проблемы. Среди самых молодых как победившие благодаря долям процента балансирующие в центре сенаторы (им прилетает ото всех), так и несговорчивые радикальные политики (пока только справа). Так, весьма консервативные Марко Рубио и Тед Круз входят в топ-15 самых молодых сенаторов. Через пару циклов слева тоже подрастет замена Сандерсу, а значит договориться будет тяжело.
This media is not supported in your browser
VIEW IN TELEGRAM
Регионоведам бывает тяжело - иногда надо отобразить различия между странами (штатами), а некоторые из них едва заметны на карте. Для этого предлагаю обратиться к схематичной карте региона.

Элементы такой картограммы похожи на плитку, поэтому она называется tile grid map. По сути это таблица, где для каждого квадрата указаны его координаты и нужные вам данные. Как в морском бое:) Ее можно нарисовать даже в экселе. Самый очевидный способ визуализации - назначить цветную шкалу, но еще внутри можно разместить цифры, пиктограммы или даже другие графики.

Автор блога про визуализации в политологии policywiz ну очень любит плиточные карты. Он подробно рассказывает, как сделать такую карту по Европе прямо в экселе. Ну а для тех, кому не хочется возиться с формулами, он дает готовые шаблоны карты мира, Европы и, конечно, США.

Есть гайды для более продвинутых вариантов: пиксельная карта США, квадраты внутри плиточек (waffle map chart) и интерактивная карта в экселе.

Есть даже карта России!
Показываю свою плиточную карту про паритет покупательной способности в Штатах в прошлом десятилетии. Есть интерактивная версия, там можно выбрать категорию. Для вас я повозилась и сделала мобильную версию графика. Будьте морально готовы к тому, что Табло немного тормозит.

Я сделала его в рамках #MakeoverMonday. Это проект датавиз-энтузиастов: показывают средненький график и предлагают его датасет, чтобы сделать более качественную визуализацию, которую потом советуют выложить в Твиттер. Очень полезная инициатива: участники развивают навыки (я столько всего узнала, пока делала карту!), становятся частью сообщества. Авторы дают мастер-классы, проводят фидбек-сессии и выбирают лучшие визы за неделю.

Если вам надо вдохновиться или найти хороший дизайн - полистайте посты по хэштегу, там много всего. Даже если не работаете в Табло и хотите просто потренироваться, можно брать их данные, они хорошо почищены.
Делюсь очень необычной картограммой Emoji States of America.

Такие рожицы называются лица Чернова - каждая часть позволяет отобразить значение разных показателей. Здесь оно подобрано по смыслу: цвет показывает долю людей без страховки, мешки под глазами - количество сна, рот - уровень бедности, подбородок - ожирение и т.д. Сходу конкретные цифры непонятны, но их можно узнать, если навести на штат.

Лица Чернова можно использовать не только в картограмме, но и, например, просто расположить их на графике со шкалами Х и Y.
Красивая схема бюджетного плана Байдена от NYT. Как написали в твиттере "я даже не знала, что мне это нужно, пока не увидела")

Тип графика называется Voronoï treemap. Интересная альтернатива набившей оскомину и, как правило, отвратительной круговой диаграмме.

С точки зрения американистики: это хороший вклад: налоговые льготы для семей, инвестиции в школы, университеты и тд. Америка нуждается в таких инвестициях, потому что объективно инфраструктура устарела. Продолжающие расти бюджет и госдолг пока не решают проблему растущей бедности.

Как аналитика выборов меня напрягает, что на усовершенствование инфраструктуры в сельской местности дали всего 5 млрд - меньше 0.1% В этих краях живут в основном республиканцы, и для них перемены могут оказаться несущественными.
Смотрю сразу с прицелом на выборы 2022 года - план звучит хорошо, но есть подозрение, что республиканские избиратели не оценят это, хотя многие из них сами принадлежат социальным группам, которые получат выгоду. Надеюсь, что я не права!
Нашла у проекта Россия в данных инфографику о торговле нефтью за 2018 г. Подумала, очень интересно, жалко, данные старые. Эти цифры BP ежегодно обновляет, публикуя хорошие удобные таблицы по всем аспектам энергетики. Поэтому я сделала новую версию графика в том самом Flourish. Он интерактивный - при наведении на страну или ленточку показывает объем торговли.

Дизайн первоначального графика мне нравится больше: свой цвет у страны-продавца легче воспринимать. Но в Flourish именно так выбрать цвета не получится (или я пока об этом не знаю).

Такой тип визуализации называется sankey. В русском дата-виз коммьюнити его с любовью называют санками :)

Это были мои первые санки! На его создание с момента нахождения данных до итогового результата ушло где-то полтора часа. Нужна нестандартная структура таблицы: колонки должны быть в таком порядке: кто - кому - что. Я не нашла быстрого способа перестроить обычную таблицу в экселе, поэтому пошла в Табло. Если решитесь попробовать санки - пишите, помогу почистить данные.
Время пришло: рассказываю, что такое Tableau и как не разочароваться в нем в первые полчаса работы.

Tableau - софт для работы с данными. В корпоративном секторе его используют для обработки и визуализации данных, оформления дашбордов, короче для наглядного data-driven decision-making. Но дата-виз энтузиасты любят его за удобный интерфейс, вариативный дизайн и почти безграничные возможности.

Табло дорогой, годовая подписка - $840, есть пробные 2 недели. Студентам дают бесплатный доступ на год 🎉 Еще есть бесплатный онлайн-вариант - Tableau Public, там можно создавать и редактировать графики, хотя интерфейс ограничен. А еще это что-то вроде соцсети, чтобы делиться своими визами, вдохновляться и подписываться на крутых дизайнеров.

Сколько всего в Tableau можно сделать! Очень много вариантов графиков, почти любой, который вы можете представить. Можно писать формулы как в экселе, то есть грузить и обрабатывать данные без посредников. Меня он привлёк возможностью добавлять интерактивные элементы: кнопочки, анимации, детали при наведении, графики внутри графиков, создавать большие дашборды. Для иллюстрации снова привожу мою гордость - виз про выборы в США (работает только на больших экранах), где есть все выше перечисленное.

Tableau хорошо подходит для экспериментов: отмечаете, какие именно данные хотите визуализировать, а потом смотрите разные типы визов и выбираете наиболее подходящий. Чтобы не тонуть, а плавать в возможностях, советую полистать каталоги с типами графиков. Я любой новый датасет сразу несу в Табло, парой кнопок создаю визы и так исследую, что есть интересного. Удобнее, чем возиться с экселем или кодом.

В Tableau сначала надо разобраться в логике инструмента, рекомендую несколько курсов. Во-первых, у самого Табло есть вводный курс, сейчас его дают бесплатно на три месяца. Во-вторых, у DataYoga есть марафон на русском языке (чтобы выбрать день марафона, меняйте номер дня в адресной строке). Там же есть большая библиотека книг по теме. Сама я изучила основы по курсу Creating professional Interactive Dashboards in Tableau, он остался в интернете только в пиратских морях. У них же можно одолжить еще много чего интересного. Конечно, нужна практика! Уже рассказывала про Makeover Monday для прокачки навыков.

Наконец, гугл - наш друг и это должно быть не стыдно признать! Когда чего-то не знаете, даже супербазового, просто гуглите, скорее всего, про это уже есть пара гайдов. А если не получается - пишите мне, будем разбираться вместе.
Потрясный проект о жанрах музыки - Music map.

Это очень детальная история развития музыки, внутри цветных областей все поджанры и течения. Если навести на любой из них - покажет, как они взаимосвязаны. При нажатии даст небольшую справку и плейлист с главными композициями. В карте есть хронологическая логика: чем выше жанр, тем раньше он появился.

Этот виз структурировал мое представление о мире музыки. Уверена, вам тоже будет любопытно покопаться🙃
Карта землепользования США. Вообще это целая статья со скроллителлингом (новое слово!)* на Блумберге.

Данные от 2018 года, но суть не изменилась. Коров все еще очень много. Продолжая тему, Блумберг недавно с похожими визами рассказали о необходимости перехода к зеленой экономике.

Эксперт по Табло Александр Варламов, о котором я уже писала, вдохновившись статьей про землепользование, сделал анимированную версию карты. График почему-то не доступен, надеюсь, это временно, ссылку все равно приложу. Но интернет все помнит, нашла гифку в чате дата-журналистов.

Такую карту землепользования России сделали в рамках упоминавшегося проекта Россия в данных.

Не реклама, а дань увожения: карту США увидела в русскоязычном канале с адекватной аналитикой новостей США. Как американистка, беззастенчиво его советую.

*Статья, где при прокрутке появляются и исчезают визуальные элементы истории, часто графики. NYT такое любят: вот, например, про злоупотребление Трампом должностными обязанностями в личных интересах.
О мегарегионах. Изначально я думала просто поделиться картами, но почитала и оказалось интересно!

Первая карта с 11 мегарегионами - часть доклада "Америка 2050" о том, как должна развиваться страна. Карта - проекция метрополий будущего. За основу взяли данные о приросте населения. Проект призывает к тому, что гос.управление должно учитывать связи с соседними регионами. Поэтому лучше объединять инфраструктуру, унифицировать все, что можно (например, ПДД), совместно планировать законы.

CityLab рассказывали, почему такое сотрудничество стало особенно важно во время пандемии.

Вторая карта с 50 мегарегионами - результат пространственного анализа данных о ежедневных поездках на/с работу. Тут мегарегионы - центры притяжения рабочей силы. Здесь про методологию, а вот интерактивная версия. В Техасе сразу 6 мегарегионов!

Когда смотрю на такие карты, вспоминаю, что чем выше плотность, тем больше топят за демократов. (пруф с.56). Глубоких выводов пока нет, но буду делиться находками и дальше 🙃
Когда нужно собрать данные с тонны страниц в интернете - это боль. Не вернуть десятки часов, потраченные на ctrl-c ctrl-v в студенчестве 🥲

Процесс можно автоматизировать с помощью скрейпера/парсера (разница для нас не важна). Это инструмент, который имитирует человека: по очереди открывает ссылки и копирует инфу, а вы получаете готовую компиляцию. Скрейпер может быть программой или расширением для браузера. И, главное: он работает БЕЗ КОДА 🥳🥳

Я пробовала несколько парсеров, больше всего понравилось расширение Web Scraper. Интерфейс настолько простой, что достаточно посмотреть три коротких обучающих ролика. Вы буквально вводите стартовую ссылку, показываете, куда нажимать, что копировать и запускаете. (на картинке пример). Он сам что-то там шурудит, а вы свободны! Результат скачивается в .csv, с такой таблицей потом можно работать где угодно.

Об этой крутизне я узнала из вышкинского курса по дата-журналистике, его ведёт Алексей Смагин, автор канала о дата-сторителлинге. Советую полистать лекции курса.
Сбор_и_визуализация_данных_без_кода.pdf
1.6 MB
Недавно в родном ИМЭМО рассказала, как политологам начать собирать и визуализировать данные. Посоветовала несколько программ и ресурсов, показала базовые ошибки.

Немного доработала слайды: добавила тонну ссылок, чтобы было максимально полезно, и делюсь с вами здесь. Само выступление есть в записи, ссылка будет ниже.

Вообще мероприятие получилось очень интересное. У коллег были хорошие выступления, советую. Особенно меня зацепил доклад про сетевой анализ, про него в ближайшее время еще поговорим!
Forwarded from CМУ ИМЭМО РАН
По многочисленным заявкам слушателей семинара молодых ученых «Количественные методы исследований международных отношений» выступающие круглого стола опубликовали свои доклады. Теперь все желающие имеют возможность подробнее с ними ознакомиться.

Видеозапись мероприятия - https://www.youtube.com/watch?v=BauTbwVSH8M

Доклады:
Александр Оскарович Масленников – к.э.н. научный сотрудник Центра энергетических исследований ИМЭМО РАН
Метод приближения кривой роста для прогнозирования социально-экономических показателей

Татьяна Игоревна Хайнацкая – младший научный сотрудник Центра сравнительных социально-экономических и политических исследований ИМЭМО РАН
Сетевой анализ в социальных и политических исследованиях

Анна Николаевна Сытник – ассистент Кафедры американских исследований Санкт-Петербургского государственного университета
Перспективы анализа «больших данных» в области исследований международных отношений на примере данных социальных сетей

Анастасия Александровна Бунина – младший научный сотрудник Центра североамериканских исследований ИМЭМО РАН.
Сбор и визуализация данных

#мероприятияИМЭМО
Как сделать график лучше на примере виза коллег из ежеквартального бюллетеня инцидентов на российских границах.

Это базовые рекомендации, почитать подробнее можно тут и там.

1) Вертикальную ось лучше убрать, а цифры указать над столбиками. Тогда не нужны направляющие линии, которые засоряют визуальное пространство.

2) Советуют избегать пестрой палитры. Лучше сочетающиеся оттенки, но не яркие, не слишком контрастные. Градиент подойдет, но явно нужен ярче, чем у меня))

3) Не поленитесь поменять шрифт! Настройки по умолчанию портят впечатление. Кажется, что виз был сделан на скорую руку.

4) Изначально и так было правильно, но все равно отмечу, что легенда сбоку отнимала бы место у графика. Лучше полоской наверху или внизу, еще можно в пустом углу графика. Продвинутый уровень - перечислить категории в названии и покрасить их нужным цветом, как, например, здесь.

Пока не очень довольна результатом, работаем дальше) Во второй части поста укажу, что не так, и предложу более креативный вариант для этих данных.
Как сделать график лучше, ч.2

Что же было не так в моем графике выше?

1) Как многие могли заметить, цвета не очень различимы. Палитру придумать не получилось, потому что не очевидно, как назначить цвета, это же все вода. Взяла базовый синий градиент экселя и покрутила, но недостаточно. Значит, и мне, и вам нужен пост про подбор палитры 🦖

2) Не очень нравится сам выбор вертикального барчарта: если бы столбцы были горизонтальными, то регионы были бы слева от них, и легенда была бы не нужна.

3) График получился очень длинный: было бы легче воспринимать, если бы единица внутри колонки была квадратом, а не прямоугольником.

4) Разброс данных такой маленький, что хочется из столбцов сделать квадраты (unit chart), а то и вовсе пиктограммы, ведь в данных есть ещё две категории - тип инцидента и уровень опасности.

К счастью, пиктограммы у автора дайджеста были заготовлены, и я их понесла в Табло. Задачей было на одном графике отобразить весь скоп данных, чтобы читатель сам выбрал интересующий его аспект.

Показываю свои наброски, в описании картинок - про плюсы и минусы. Можно вместе со мной заметить ошибки и потом не делать их самим!

Итоговый вариант разместят на сайте, но уже сейчас спрашиваю ваше мнение 🌝
HTML Embed Code:
2025/07/04 17:03:19
Back to Top