Для чего мы визуализируем табличные данные с помощью карт и диаграмм? Я полагаю - чтобы иметь возможность окинуть одним взглядом все многообразие имеющейся у нас информации. При этом "один взгляд" остается постоянным требованием к визуализации (все, или по крайней мере все значимые данные должны быть "налицо", представлены на визуализации); но вот то, что мы хотим этим взглядом увидеть - то, что должно сразу броситься в глаза при разглядывании картинки - различно для каждого из типов визуализаций.
Так, разглядывание тепловой карты позволяет сразу же найти особые по данному показателю страны:

Один взгляд - и сразу видно, что принимать во внимание нужно только США, Китай, и может чуток Россию и Индию. Остальная мелочь - не в счет. Если нужно быстро, за полсекунды, разглядеть до десятка мировых лидеров по какому-то показателю - карта незаменима. Ведь тут даже читать название страны не требуется - само расположение мгновенно вызывает из памяти нужный образ.
Попробуем распространить эту идею - каждый визуализатор обеспечивает решение одной задачи, но решает ее лучше всех остальных - на более широкий класс визуализаторов.
1. Столбиковые диаграммы, они же Bar Chart, Column Chart.
На первый взгляд, они решают ту же задачу, что и карты - быстро выделить "ведущие страны". Но как раз в этом качестве они и неудобны: если выводить (в соответствии с принципом "все перед глазами") на диаграмму все страны, названия их сольются в сплошную черную полосу:


Мудрый Эксел убирает промежуточные названия, позволяя читать хоть какие-то; но вот так сразу сказать, кто у нас там в лидерах по душевому ВВП после Люксембурга, не получится. Да и нужно ли это? Ведь текстовый список стран-лидеров и так есть в таблице.
Что же тогда на самом деле дает нам столбиковая диаграмма? А вот что: она позволяет мгновенно оценить вид одномерной кривой распределения некоего параметра по странам мира. Взгляните на графики: коэффициент Джини меняется от страны к стране линейно, а вот душевой ВВП рисует куда более хитрую кривую. Только ради этой кривой мы и смотрим на диаграмму - всю прочую информацию лучше получать из других источников.
Запуская анимацию, мы точно так же смотрим, менялась ли форма кривой распределения (в случае с душевым доходом это изменение еще непонятно что означает, но если поставить вместо нее Yield Curve, то такая диаграмма уже станет интересна большинству экономистов). Итак, столбиковые диаграммы нужны для просмотра кривых распределения.
2. Диаграмма с областями, или Area Chart.
В отличие от флеш-роликов, которыми мы пользуемся в Пульте, Эксел не строит полупрозрачные диаграммы с областями, поэтому я имитировал их наложение друг на друга с помощью третьего измерения:

Полагаю, Вы уже догадались, зачем нам нужны Area Chart (кто смотрел Модель элитных групп по Ефимову, и так это помнит). Да, именно для того, чтобы сравнивать между собой кривые распределения. Детей больше в Афганистане, людей среднего возраста в России, пожилых в Японии - один взгляд на график, и все различия как на ладони. Ничего больше от диаграммы с областями не требуется - но это сравнение она делает лучше всех.
3. Круговая диаграмма, или Pie Chart
Поскольку общий принцип мы уже уловили, определение главной задачи, решаемой этим визуализатором, находится мгновенно:

Круговая диаграмма позволяет мгновенно ответить на вопрос, насколько велика доля ведущих стран (которых сразу видно на карте - но не видны их суммарные %%) в суммарном значении показателя. Да, Германия и Китай экспортируют много - но 50% мирового экспорта приходится на целых 10 государств, а "длинный хвост" составляет почти 20%. Экспорт на Земле далеко не так монополизирован, как к примеру добыча нефти или производство атомных бомб.
Итак, круговые диаграммы позволяют нам мгновенно оценить процентные доли ведущих стран - как по отдельности, так и вместе для первых N лидеров.
4. Точечная диаграмма, или Plot Chart, Bubble Chart.
Если столбиковая диаграмма позволяет нам быстро оценить кривую распределения стран по одному параметру - то должна существовать и диаграмма, позволяющая сделать то же самое по двум и более показателей. Этой цели служит точечная диаграмма:

Как видите, душевой ВВП и душевое потребление электроэнергии связаны практически линейной зависимостью, которая нарушается для больших уровней того или другого (мало стран, велика роль случайности). Если вместо Plot Chart использовать Bubble Chart (как на гапмайндере и следом за ним практически везде), то размеры значков подскажут нам, есть ли связь показателей X и Y с этими самыми размерами.
Итак, точечный график позволяет нам быстро увидеть двух- и более мерные функции распределения. Ну и примерно прикинуть, где та или иная страна находится в этом многомерном пространстве. К кому поближе, от кого - подальше.
Вывод.
При создании инструментов Пульта, повторяющих уже существующие визуализаторы, нужно главное внимание уделить основной функции этих визуализаторов. Той, которая выявлена в этой короткой заметке.
November 12 2009, 17:45:17 UTC 2 years ago
November 12 2009, 18:04:43 UTC 2 years ago
Да, красиво
Но наглядность там срабатывает только для стран с узнаваемым расположением. Если выпрет по производству коки какая-нибудь латиноамериканская страна - без пояснений не поймешь, какая именно. Так что цветовой вариант надежнее. Габон, скажем, на карте облачности сразу видно, а будь это ворлдмаппер, пришлось бы гадать, что это за большая африка такая :)November 12 2009, 18:13:47 UTC 2 years ago
Re: Да, красиво
ну это больше в юмористическом ключе:)November 12 2009, 18:22:29 UTC 2 years ago
Re: Да, красиво
На "больших" странах - много места, можно надписи надписать.А на температурных картах какие-нибудь европейские страны или там Сингапур сложно различить, в какой цвет ни крась (ну и узнавать их точно так же надо по расположению или надпись смотреть - в этом отношении разница невелика).
Так что, имхо, "раздувание" областей полезности карте прибавляет.
November 12 2009, 17:51:32 UTC 2 years ago
Сильно. Очень.
По сути это не просто какой-то там датапульт, а методика быстрого анализа данных. В комплекте с необходимым инструментарием (надеюсь, что получится все). Нереально круто.Через годик можно будет начинать читать курс в MIT "Методика быстрого анализа данных", и выдавать сертификаты "Блоггер-аналитик 2го разряда" ну или "Он-лайн разведчик - аналитик" ;) Хотя.. Пермский госуниверситет в лидеры двигают? Вот и паровозное направление.. Если Вы к пермским березкам прикипели душой /-)