June 2nd, 2010

Заработал datapult.info, или О вики-активности на разных языках

Полгода назад я бы откупорил ящик шампанского, а сейчас этой торжественной даты даже не заметил. Итак, проект датапульт вышел из альфа-тестирования и отныне является работающим веб-сервисом по созданию различных визуализаций. А вот у меня из-за новой работы нет даже времени им как следует воспользоваться...

К счастью, neo_der_tall подготовил неплохой датасет по активности разных народов в международной Википедии, и я могу проиллюстрировать возможности Пульта "малой кровью" (на чужих данных). Итак, Убога ли русская википедия? Поиграться с датасетом можно здесь - Википедия разноязычная, ну а я приведу несколько понравившихся мне картинок.

Во-первых, популярность википедии у разных народов (число зарегистрированных пользователей на 1 млн. говорящих на языке, включая тех, кто ни разу ничего не написал):



Русский язык (раскраска идет не по странам, а по носителям языка, поэтому посреди Африки имеется красное пятно - англоязычная (упс!) Нигерия) - полный аутсайдер. Лишний пример того, что русские после почти столетней дрессировки "сиди и не высовывайся" мало склонны делать добро соплеменникам - еще подумают, что боишься, и решат, что терпила.

Число статей (на 1 млн. говорящих):



Здесь уже сказывается советское наследие - хотя среди русских альтруистов и днем с огнем не сыщешь, но если уж кто нашелся, то он будет покультурнее среднеафриканского альтруиста. Поэтому число статей на 1 млн. вполне достойное, на уровне Бразилии.

И наконец, зависимость числа статей от числа активных пользователей:



Как видите, массовая культура - вопрос скорее числа, чем умения. Один супер-мега-гений не заменит (по числу охваченных тем) сотни середняков. Размеры кружочков отражают "глубину правки" статей; угадайте не заглядывая в первоисточник, какому языку принадлежит самый большой кружок болотного цвета :)

Ну а теперь краткая похвала всему проекту. Собрав датасет из 16 показателей, мы получаем возможность построить сотни визуализаций. Построение одной картинки к другой происходит в нашем датапульте за доли секунды, в отличие от многих других серверов ("толстый клиент", однако). Таким образом, появляется возможность разделить труд - одни собирают данные, другие их анализируют, что я и продемонстрировал на датасета по википедиям. Наш датапульт - своего рода википедия для данных!

P.S. Вот только есть у меня подозрение, что русские, как следует из рис.1, не слишком-то поторопятся делиться своими датасетами. Потому-то проект и называется - Simplest Way to Visualize, Store, and Publish Your Data Rows, а не "Лучшее место для хранения и визуализации Ваших данных".

Для пермяков - любопытная инициатива городской администрации

Состояние отдельных (до 50%) пермских дорог можно охарактеризовать как "яма на яме" ("после бомбежки", как любят иногда выражаться, все же преувеличение). Мне самому пару раз хотелось забабахать интернет-ресурс с визуализацией состояния этих дорог (чтобы потом задавать соответствующим службам вопрос - а что ж вы хорошие дороги ремонтируете, когда рядом совсем уж ужасные?). Уверен, что та же мысль приходила в голову многим пермякам. Но сегодня очередь дошла до и.о. Главы Администрации города!

Сегодня утром, на личной встрече, и.о. главы Администрации Перми Анатолий Маховиков предложил мне и Дмитрию Жебелеву создать канал оперативной связи между жителями Перми и Администрацией.

понятно почему Дмитрию Жебелеву: он вдохновитель и организатор акции Город разбитых дорог на форуме Терон, результатом которой явилось появление сегодня вот такого плаката при въезде на Красавинский мост со стороны Москвы и очевидно сегодняшняя встреча:




"Канал оперативной связи" в 21 веке создавать, конечно же, проще в виде интернет-ресурса:

Возник вопрос "На какой платформе это делать?". Дело в том, что в Перми самое сильное и активное сообщество автолюбителей сосредоточено на форуме Тероне. Но создать там тему - это значит похоронить под обсуждениями фотки и самое главное не будет прямой и чёткой связи между фотографией ямы и отчётом о её заделке.

Система постов в сообществах в ЖЖ подходит больше: 1 пост - 1 яма, а в каментах к ней фотоотчёт. И кураторы из администрации города быстро и чётко смогут отслеживать процесс и наказывать как нерадивых чиновников из районных админситраций, так и нерадивых подрядчиков.

Но сообщество в ЖЖ заметно меньше, чем на Тероне и не все с Терона пойдут в ЖЖ.

Третий вариант - создание отдельного сайта. Но проблем с ним ещё больше, чем с сообществом в ЖЖ.


Мое мнение - нужно разместить этот веб-ресурс на сайте вроде http://road.perm.ru/, обеспечив возможность добавлять туда фотографии ям похожим на Google Panoramio образом. Попробую донести эту идею до заинтересованных лиц, а френдов попрошу поделиться своими соображениями здесь или в журнале legart.