Коллеги,
Пришла пора озвучить еще один новый проект которым мы занимались в прошлом году и немного даже в этом. Это проект - Публичные доходы или publicprofit.ru
Что это такое?
Проект "Публичные доходы" - это база публичных деклараций чиновников и депутатов Российской Федерации раскрываемых согласно требованиям российского законодательства. Проект включает каталог опубликованных источников и базу деклараций доступную для поиска и навигации.
Ну а если совсем уж по простому.
Уже 3 года в России чиновники публикуют декларации. Вернее ведомства публикуют выписки из их деклараций, но все в разных формах и документах. Мы собрали если не все, то очень многие из документов и все что можно было обработать автоматически - обработали. Всего получилось что-то около 50 тысяч деклараций.
Задача технически была очень непростой, было написано множество парсеров под разные источники, тщательно структурировались данные по автомобилям, недвижимости и доходам. Для каждого гражданина и гражданки определялся автоматически определялся пол, идентифицировалось имущество, где оно находится и так далее. В общем получилось эдакая очень структурированная база данных из которой можно делать очень хитрые выборки. В виде этих выборок и есть множество отчетов на сайте которые Вы уже видите.
Главная проблема с которой мы столкнулись с тем что много некачественных данных - орфогрфических и порядковых ошибок в цифрах.
Проект делался по заказу ИНСОРа и вчера был озвучен во время представления их отчета по работе за 4 года. Собственно я бы на него не решился не имея какой-либо значимой институциональной поддержки, потому как тема деклараций очень чувствительная, а мы подошли к ней очень плотно дотянувшись до всех данных которых только можно было. Хотя и идея эта давно уже бродила в головах, но инициатив пока немного.
На этом же фоне сошлюсь на похожий проект у Трансперенси в России - http://declarator.org
Чем-то их проект лучше, чем-то лучше наш. У них больше данных с временной глубиной, у нас шире охват. У них лучше структуризация по ведомствам и регионам, у нас по структуре имущества и транспортными средствами. В общем много всего.
Понятно что проекту многого нехватает, в частности нет API, нет дампов данных, нет многих возможностей которые хотелось бы получить. Скорее всего все это появится
Если у Вас есть идеи, предложения и мысли что можно добавить/улучшить или пожелания по интеграции - пишите, постараемся их реализовать
--
Вы получили это сообщение, поскольку подписаны на группу opengovdata.ru.
Чтобы добавлять сообщения в эту группу, отправьте письмо по адресу opengo...@googlegroups.com.
Чтобы отменить подписку на эту группу, отправьте сообщение по адресу opengovdatar...@googlegroups.com.
О дополнительных функциях можно узнать в группе по адресу http://groups.google.com/group/opengovdataru?hl=ru.