Анонс проекта: Публичные доходы - база деклараций чиновников и депутатов в России

24 views
Skip to first unread message

Ivan Begtin

unread,
Mar 21, 2012, 3:50:06 AM3/21/12
to opengo...@googlegroups.com, webofdat...@googlegroups.com, okf...@lists.okfn.org

Коллеги, 

Пришла пора озвучить еще один новый проект которым мы  занимались в прошлом году и немного даже в этом. Это проект - Публичные доходы или publicprofit.ru

Что это такое?

Проект "Публичные доходы" - это база публичных деклараций чиновников и депутатов Российской Федерации раскрываемых согласно требованиям российского законодательства. Проект включает каталог опубликованных источников и базу деклараций доступную для поиска и навигации.

Ну а если совсем уж по простому.

Уже 3 года в России чиновники публикуют декларации. Вернее ведомства публикуют выписки из их деклараций, но все в разных формах и документах. Мы собрали если не все, то очень многие из документов и все что можно было обработать автоматически - обработали. Всего получилось что-то около 50 тысяч деклараций.

Задача технически была очень непростой, было написано множество парсеров под разные источники, тщательно структурировались данные по автомобилям, недвижимости и доходам. Для каждого гражданина и гражданки определялся автоматически определялся пол, идентифицировалось имущество, где оно находится и так далее. В общем получилось эдакая очень структурированная база данных из которой можно делать очень хитрые выборки. В виде этих выборок и есть множество отчетов на сайте которые Вы уже видите.

Главная проблема с которой мы столкнулись с тем что много некачественных данных - орфогрфических и порядковых ошибок в цифрах.

Проект делался по заказу ИНСОРа и вчера был озвучен во время представления их отчета по работе за 4 года. Собственно я бы на него не решился не имея какой-либо значимой институциональной поддержки, потому как тема деклараций очень чувствительная, а мы подошли к ней очень плотно дотянувшись до всех данных которых только можно было. Хотя и идея эта давно уже бродила в головах, но инициатив пока немного.

На этом же фоне сошлюсь на похожий проект у Трансперенси в России - http://declarator.org

Чем-то их проект лучше, чем-то лучше наш. У них больше данных с временной глубиной, у нас шире охват. У них лучше структуризация по ведомствам и регионам, у нас по структуре имущества и транспортными средствами. В общем много всего.

Понятно что проекту многого нехватает, в частности нет API, нет дампов данных, нет многих возможностей которые хотелось бы получить. Скорее всего все это появится

Если у Вас есть идеи, предложения и мысли что можно добавить/улучшить или пожелания по интеграции - пишите, постараемся их реализовать

Еще один план - мысль и идея в разработке онтологии финансовой открытости. Так чтобы эти данные можно было бы сразу интегрировать в Linked Data и чтобы они, в принципе, могли бы стать предметом научного исследования. 

--

Best Regards,
  Ivan Begtin

CEO of IDALab (http://www.idalab.ru)

twitter: ibegtinpersonal website: ivan.begtin.name


Yury Katkov

unread,
Mar 21, 2012, 3:56:08 AM3/21/12
to opengo...@googlegroups.com, webofdat...@googlegroups.com, okf...@lists.okfn.org
С радостью помогу в преобразовании этих данных в RDF. 
Вопрос - обновляются ли данные по декларациям и как часто? 
-----
Yury Katkov




2012/3/21 Ivan Begtin <ibe...@gmail.com>

--
Вы получили это сообщение, поскольку подписаны на группу opengovdata.ru.
Чтобы добавлять сообщения в эту группу, отправьте письмо по адресу opengo...@googlegroups.com.
Чтобы отменить подписку на эту группу, отправьте сообщение по адресу opengovdatar...@googlegroups.com.
О дополнительных функциях можно узнать в группе по адресу http://groups.google.com/group/opengovdataru?hl=ru.

Ivan Begtin

unread,
Mar 21, 2012, 5:09:38 AM3/21/12
to opengo...@googlegroups.com, webofdat...@googlegroups.com, okf...@lists.okfn.org
Данные по декларациям будут обновляться, вернее добавляться по мере их публикации на сайтах ведомств. 
По преобразованию в RDF - спасибо, в ближайшее время продумаем как предоставить данные чтобы с ними можно было бы начать работать.

С уважением,
  Иван

21 марта 2012 г. 11:56 пользователь Yury Katkov <katkov...@gmail.com> написал:

theCAXAP

unread,
Mar 23, 2012, 6:54:55 AM3/23/12
to opengo...@googlegroups.com, webofdat...@googlegroups.com, okf...@lists.okfn.org
Круто, молодцы!
Иван, здесь дублируются сведения по некоторым господам, причин не увидел, скорей всего ошибка.

среда, 21 марта 2012 г. 11:50:06 UTC+4 пользователь Бегтин Иван написал:
Reply all
Reply to author
Forward
0 new messages