--
Вы получили это сообщение, поскольку подписаны на группу opendata-belarus.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Настройки подписки и доставки писем: https://groups.google.com/d/optout.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.
Хорошо, мы начинаем 2012
Распознать не проблема, просто надо будет синхронизироват ься по обработке данных, чтобы не делать двойную работу. Если что, я могу закончить с распознаванием.
Обновил train https://github.com/ushchent/el_machina. Там все кампании с 2000 года.
Вижу, что тепер уже два репозитория. :( А как в гитхабе
синхронизировать основной репозиторий и его форк? И можно ли это
делать автоматически?
Спасибо, попробуем сейчас всё отформатировать в одном виде
Я собираюсь залить все данные в один репозиторий как только закончим с разбитием на релевантные колонки типа профессии
...
Я бы еще добавил "является действующим депутатом парламента / не является". Потому что в последние годы наличие у кандидата депутатского мандата фактически означает 100% проходимость в новый состав.
Как минимум, есть такой набор -
https://github.com/ushchent/el_machina/blob/master/train.csv.
Здесь все кандидаты и сведения о (не)прохождении.
Еще будет объединенный набор.
А в этом наборе уже добавлено https://github.com/ushchent/el_machina/blob/master/train.csv. Данные о депутатстве извлечены из сведений о кандидате.
Наверное, дело у в том, что мы пошли с разных концов. Я начал
собирать данные по кандидатам, а вы в Глебом - по депутатам. Надо
подумать как свести эти концы вместе, тем более что по депутатам
публикуются гораздо более подробные сведения, чем по кандидатам
(которых почти сразу забывают после кампании).
Если честно, то я сомневаюсь, что профессия влияет на избрание
кандидата депутатом. Т.е. для предсказания это вряд ли важный
фактор.
С другой стороны, данные нормализовать нужно - просто для
порядка. Если их действительно так много получается, то может быть
сделаем поле "сфера деятельности", и туда их сольем. Например,
экономист, менеджер и директор магазина уйдут в одну категорию
"Торговля" или "Промышленность" (в зависимости от предприятия).
Еще можно выделить категории "Образование", "Наука", "Государство"
... Штук 10-15, думаю, хватит.
Как-то так. К сожалению, раньше субботы я этим плотно заняться не
смогу.
БелТА запустила тест для кандидатов, http://www.belta.by/society/view/smozhete-li-vy-stat-kandidatom-v-deputaty-projdite-test-belta-200888-2016/. Сделано не без юмора на платформе PlayBuzz.
Я от балды набрал 7 из 7, но там явно не хватает вопроса о том,
сколько времени хранятся бюллетени и какой срок давности за
фальсификацию результатов. :)
Вообще, тесты на разные темы - интересная штука, давно про это
думаю. Может, кто знает какой-нибудь специальный фреймворк для
быстрого создания тестов? Я имею в виду, не на чужом хостинге, а
чтобы у себя разместить и создавать тесты.
--
Вы получили это сообщение, поскольку подписаны на группу "opendata-belarus".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.
Прогноз от НН, http://nn.by/?c=ar&i=173508. Правда, на основе
выдвиженцев.
У нас задача-максимум сделать модель, которая будет принимать
список кандидатов и выдавать список наиболее вероятных депутатов.
Еще по теме - избирательный тотализатор от движения "За свободу",
http://naviny.by/rubrics/elections/2016/07/21/ic_news_623_478513/
И еще по методике угадывания депутата - выкладки от БП, http://www.belaruspartisan.org/politic/351860/
Полный список кандидатов должен вот-вот появиться.
А вот и списки кандидатов по регионам -
http://rec.gov.by/ru/Elections-PPNS6-Vidv_kan
И тотализатор "За свабоду" - http://2016.pyx.by/
Ну ладно, а есть список вообще всех, кто собирался? А то кто по каким причинам выбыл - это дело десятое.
Почему не 42? Хотя я знаю ответ.
--
Вы получили это сообщение, так как подписаны на группу "opendata-belarus".
Чтобы отменить подписку на эту тему, перейдите по ссылке https://groups.google.com/d/topic/opendata-belarus/Dah2yNTlsuo/unsubscribe.
Чтобы отменить подписку на эту группу и все ее темы, отправьте письмо на электронный адрес opendata-belarus+unsubscribe@googlegroups.com.
Почему не 42? Хотя я знаю ответ.
--
Вы получили это сообщение, так как подписаны на группу "opendata-belarus".
Чтобы отменить подписку на эту тему, перейдите по ссылке https://groups.google.com/d/topic/opendata-belarus/Dah2yNTlsuo/unsubscribe.
Чтобы отменить подписку на эту группу и все ее темы, отправьте письмо на электронный адрес opendata-belarus+unsubscribe@googlegroups.com.
Мой список,
https://github.com/ushchent/el_machina/blob/master/test.csv
Список "НН", http://nn.by/?c=ar&i=175300
На днях узнаем, кто и насколько оказался прав.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belarus+unsubscribe@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.
--
Вы получили это сообщение, поскольку подписаны на одну из тем в группе "opendata-belarus".
Чтобы отменить подписку на эту тему, перейдите по ссылке https://groups.google.com/d/topic/opendata-belarus/Dah2yNTlsuo/unsubscribe.
Чтобы отменить подписку на эту группу и все ее темы, отправьте письмо на электронный адрес opendata-belarus+unsubscribe@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.
Описание и данные были тут https://opendata.by/blog/1101.
У меня получилось 90% попадание, у НН - 96%.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
У меня получилось 90% попадание, у НН - 96%.
Ну знаешь, ты бы еще через неделю спохватился. :) Ветка с мая
месяца работает.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Список в приложении.
В поле status "2" означает, что кандидат снялся. Правда, там
только 40 снявшихся, а в ЦК говорили про 41.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Здорово!
А можно ли на будущее добавить средний и медианный возраст по выборке? Там, где раздел "Отфильтровать по возраст:"
Например, я выбрал всех партийных депутатов этого созыва,
http://elmachina.opendata.by/personazhy?f[0]=field_personazh_god_vyborov%3A1601&f[1]=field_kand_dep%3A2&f[2]=field_personazh_partiynyi_or_not%3A11,
сразу вижу какие там партии и населенные пункты представлены, а
средний возраст приходится самому высчитывать.
У нас среди журналистов и аналитиков есть небольшой спрос на
такие цифры, например вот http://nmnby.eu/news/analytics/6165.html
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Можно попробовать. Мат. аппарат не подкинет кто-нибудь касательно медианного? Средний то просто - сложили и разделили.
Медиана - это середина списка (если четное количество элементов) или среднее двух значений посередине (если нечетное количество элементов).
[1, 2, 3, 4, 5] - медиана будет 3
[1, 2, 3, 4, 5, 6] - медиана 3.5
А это пхп считает или js? Потому что в D3.js есть встроенные
функции для простого анализа данных, те же mean() и median().
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
А, попутал четное с нечетным. :(
Да, а если еще при возможности добавить поиск по ФИО, то будет
совсем круто.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Тут Алина передает со слов Егора, что Эльмахина хорошо проиндексировалась и рулит в выдаче по ФИО многих депутатов/ кандидатов.
Одновременно, новый сайт нижней палаты (house.gov.by) находится в тестовой версии и пока показывает только 2 последних созыва депутатов. Значит, у Эльмахины есть хороший шанс стать альтернативным источником данных и аналитики по нашим политическим кампаниям.
Думаю, есть смысл эту тему штурмануть: какой функционал и данные нужны на сайте и как это все хозяйство дальше поддерживать. Потому что следующие выборы только в 2018 году (местные), а новый парламент у нас стартовал очень активно, эти люди уже по телевизору вовсю гутарят и строят планы.
Дальше предложения в порядке обсуждения (Егор, дай знать, что из
этого реально и как можно сделать):
- сделать на странице персонажа (депутата) выдачу его земляков (для депутатов указано место рождения) и однопартийцев
- выводить на странице депутата разнообразнуь статистику по его
избирательному округу (рождаемость, браки/разводы, экономический
рост, преступность) и т.д. Пускай они сами у нас смотрят, что у
них в округе творится. :)
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
По обещаниям будет реально сложно поддерживать, там же 110 депутатов. Была попытка у ОГП (http://naviny.by/rubrics/opinion/2011/06/17/ic_articles_410_174038), но там все быстро затихло. Разве что можно вывести положения предвыборной программы депутата.
По данным - уже сечас можно использовать, например, набор по
зарплатам из zarplaty.opendata.by. Только там данные по районам,
так что надо как-то сопоставить избирательные округа и районы.
Например, данные загрузить на портал и подгружать через API
(заодно и API будет в деле)... Только на портале обновлять данные
пока не очень удобно. :(
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Если я ничего не путаю, то сейчас процесс загрузки и обновления выглядит так https://groups.google.com/d/msg/opendata-belarus/Fe1vb062ZXY/wFGvnc2pBAAJ
Хотелось сократить число шагов. Может быть, гитом обновлять или
еще как-то. Потому что когда ресурс один, то еще куда ни шло, а
если их с десяток, то это целая отдельная задача.
Еще можно дать ссылку на страницу проекта
https://opendata.by/project/1100
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Раздел на сайте ЦК по местной избирательной кампании 2018 года http://rec.gov.by/ru/vybory-2018.
Кроме этого, прогресс не стоит на месте, и горисполком
опубликовал красивую векторную карту избирательных округов в
Минске
https://minsk.gov.by/ru/freepage/other/minsk.okruga.2018/belkarta.html.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
Кстати, по Белстату можно не архивировать хтмл-странички за отдельные годы, а выгружать данные за нужный период в разных форматах из базы http://dataportal.belstat.gov.by/Indicators. Правда, там не очень оперативное обновление. Но зато есть многие данные того же МВД и других госорганов.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
И насчет списка сайтов с данными - Государственный регистр
информационных ресурсов Беларуси.
Здесь около 14 000 записей, есть как госорганы, так и учебные
заведения и т.д., http://www.ipps.by:9087/apex/f?p=124:65:0::NO
Вдобавок к нему, список информационных систем,
http://www.ipps.by:9087/apex/f?p=124:201:0::NO
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belar...@googlegroups.com.
--
Вы получили это сообщение, поскольку подписаны на группу opendata-belarus.
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес opendata-belarus+unsubscribe@googlegroups.com.
Настройки подписки и доставки писем: https://groups.google.com/d/optout.