Позначки

Скоро відбудуться позавибори в Верховну Раду України – а отже треба якось розібратись їз кандидатами. Як же ж тут без автоматизації? (-:

Для початку я вирішив зібрати дані з сайту ЦВК в зведену таблицю. Код тривіальний, тому мабуть немає потреби навіть викладати (тим більше що я не витрачав часу на доведення його до пристойного стану).

Результати:
http://mvmn.ho.ua/radaelect2014/ – зведена таблиця по округам
http://mvmn.ho.ua/radaelect2014/candidates.html – зведена таблиця по кандидатам

Також в процесі написання парсера для сайту ЦВК я розібрався з Apache POI і ще деякими хитрощами, необхідними для видобування тексту та зображень з файлів з програмами кандидатів (адже багато кандидатів додали малюнки в програми… точніше деякі додали ілюстрації, а багато хто просто вставив скан тексту своєї програми як зображення в word document файл :facepalm: ). Але наразі не придумав як би це все викласти гарно. Розпізнавати текст з паршивих сканів – зовсім не варіант. А викласти частину програм – текстом, а частину – зображеннями, мало толку.

Наразі викладу принаймні тексти, які вдалось випарсати.
http://mvmn.ho.ua/radaelect2014/programs.html (Увага – розмір файлу 21 мегабайт!)

Ось наразі і все.

Advertisements