Dewarp before all the rest !!!

91 views
Skip to first unread message

stude...@gmail.com

unread,
Oct 8, 2015, 5:54:33 AM10/8/15
to scantailor-devel
Здравствуйте!

Имею опыт работы с распознаванием сканов (Cuneiform, Iris, FineReader и др.) около 10000 страниц. Еще с 2006 года.
Самая важная функция - выпрямление изображения. Именно после фотоаппарата!! Со сканера искажения минимальны.

Строго говоря из всего арсенала программы необходимы 2 функции - dewarp и change resolution (>= 5000).  Остальное, в сравнении, классные дополнения.

Ваш алгоритм DEWARP - c точки зрения GUI - лучший из виденного. 
Почему он доступен только после "Output" ? Есть технические ограничения по алгоритму? Время выполнения - не важно - можно на ночь поставить.

Еще в данный момент выполняю обработку изображений полученных с камеры 10 mpx. - разрешение( Scan Tailor ) в 1200 - не достаточно для различения букв. Надо мин. 1200*2.

Буду рад получить указания по установке рабочей среды (?? Visual Studio | CodeBlocks| Eclipse..... + дополнит. библиотеки ) для переделки программы "под-себя".

ИМНО - правильная  последовательность: dewarp > fix orientation > deskew (combine with crop?)> split pages > set resolution > crop> select content> set margines.

Было бы круто - возможность устанавливать последовательность операций самому. 

С уважением, Даниэл.

joseph.ar...@gmail.com

unread,
Oct 21, 2015, 4:11:40 PM10/21/15
to scantailor-devel

On Thursday, October 8, 2015 at 10:54:33 AM UTC+1, stude...@gmail.com wrote:

Ваш алгоритм DEWARP - c точки зрения GUI - лучший из виденного. 
Почему он доступен только после "Output" ? Есть технические ограничения по алгоритму? Время выполнения - не важно - можно на ночь поставить.

Перенос DEWARP на стадию DESKEW был в планах давно, но это было действительно не просто реализовать. Пришлось вносить значительные изменения в архитектуру. Вот кстати тот самый коммит, который перекроил архитектуру: https://github.com/Tulon/scantailor/commit/3631ce3afdae119630591edd03b26104771edf7e
По размерам впечатляет.

Ситуация на данный момент такая: код живет в ветке experimental, но не в оффициальном репозитории, а в моем личном:
https://github.com/Tulon/scantailor/tree/experimental

Более или менее все работает, кроме версии для коммандной строки, которая поломана основательно. Время от времени делаю релизы:
https://github.com/Tulon/scantailor/releases

Есть ветка обсуждения на англоязычном форуме:
http://www.diybookscanner.org/forum/viewtopic.php?f=21&t=3195

Совместимости проектных файлов нет, хотя список страниц в проекте должен загрузиться.

У проекта новый мэйнтейнер, но мэйнтейнится он очень вяло - почти никак. Я время от времени пилю ветку experimental.

Новых официальных релизов ждать видимо не стоит, впрочем это в компетенции нового мэйнтейнера. Ветка experimental к релизу не готова, а вот к использованию - пожалуй уже да. Кроме того, она сильно быстрее - есть и параллельная обработка (только в 64bit версии) и даже OpenCL.
 

Буду рад получить указания по установке рабочей среды (?? Visual Studio | CodeBlocks| Eclipse..... + дополнит. библиотеки ) для переделки программы "под-себя".

В исходниках есть документация по сборке: packaging/windows/readme.ru.txt
 

ИМНО - правильная  последовательность: dewarp > fix orientation > deskew (combine with crop?)> split pages > set resolution > crop> select content> set margines.

В версии experimental:
fix orientation -> split pages -> (dewarp или deskew) -> select content -> margins -> output

Reply all
Reply to author
Forward
0 new messages