Скрипт "Поиск неразмеченных стихов"

22 views
Skip to first unread message

stokber

unread,
Jul 5, 2024, 3:49:25 PMJul 5
to Fiction Book Editor
Представляю новый сценарий.
Скрипт задумывался как помощник поиска возможных стихотворных строк среди прозаических и прочих,  в чём мне и видится его основное назначение. Сценарий является надстройкой к известному скрипту уважаемого Sclex-а «Поиск по регекспам».
Какие строки для скрипта являются поэтическими?
Строка должна быть не очень длинной. Наш сценарий считает подходящими строки длиной не более 69 символов. Этих строк должно быть не менее двух строк подряд. Если этих строк более двух, они могут быть разделены пустыми строками. Если строк всего две и между ними пустая, то такая конструкция стихом не считается. Также одним стихом не считается группа строк выполненная разным стилем начертания, например, обычным текстом и курсивом или жирным и т. п. Исключением является только строка, содержащая дату написания стихотворения, обычно такая строка является и последней. Она может быть оформлена любым начертанием. Не считаются стихотворными также строки уже оформленные любыми блочными элементами (напр. заголовки, цитаты, эпиграфы, аннотации) и подзаголовками. По умолчанию они являются уже проверенными и проставленными вручную.
Что бы избежать ложных срабатываний из поиска исключены, как более характерные для прозаического текста:
строки, начинающиеся с тире и дефисов (как реплики диалогов);
строки (не более двух), одна из которых заканчивается точкой, а вторая — двоеточием;
группа строк, все из которых заканчиваются точками;
все строки содержащие числа цифрами, кроме даты стихотворения и маркеров сносок;
строки содержащие интернет-адреса и адреса электронной почты;
строки, содержащие сокращения (напр. и т. д, и т. п.)
и некоторые другие.
Строкой-датой скрипт считает строку, содержащую четырехзначное число в диапазоне 1700-2029. Более раннее датирование мне не попадалось, более позднее пока тоже. Но это можно по надобности расширить. Отфильтрованы различные 1920-е, 1930-х и пр.
Вопрос, что считать стихами, а что прозой является дискуссионным не только для нас, скромных книгоделов, на также и для мастистых литературных критиков. Так что, хоть и в малой мере, но к сожалению остаётся место как для некоторых ложных срабатываний, так и для возможных «недонахождений». Но на то и щука, чтобы карась не дремал…
Надеюсь, скрипт покажется полезным.

Ссылка для скачивания скрипта:(положить в папку "Scripts\09_Стихи")

stokber

unread,
Jul 5, 2024, 4:06:48 PMJul 5
to Fiction Book Editor
В тестировании и отладке скрипта самое активное участие принимал TaKir, за что ему огромная благодарность. Сценарий писался по его просьбе и подсказанным им идеям.

пятница, 5 июля 2024 г. в 22:49:25 UTC+3, stokber:

stokber

unread,
Jul 5, 2024, 4:12:40 PMJul 5
to Fiction Book Editor
        >В тестировании и отладке скрипта самое активное участие принимал TaKir, за что ему огромная благодарность. Сценарий писался по его просьбе и подсказанным им идеям.
Что, конечно, вовсе не снимает с меня никакой ответственности в случае каких-либо возможных некорректностей его (скрипта) работы.

пятница, 5 июля 2024 г. в 23:06:48 UTC+3, stokber:

e-paper.ru

unread,
Jul 5, 2024, 4:42:26 PMJul 5
to fiction-b...@googlegroups.com
Большое спасибо тебе за этот скрипт, очень помогает в поиске и оформлении стихов!

пт, 5 июл. 2024 г. в 23:12, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/ca086c9f-7a13-4619-9586-cc047e9651a5n%40googlegroups.com.

stokber

unread,
Jul 5, 2024, 5:05:55 PMJul 5
to Fiction Book Editor
Немного о некоторой особенности работы скрипта. Ищет подходящие строки он посекционно. Поэтому, если файл не поделен на разделы, или поделен, но их мало и они велики, и к тому же в файле больше нет никаких других блочных элементов, и если, как и любой сборник стихов, он состоит только из коротких строк, то работа скрипта значительно замедляется. Пока могу только посоветовать в таких случаях проставить хотя бы несколько заголовков, для большинства поэтических сборников вполне может хватить трёх (один посередине, и два других посредине между центром и верхом и низом документа). Или начинать поиск с нижней четвертой части, а потом подниматься таким же шагом выше. Ещё лучше, конечно, работать с уже поделенным на разделы файлом.

пятница, 5 июля 2024 г. в 23:42:26 UTC+3, TaKir:
Reply all
Reply to author
Forward
0 new messages