Представляю новый сценарий.
Скрипт задумывался как помощник поиска возможных стихотворных строк среди прозаических и прочих, в чём мне и видится его основное назначение. Сценарий является надстройкой к известному скрипту уважаемого Sclex-а «Поиск по регекспам».
Какие строки для скрипта являются поэтическими?
Строка должна быть не очень длинной. Наш сценарий считает подходящими строки длиной не более 69 символов. Этих строк должно быть не менее двух строк подряд. Если этих строк более двух, они могут быть разделены пустыми строками. Если строк всего две и между ними пустая, то такая конструкция стихом не считается. Также одним стихом не считается группа строк выполненная разным стилем начертания, например, обычным текстом и курсивом или жирным и т. п. Исключением является только строка, содержащая дату написания стихотворения, обычно такая строка является и последней. Она может быть оформлена любым начертанием. Не считаются стихотворными также строки уже оформленные любыми блочными элементами (напр. заголовки, цитаты, эпиграфы, аннотации) и подзаголовками. По умолчанию они являются уже проверенными и проставленными вручную.
Что бы избежать ложных срабатываний из поиска исключены, как более характерные для прозаического текста:
строки, начинающиеся с тире и дефисов (как реплики диалогов);
строки (не более двух), одна из которых заканчивается точкой, а вторая — двоеточием;
группа строк, все из которых заканчиваются точками;
все строки содержащие числа цифрами, кроме даты стихотворения и маркеров сносок;
строки содержащие интернет-адреса и адреса электронной почты;
строки, содержащие сокращения (напр. и т. д, и т. п.)
и некоторые другие.
Строкой-датой скрипт считает строку, содержащую четырехзначное число в диапазоне 1700-2029. Более раннее датирование мне не попадалось, более позднее пока тоже. Но это можно по надобности расширить. Отфильтрованы различные 1920-е, 1930-х и пр.
Вопрос, что считать стихами, а что прозой является дискуссионным не только для нас, скромных книгоделов, на также и для мастистых литературных критиков. Так что, хоть и в малой мере, но к сожалению остаётся место как для некоторых ложных срабатываний, так и для возможных «недонахождений». Но на то и щука, чтобы карась не дремал…
Надеюсь, скрипт покажется полезным.
Ссылка для скачивания скрипта:
(положить в папку "Scripts\09_Стихи")