Скрипт "Поиск неразмеченных стихов"

58 views
Skip to first unread message

stokber

unread,
Jul 5, 2024, 3:49:25 PM7/5/24
to Fiction Book Editor
Представляю новый сценарий.
Скрипт задумывался как помощник поиска возможных стихотворных строк среди прозаических и прочих,  в чём мне и видится его основное назначение. Сценарий является надстройкой к известному скрипту уважаемого Sclex-а «Поиск по регекспам».
Какие строки для скрипта являются поэтическими?
Строка должна быть не очень длинной. Наш сценарий считает подходящими строки длиной не более 69 символов. Этих строк должно быть не менее двух строк подряд. Если этих строк более двух, они могут быть разделены пустыми строками. Если строк всего две и между ними пустая, то такая конструкция стихом не считается. Также одним стихом не считается группа строк выполненная разным стилем начертания, например, обычным текстом и курсивом или жирным и т. п. Исключением является только строка, содержащая дату написания стихотворения, обычно такая строка является и последней. Она может быть оформлена любым начертанием. Не считаются стихотворными также строки уже оформленные любыми блочными элементами (напр. заголовки, цитаты, эпиграфы, аннотации) и подзаголовками. По умолчанию они являются уже проверенными и проставленными вручную.
Что бы избежать ложных срабатываний из поиска исключены, как более характерные для прозаического текста:
строки, начинающиеся с тире и дефисов (как реплики диалогов);
строки (не более двух), одна из которых заканчивается точкой, а вторая — двоеточием;
группа строк, все из которых заканчиваются точками;
все строки содержащие числа цифрами, кроме даты стихотворения и маркеров сносок;
строки содержащие интернет-адреса и адреса электронной почты;
строки, содержащие сокращения (напр. и т. д, и т. п.)
и некоторые другие.
Строкой-датой скрипт считает строку, содержащую четырехзначное число в диапазоне 1700-2029. Более раннее датирование мне не попадалось, более позднее пока тоже. Но это можно по надобности расширить. Отфильтрованы различные 1920-е, 1930-х и пр.
Вопрос, что считать стихами, а что прозой является дискуссионным не только для нас, скромных книгоделов, на также и для мастистых литературных критиков. Так что, хоть и в малой мере, но к сожалению остаётся место как для некоторых ложных срабатываний, так и для возможных «недонахождений». Но на то и щука, чтобы карась не дремал…
Надеюсь, скрипт покажется полезным.

Ссылка для скачивания скрипта:(положить в папку "Scripts\09_Стихи")

stokber

unread,
Jul 5, 2024, 4:06:48 PM7/5/24
to Fiction Book Editor
В тестировании и отладке скрипта самое активное участие принимал TaKir, за что ему огромная благодарность. Сценарий писался по его просьбе и подсказанным им идеям.

пятница, 5 июля 2024 г. в 22:49:25 UTC+3, stokber:

stokber

unread,
Jul 5, 2024, 4:12:40 PM7/5/24
to Fiction Book Editor
        >В тестировании и отладке скрипта самое активное участие принимал TaKir, за что ему огромная благодарность. Сценарий писался по его просьбе и подсказанным им идеям.
Что, конечно, вовсе не снимает с меня никакой ответственности в случае каких-либо возможных некорректностей его (скрипта) работы.

пятница, 5 июля 2024 г. в 23:06:48 UTC+3, stokber:

e-paper.ru

unread,
Jul 5, 2024, 4:42:26 PM7/5/24
to fiction-b...@googlegroups.com
Большое спасибо тебе за этот скрипт, очень помогает в поиске и оформлении стихов!

пт, 5 июл. 2024 г. в 23:12, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/ca086c9f-7a13-4619-9586-cc047e9651a5n%40googlegroups.com.

stokber

unread,
Jul 5, 2024, 5:05:55 PM7/5/24
to Fiction Book Editor
Немного о некоторой особенности работы скрипта. Ищет подходящие строки он посекционно. Поэтому, если файл не поделен на разделы, или поделен, но их мало и они велики, и к тому же в файле больше нет никаких других блочных элементов, и если, как и любой сборник стихов, он состоит только из коротких строк, то работа скрипта значительно замедляется. Пока могу только посоветовать в таких случаях проставить хотя бы несколько заголовков, для большинства поэтических сборников вполне может хватить трёх (один посередине, и два других посредине между центром и верхом и низом документа). Или начинать поиск с нижней четвертой части, а потом подниматься таким же шагом выше. Ещё лучше, конечно, работать с уже поделенным на разделы файлом.

пятница, 5 июля 2024 г. в 23:42:26 UTC+3, TaKir:

Игорь

unread,
Nov 18, 2025, 7:38:36 AM (8 days ago) Nov 18
to Fiction Book Editor
Добрый день.
При работе этого скрипта последнее время периодически стала выскакивать ошибка (см. скриншот). Возможно, это связано с обновлением скрипта - с год-полтора назад такого не замечал. Теперь же сообщение выскакивает довольно часто.
Происходит такое в версии программы 2.7.8, версия скрипта 1.2 (2025, январь?). Сейчас установил обновлённую программу вер.2.7.9, но в ней данный скрипт остался без изменений.
Иногда помогает выполнение скрипта 06-02_Генеральная уборка, после него скрипт Поиск неразмеченных стихов отрабатывает нормально. Но такое - не всегда, часто снова выскакивает "Error at line 21"
01.jpg

суббота, 6 июля 2024 г. в 00:05:55 UTC+3, sto...@gmail.com:

e-paper.ru

unread,
Nov 18, 2025, 10:20:32 AM (8 days ago) Nov 18
to fiction-b...@googlegroups.com
У себя такого при поиске стихов не замечал, хотя этим скриптом пользуюсь часто с самого момента появления.
Система Win 7-64.

вт, 18 нояб. 2025 г. в 15:38, Игорь <igo...@gmail.com>:
Чтобы посмотреть обсуждение, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/779fc606-8209-407a-9683-16f79b47c09cn%40googlegroups.com.

stokber

unread,
Nov 18, 2025, 10:31:37 AM (8 days ago) Nov 18
to Fiction Book Editor
Спасибо, что сообщили об ошибке. Но я у себя тоже не могу воспроизвести такое поведение скрипта. Windows 7, IE 11. Может быть дело в документах fb2 с какими-то особенностями. Хотелось бы у себя проверить на ваших сбойных файлах.

вторник, 18 ноября 2025 г. в 15:38:36 UTC+3, Игорь:

Артем Скляров

unread,
Nov 19, 2025, 5:09:25 AM (7 days ago) Nov 19
to Fiction Book Editor
Попробуйте заменить 21-ю строку
//CursorPosition.parentNode.removeChild(CursorPosition); // убираем метку.
на 
var CursorPosition = document.getElementById("CursorPosition"); // ищем метку безопасно
if (CursorPosition && CursorPosition.parentNode) {
    CursorPosition.parentNode.removeChild(CursorPosition); // убираем метку, если она существует
}

и потестируйте.

Возможно связано с обновлением IE11 и изменением логики его работы...
вторник, 18 ноября 2025 г. в 15:38:36 UTC+3, Игорь:
Добрый день.
Reply all
Reply to author
Forward
0 new messages