Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..."

204 views
Skip to first unread message

Sclex

unread,
Jan 12, 2022, 3:58:46 AM1/12/22
to Fiction Book Editor

Раньше уже был скрипт "Разметка заголовков разделов, найденных по регэкспу...". Я в этот скрипт добавил функционал разметки ПОДзаголовков и переименовал его в
"Разметить заголовки разделов либо подзаголовки, найденные по регэкспу...". Также перенес данный скрипт из папки "Структура разделов" в папку "Обработка форматирования". Т.к. к структуре разделов данный скрипт отношение имеет слабое.

Прилагаю к сообщению снимок окна сценария.

В состав сценария входят 2 файла:
02_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу....js
HTML\Разметить заголовки разделов либо подзаголовки, найденные по регэкспу - задание параметров.htm

Скрипт залит в GIT-хранилище исходников FBE:

Снимок экрана от 2022-01-11 13-32-58.png

Sclex

unread,
Jan 12, 2022, 4:14:56 AM1/12/22
to Fiction Book Editor
Вот прямые ссылки на файлы данного скрипта:
JS-файл (положить в папку "Scripts\19_Обработка форматирования").
HTML-файл (положить в папку "HTML").

Можно в браузере щелкнуть правой кнопкой мыши по этим ссылкам и выбрать "Сохранить объект как..." (или что-то типа такого).
среда, 12 января 2022 г. в 11:58:46 UTC+3, Sclex:

Sclex

unread,
Jan 12, 2022, 4:26:30 AM1/12/22
to Fiction Book Editor
Хотя я счас попробовал - если сохранять файлы щелчком правой кнопки мыши по ссылке в письме gmail, то имена файлов получаются неправильные. Поэтому, чтобы сохранить файлы по ссылкам в почтовом сообщении, нужно открыть страницы по данным ссылкам в отдельных окнах и нажать хоткей браузера Ctrl-S ("Сохранить как...").

среда, 12 января 2022 г. в 12:14:56 UTC+3, Sclex:

Sclex

unread,
Jan 12, 2022, 6:19:29 AM1/12/22
to Fiction Book Editor
Блин, я перепутал: я собирался положить сабжевый скрипт в папку "13_Заголовки, подзаголовки, пустые строки". А положил в папку "19_Обработка форматирования". Чуть попозже, наверно, все-тки перенесу в "13_Заголовки, подзаголовки, пустые строки".

среда, 12 января 2022 г. в 12:26:30 UTC+3, Sclex:

Sclex

unread,
Jan 12, 2022, 9:36:35 AM1/12/22
to Fiction Book Editor
Всё, перенес. Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." находится теперь в папке "13_Заголовки, подзаголовки, пустые строки".

Вот прямые ссылки на файлы данного скрипта:
среда, 12 января 2022 г. в 14:19:29 UTC+3, Sclex:

stokber

unread,
Jan 12, 2022, 1:25:57 PM1/12/22
to Fiction Book Editor
  Обычно я,если работал с FineReader, то перед строкой с подзаголовком проставлял метку (напр. "="). После уже в FBE по регекспу искал и проверял-правил эти строки. Теперь можно будет это делать одним кликом, и это очень облегчает работу.
Теперь о некорректном. Если в документе  строки, которые должны быть Заголовком, уже оказались отформатированы Подзаголовком, то скрипт всё правильно отрабатывает. Если наоборот, то это не срабатывает. Другими словами, скрипт может из Подзаголовков сделать Заголовки, а из Заголовков Подзаголовки — нет.


среда, 12 января 2022 г. в 17:36:35 UTC+3, Sclex:

stokber

unread,
Jan 12, 2022, 1:32:49 PM1/12/22
to fiction-b...@googlegroups.com
Это файл для проверки. Так, на всякий случай.

ср, 12 янв. 2022 г. в 21:25, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/a9497b86-51db-44fe-8a6d-cf670ee075ben%40googlegroups.com.
Пример.rar

Sclex

unread,
Jan 13, 2022, 2:05:05 AM1/13/22
to Fiction Book Editor
>  Обычно я,если работал с FineReader, то перед строкой с подзаголовком проставлял метку (напр. "="). После уже в FBE по регекспу искал и проверял-правил эти строки. Теперь можно будет это делать одним кликом, и это очень облегчает работу.
Большое спасибо, что написали это! Мне было приятно узнать, что добавленная мной фича будет кем-то востребована (как минимум вами). Не зря старался, значит.

> Теперь о некорректном. Если в документе  строки, которые должны быть Заголовком, уже оказались отформатированы Подзаголовком, то скрипт всё правильно отрабатывает. Если наоборот, то это не срабатывает. Другими словами, скрипт может из Подзаголовков сделать Заголовки, а из Заголовков Подзаголовки — нет.
Я исправил это. Теперь при разметке заголовков абзацы-подзаголовки не могут захватываться в заголовок. Новая версия скрипта - 2.0.

Ссылки на файлы скриптов остаются прежними. Дублирую их:

среда, 12 января 2022 г. в 21:25:57 UTC+3, stokber:
Message has been deleted

Sclex

unread,
Jan 13, 2022, 2:40:49 AM1/13/22
to Fiction Book Editor
> Теперь при разметке заголовков абзацы-подзаголовки не могут захватываться в заголовок.
Исправление формулировки: "не могут превращаться либо захватываться в заголовок".

четверг, 13 января 2022 г. в 10:05:05 UTC+3, Sclex:

stokber

unread,
Jan 13, 2022, 3:42:42 AM1/13/22
to Fiction Book Editor
По-видимо мы неправильно друг друга поняли. Я имел ввиду  другое, противоположное.  Т. е. , я хотел чтобы скрипт не учитывал предыдущее форматирование, а работал только по регекспу. Чтобы, если я решил расставить Подзаголовки, то там где регулярка находит совпадение, строка обязательно превращалась бы в Подзаголовок в любом случае.

четверг, 13 января 2022 г. в 10:40:49 UTC+3, Sclex:

Sclex

unread,
Jan 13, 2022, 3:50:41 AM1/13/22
to Fiction Book Editor
Для превращения абзацев заголовков в подзаголовки есть скрипт "Обзор и превращение элементов".

четверг, 13 января 2022 г. в 11:42:42 UTC+3, stokber:

stokber

unread,
Jan 13, 2022, 3:58:53 AM1/13/22
to Fiction Book Editor
Да, есть такое. Но там нужно эти подзаголовки глазками выискивать, а по регекспу — одним кликом, что предпочтительнее. Хотя, можно и так.


четверг, 13 января 2022 г. в 11:50:41 UTC+3, Sclex:

Sclex

unread,
Jan 13, 2022, 4:03:17 AM1/13/22
to Fiction Book Editor
У меня была такая мысль, что может быть сделать в скрипте "Обзор и превращение элементов" возможность фильтровать элементы списка по регэкспу. Т.е. в контекстном меню выбираешь "Отфильтровать элементы по регэкспу...", появляется окошко, вводишь в нем регэксп, и в списке остаются только элементы, подходящие под этот регэксп.

четверг, 13 января 2022 г. в 11:58:53 UTC+3, stokber:

stokber

unread,
Jan 13, 2022, 4:40:29 AM1/13/22
to Fiction Book Editor
Это неплохая идея. Но и в новом  "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..."  не помешал бы пункт с примерным названием "Не учитывать предыдущее форматирование" или как-то так.  Хотя вариант с фильтрацией в  "Обзорe и превращение элементов" по-интереснее выглядит. Можно было бы заодно отфильтровать предлоги-местоимения и прочие короткие слова неправильно распознанные курсивом, может еще что…

четверг, 13 января 2022 г. в 12:03:17 UTC+3, Sclex:

Sclex

unread,
Aug 15, 2022, 9:15:05 AM8/15/22
to Fiction Book Editor
Пользователь Федор <fed...@gmail.com> прислал мне измененный файл от сабжевого скрипта - в скрипт была [Федором] добавлена возможность выбора регэкспа из предзаданных вариантов. Я немного переделал код и предлагаю для скачивания новую версию скрипта - 2.1.

Ссылки на файлы скрипта:
JS-файл (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки").
HTML-файл (положить в папку "HTML").

Прилагаю к сообщению снимок нового вида диалога скрипта:
Clipboard27.png

Федор, спасибо!

Sclex

unread,
Aug 15, 2022, 9:36:50 AM8/15/22
to Fiction Book Editor
Конкретные варианты предзаданных регэкспов (и подписей к ним) можно обсудить и изменить.

понедельник, 15 августа 2022 г. в 16:15:05 UTC+3, Sclex:

Федор

unread,
Aug 15, 2022, 3:47:08 PM8/15/22
to fiction-b...@googlegroups.com
Я рад, что моя идея реализвана. Успехов Вам!

пн, 15 авг. 2022 г. в 16:36, Sclex <scl...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/db887a69-149f-458f-99ed-73a00b209048n%40googlegroups.com.


--
С уважением, Федор

e-paper.ru

unread,
Aug 16, 2022, 3:09:14 AM8/16/22
to fiction-b...@googlegroups.com
Sclex, Федор - спасибо за обновленный скрипт!
Еще бы вот такие варианты:

Первая/Вторая/Третья.... глава
Римские цифры в начале (конце абзаца).

Пролог и Эпилог, мне кажется, можно размечать сразу, вне зависимости от регэкспа основного оформления глав.
Их в книге по 1 штуке обычно (бывают исключения, конечно, но редко) и размечать их отдельным запуском скрипта мне представляется избыточным.
Также как всякие варианты: Предисловие, Послесловие, Введение, Вступление, От автора

пн, 15 авг. 2022 г. в 16:36, Sclex <scl...@gmail.com>:
Конкретные варианты предзаданных регэкспов (и подписей к ним) можно обсудить и изменить.
--

Sclex

unread,
Aug 16, 2022, 4:05:12 AM8/16/22
to fiction-b...@googlegroups.com
> Пролог и Эпилог, мне кажется, можно размечать сразу, вне зависимости от
> регэкспа основного оформления глав.
Размечать Пролог и Эпилог без выбора их пользователем, я думаю, не стОит.

> Их в книге по 1 штуке обычно (бывают исключения, конечно, но редко) и
> размечать их отдельным запуском скрипта мне представляется избыточным.
> Также как всякие варианты: Предисловие, Послесловие, Введение, Вступление,
> От автора
Можно сделать *один* пункт в списке предзаданных регэкспов, который
(пункт) будет размечать все эти варианты: Пролог, Эпилог, Предисловие
и т.д.

16.08.2022, e-paper.ru<epap...@gmail.com> написал(а):
> Sclex, Федор - спасибо за обновленный скрипт!
> Еще бы вот такие варианты:
>
> Первая/Вторая/Третья.... глава
> Римские цифры в начале (конце абзаца).
>
> Пролог и Эпилог, мне кажется, можно размечать сразу, вне зависимости от
> регэкспа основного оформления глав.
> Их в книге по 1 штуке обычно (бывают исключения, конечно, но редко) и
> размечать их отдельным запуском скрипта мне представляется избыточным.
> Также как всякие варианты: Предисловие, Послесловие, Введение, Вступление,
> От автора
>
> пн, 15 авг. 2022 г. в 16:36, Sclex <scl...@gmail.com>:
>
>> Конкретные варианты предзаданных регэкспов (и подписей к ним) можно
>> обсудить и изменить.
>>
>> понедельник, 15 августа 2022 г. в 16:15:05 UTC+3, Sclex:
>>
>>> Пользователь Федор <fed...@gmail.com> прислал мне измененный файл от
>>> сабжевого скрипта - в скрипт была [Федором] добавлена возможность выбора
>>> регэкспа из предзаданных вариантов. Я немного переделал код и предлагаю
>>> для
>>> скачивания новую версию скрипта - 2.1.
>>>
>>> Ссылки на файлы скрипта:
>>> JS-файл
>>> <https://github.com/sensboston/fictionbookeditor/raw/master/files/Scripts/13_%D0%97%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BF%D1%83%D1%81%D1%82%D1%8B%D0%B5%20%D1%81%D1%82%D1%80%D0%BE%D0%BA%D0%B8/05_%D0%A0%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%B8%D1%82%D1%8C%20%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%20%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%BE%D0%B2%20%D0%BB%D0%B8%D0%B1%D0%BE%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BD%D0%B0%D0%B9%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%BF%D0%BE%20%D1%80%D0%B5%D0%B3%D1%8D%D0%BA%D1%81%D0%BF%D1%83....js>
>>> (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки").
>>> HTML-файл
>>> <https://github.com/sensboston/fictionbookeditor/raw/master/files/HTML/%D0%A0%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%B8%D1%82%D1%8C%20%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%20%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%BE%D0%B2%20%D0%BB%D0%B8%D0%B1%D0%BE%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BD%D0%B0%D0%B9%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%BF%D0%BE%20%D1%80%D0%B5%D0%B3%D1%8D%D0%BA%D1%81%D0%BF%D1%83%20-%20%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2.htm>
>>> (положить в папку "HTML").
>>>
>>> Прилагаю к сообщению снимок нового вида диалога скрипта:
>>> [image: Clipboard27.png]
>>>
>>> Федор, спасибо!
>>>
>> --
>> Вы получили это сообщение, поскольку подписаны на группу "Fiction Book
>> Editor".
>> Чтобы отменить подписку на эту группу и больше не получать от нее
>> сообщения, отправьте письмо на электронный адрес
>> fiction-book-ed...@googlegroups.com.
>> Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке
>> https://groups.google.com/d/msgid/fiction-book-editor/db887a69-149f-458f-99ed-73a00b209048n%40googlegroups.com
>> <https://groups.google.com/d/msgid/fiction-book-editor/db887a69-149f-458f-99ed-73a00b209048n%40googlegroups.com?utm_medium=email&utm_source=footer>
>> .
>>
>
> --
> Вы получили это сообщение, поскольку подписаны на группу Fiction Book
> Editor.
>
> Чтобы отменить подписку на эту группу и больше не получать от нее сообщения,
> отправьте письмо на электронный адрес
> fiction-book-ed...@googlegroups.com.
> Просмотреть это обсуждение в Сети можно по адресу
> https://groups.google.com/d/msgid/fiction-book-editor/CAKYXB9W%2BxxVFsfGeHV3g-gNZC%2BEH_%2Bjy0aH0FJC%2B0dwObN6oAg%40mail.gmail.com.
>

e-paper.ru

unread,
Aug 16, 2022, 4:45:04 AM8/16/22
to fiction-b...@googlegroups.com
Можно сделать *один* пункт в списке предзаданных регэкспов, который
(пункт) будет размечать все эти варианты: Пролог, Эпилог, Предисловие
и т.д.
Да, это хорошая мысль.
Может, сделать  в виде доп. галки к основному регэкспу, чтобы за 1 проход иметь возможность разметить Главы и всякие прологи-эпилоги.

вт, 16 авг. 2022 г. в 11:05, Sclex <scl...@gmail.com>:
Просмотреть это обсуждение в Сети можно по адресу https://groups.google.com/d/msgid/fiction-book-editor/CAKw_SM12%2BqWidThD_QQRW6Z2ko0eoaM8Q3bQkGLUj3XFejAh-Q%40mail.gmail.com.

stokber

unread,
Aug 16, 2022, 5:22:43 AM8/16/22
to Fiction Book Editor
Спасибо,  Sclex, Федор!
В оглавлениях обычно на первом месте "Глава и т.п." затем число арабскими, римскими или прописью.
Обязательно добавить римские цифры.
Только арабские цифры (без добавочного текста в начале или конце строки). Так надежней. Числа могут попасться и в начале и в конце обычной строки — 
в итоге возможны ложные срабатывания.
То же самое с римскими цифрами.
В пьесах такое часто встречается:
Действующие лица.
Действие  (число прописью).
Сцена  (число прописью).
Явление  (число прописью).
Картина  (число прописью).
Это большей частью для подзаголовков. Возможно одним пунктом с именем типа "Пьесы" или "Драматургия". Или если несложно раскрывающимся подменю, 
чтобы не загромождать экран.

Еще можно вспомнить:
"Оглавление", "Содержание". Иногда их приходится отставлять т.к. часто только там бывают указаны авторы переводов в сборниках иноязычных авторов.
Ещё  "Иллюстрации", "Алфавитный указатель имен", "Библиография", "Благодарности" и др. бывает, но это может уже и лишнее.
Опять же в Подзаголовках могут потребоваться и "Таблица-номер-число" и другое.

Еще комбинации чисел-точек в начале строки для подразделов в нехудожке бывает (1.1.1. Имя подраздела).
Знак параграфа+число, напр. "§ 2. Имя подраздела$". Попадается в специфической литературе, но искать символ параграфа порою не очень удобно.
В числе прописью можно использовать [а-я\s]+ая (это для женского рода), или что-нибудь по-точнее-подробнее придумать.





вторник, 16 августа 2022 г. в 10:09:14 UTC+3, TaKir:

Sclex

unread,
Aug 16, 2022, 6:59:13 AM8/16/22
to Fiction Book Editor
TaKir, stokber, спасибо за высказанные предложения, постараюсь исполнить их.

вторник, 16 августа 2022 г. в 12:22:43 UTC+3, stokber:

Sclex

unread,
Aug 16, 2022, 7:59:42 AM8/16/22
to Fiction Book Editor
TaKir, stokber, вроде все ваши пожелания насчет предзаданных регэкспов я исполнил.

Ссылки для скачивания скрипта v2.2:
JS-файл (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки").
HTML-файл (положить в папку "HTML").

Снимок выпадающего списка в его текущем виде:
Clipboard28.png

Посмотреть регэкспы, соответствующие различным вариантам предзаданных регэкспов, можно здесь:

Если у кого-то есть еще предложения - пожалуйста, высказывайтесь.

вторник, 16 августа 2022 г. в 13:59:13 UTC+3, Sclex:

e-paper.ru

unread,
Aug 16, 2022, 9:12:48 AM8/16/22
to fiction-b...@googlegroups.com
Спасибо огроменное! 
Пролог-Эпилог и проч. перестали обрабатываться, если будущие залоголовки названы Эпилог 1, Эпилог 2 (сделал так для теста).
В прошлой версии размечались.

вт, 16 авг. 2022 г. в 14:59, Sclex <scl...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/d461f757-612a-4f72-81cd-5f58da35d4e4n%40googlegroups.com.

stokber

unread,
Aug 17, 2022, 4:50:32 AM8/17/22
to Fiction Book Editor
Спасибо!
Покопался в паре десятков книг различных жанров и тематики. Такого ещё набрался:

От переводчика
От редактора
От составителя

Том (число)
Раздел (число)
Часто на одной строке с номером подраздела находится и другой текст — напр. Имя этого подраздела.
Между ними может быть точка, а может и не быть. Иногда одну из частей такого заголовка оформляют просто другим шрифтом, опустив при этом точку.
Наверно, это тоже нужно учесть поправив регулярки, или добавив новые такие же с вариантом добавки текста,
с названием типа "Глава (число) ПЛЮС" (долее обозначу эти варианты знаком "+")


Том (число) +
Раздел (число) +
Часть (число) +
Глава (число) +
Пролог +
Эпилог +

Введение +
Предисловие + напр. (к первому изданию)
Предисловие редактора
Заключение +
Вместо эпилога

Краткая библиография
Предварительные замечания
Использованная литература
Именной и тематический указатель
Именной указатель
Указатель имен
Предметный указатель
Указатель источников
Указатель литературы
Краткий словарь [а-я]+(и|ы)х терминов
Перечень использованных источников
Хронологическая таблица

Комментарии
Для комментариев есть, конечно, в fb2 и своя секция и свои теги.
Но под таким заголовком в бумажной книге кроме собственно сносок
попадается и шапка из нескольких общего плана, порой увесистых абзацев,
не относящихся к конкретным номерам ссылок. Как бы комментарий к комментариям.


Приложение
Приложение +

Лекция +
Беседа +
Задача +
Занятие +

"^Таблица № ?\d+$" заменить на "^Таблица №? ?(\d+\.?)+.+$" или как-то так. (напр. Таблица 1.2 (без №))
То же самое со знаком параграфа.

Драматургия:
Добавить
"Эпизод (число прописью).
Первый акт. Вот так у М. Горького "На дне". Сначала число прописью, потом "акт".
Вообще в современных пьесах сверстанных современными верстальщиками числа с разделами пьес могут быть и арабскими и римскими. Тоже, наверное, стоит учесть.


Возможно, некоторые из этих элементов проще указать в скрипте "Поиск по набору регекспов" с комментарием "Найдено: возможно потерянный заголовок\подзаголовок". Хотя, одно другому не мешает. Нынче и в прозаических произведениях можно встретить заголовки и подзаголовки более характерные для пьес: Акты, Явления, Эпизоды и т.п. Еще навскидку можно вспомнить День (число), Вечер, Утро, Письмо, заголовки состоящие из дат и т. д. Авангардисты... Что с них возьмешь.

вторник, 16 августа 2022 г. в 16:12:48 UTC+3, TaKir:

Sclex

unread,
Aug 17, 2022, 5:35:17 AM8/17/22
to Fiction Book Editor
> Пролог-Эпилог и проч. перестали обрабатываться, если будущие залоголовки названы Эпилог 1, Эпилог 2 (сделал так для теста).
Для каких названий нужно добавить, чтобы в конце могло быть число? "Пролог", "Эпилог", что еще?

вторник, 16 августа 2022 г. в 16:12:48 UTC+3, TaKir:
Спасибо огроменное! 

stokber

unread,
Aug 17, 2022, 5:38:09 AM8/17/22
to Fiction Book Editor
В Драматургии Действующие лица могут быть с двоеточием в конце, а могут и без.

среда, 17 августа 2022 г. в 12:35:17 UTC+3, Sclex:

Sclex

unread,
Aug 17, 2022, 5:38:44 AM8/17/22
to Fiction Book Editor
stokber, внушительный список вы предоставили. Спасибо! Буду разбираться. Не знаю только, какие сделать пункты выпадающего списка, чтобы в них были учтены все те варианты регэкспов, о которых (вариантах) вы написали. Возможно, если всё учесть, получится слишком много пунктов в выпадающем списке.

среда, 17 августа 2022 г. в 11:50:32 UTC+3, stokber:

stokber

unread,
Aug 17, 2022, 5:46:50 AM8/17/22
to Fiction Book Editor
Ну, пожалуй,  Лекция, Беседа, Задача, Занятие и чем-то еще можно и пожертвовать. Оставить для "Поиск по регекспам."

среда, 17 августа 2022 г. в 12:38:44 UTC+3, Sclex:

stokber

unread,
Aug 17, 2022, 6:03:54 AM8/17/22
to Fiction Book Editor
Мой абзац с "Краткая библиография"  по  "Хронологическая таблица" загнать одной строкой с примерным названием "Дополнительные материалы".
Туда же перенести "Иллюстрации|Алфавитный указатель имен|Библиография" из нынешних "Пролог\Эпилог\Предисловие..."
Может так?

среда, 17 августа 2022 г. в 12:46:50 UTC+3, stokber:

Sclex

unread,
Aug 17, 2022, 6:04:19 AM8/17/22
to Fiction Book Editor
> Введение +
> Предисловие + напр. (к первому изданию)
stokber, так какие регэкспы прописывать для вариантов типа процитированных выше? Чтобы в начале абзаца было "Введение " или "Предисловие ", а дальше - все что угодно? Т.е., например, регэксп "^Введение "?

среда, 17 августа 2022 г. в 11:50:32 UTC+3, stokber:

stokber

unread,
Aug 17, 2022, 6:24:45 AM8/17/22
to Fiction Book Editor
Желательно два варианта: 
"^Введение$" и  "^Введение.+$".
На крайний случай одним  "^Введение.*$".
В идеальном случае, если не особо сложно, добавить по аналогии с пунктом "Сколько захватывать в заголовок либо подзаголовок абзацев"  пункт "Захватывать весь абзац с дополнительным текстом". Что тоже, конечно, может сбивать с толку.

среда, 17 августа 2022 г. в 13:04:19 UTC+3, Sclex:

Sclex

unread,
Aug 17, 2022, 6:42:01 AM8/17/22
to Fiction Book Editor
Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." версии 2.3:
JS-файл (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки").
HTML-файл (положить в папку "HTML").

Из предложенного добавил в список предзаданных регэкспов вот что:
> В Драматургии Действующие лица могут быть с двоеточием в конце, а могут и без.
> От переводчика
> От редактора
> От составителя

> Том (число)
> Раздел (число)

> Введение
> Предисловие
> Предисловие редактора
> Заключение

> Вместо эпилога

> Краткая библиография
> Предварительные замечания
> Использованная литература
> Именной и тематический указатель
> Именной указатель
> Указатель имен
> Предметный указатель
> Указатель источников
> Указатель литературы
> Краткий словарь [а-я]+(и|ы)х терминов
> Перечень использованных источников
> Хронологическая таблица

> Комментарии

> Приложение


> "^Таблица № ?\d+$" заменить на "^Таблица №? ?(\d+\.?)+.+$" или как-то так. (напр. Таблица 1.2 (без №))
> То же самое со знаком параграфа.

> Драматургия:
> Добавить
"Эпизод (число прописью).
> Первый акт. Вот так у М. Горького "На дне". Сначала число прописью, потом "акт".

Снимок выпадающего списка в его текущем виде:
Clipboard29.png

Sclex

unread,
Aug 17, 2022, 6:54:20 AM8/17/22
to Fiction Book Editor
Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обнволен до версии 2.4:
JS-файл (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки").
HTML-файл (положить в папку "HTML").

В данной версии исполнено вот это пожелание:

e-paper.ru

unread,
Aug 17, 2022, 7:27:19 AM8/17/22
to fiction-b...@googlegroups.com
Есть предложение для всех дополнительных и не всегда однозначных возможных заголовков ограничить длину абзаца например, 60 символами.
Т.е. например, 
Предварительные замечания
 - попадут в заголовки,
а 
Предварительные замечания, приведенные на страницах таких-то, надо воспринимать так-то и так-то, иначе...

уже не попадут в заголовки.

ср, 17 авг. 2022 г. в 13:03, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/8157225a-2ace-4049-b1a9-e2c8e7cbd19an%40googlegroups.com.

stokber

unread,
Aug 17, 2022, 7:43:47 AM8/17/22
to Fiction Book Editor
Скрипт не узнаёт числа прописью с буквой Ё. 
Четвёртый, трёхсотый, четырёхсотый. Во всех родах.

среда, 17 августа 2022 г. в 14:27:19 UTC+3, TaKir:

Sclex

unread,
Aug 17, 2022, 8:36:59 AM8/17/22
to Fiction Book Editor
> Скрипт не узнаёт числа прописью с буквой Ё. 
> Четвёртый, трёхсотый, четырёхсотый. Во всех родах.
Я исправил это. Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 2.5:

Sclex

unread,
Aug 17, 2022, 8:37:46 AM8/17/22
to Fiction Book Editor
> Скрипт не узнаёт числа прописью с буквой Ё. 
> Четвёртый, трёхсотый, четырёхсотый. Во всех родах.
Хорошо, что вы быстро обнаружили этот баг и сообщили о нем. Спасибо.

Sclex

unread,
Aug 17, 2022, 8:51:30 AM8/17/22
to Fiction Book Editor
stokber, а варианты...
Лекция +
Беседа +
Задача +
Занятие +
- если делать, то куда их помещать? Они должны быть сделаны отдельными пунктами, по аналогии с "Вида "Глава 123"", "Вида "Том 123"" и т.п.? Или их можно поместить в один какой-то пункт?

среда, 17 августа 2022 г. в 11:50:32 UTC+3, stokber:

Sclex

unread,
Aug 17, 2022, 9:01:30 AM8/17/22
to Fiction Book Editor
> Есть предложение для всех дополнительных и не всегда однозначных возможных заголовков ограничить длину абзаца например, 60 символами.
Надо бы сделать, но счас в лом.

среда, 17 августа 2022 г. в 14:27:19 UTC+3, TaKir:
Есть предложение для всех дополнительных и не всегда однозначных возможных заголовков ограничить длину абзаца например, 60 символами.

stokber

unread,
Aug 17, 2022, 9:43:06 AM8/17/22
to Fiction Book Editor
Лекция +
Беседа +
Задача +
Занятие +
Лучше отдельно. Это довольно редкие подразделы. А если ещё с добавочным текстом, то как бы ложных срабатываний не было.
Назвать типа Другое или Разное.

среда, 17 августа 2022 г. в 16:01:30 UTC+3, Sclex:
Message has been deleted
Message has been deleted

Sclex

unread,
Nov 7, 2023, 10:36:03 AM11/7/23
to Fiction Book Editor
Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 2.7.

- теперь в регэкспах для поиска заголовков либо подзаголовков - можно прописывать конструкцию "\xA0" (кроме кавычек), и эта конструкция будет находить неразрывный пробел вне зависимости от того, каким символом показываются в FBE неразрывные пробелы (квадратиками, кружками и т.п.).
- предзаданные регэкспы в данном скрипте изменены так, чтобы находились в том числе и заголовки/подзаголовки, которые начинаются с пробелов (простых либо неразрывных), которые кончаются пробелами (простыми либо неразрывными), и которые содержат внутри последовательности из простых/неразрывных пробелов (например, между словами "Глава" и "первая").

Ссылки для скачивания файлов скрипта (последняя версия):
05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу....js (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки")

stokber

unread,
Nov 7, 2023, 2:24:24 PM11/7/23
to fiction-b...@googlegroups.com
Спасибо!
В этом скрипте часто может пригодиться ещё один регексп, условно назовём его "Вида «ЗАГОЛОВОК»". Это когда строка для заголовка состоит из ЗАГЛАВНЫХ букв + знаки препинания.
У меня такая регулярка:
^[.…«\( \xA0]*([A-ZА-ЯЁ]+[-—–\d\.\*,;:?!…«»“”„\(\) \xA0]*)+$
Галочку "учитывать регистр" обязательно проставляем.

вт, 7 нояб. 2023 г. в 18:36, Sclex <scl...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/350bd699-cfc4-4e73-a53f-80c0fbbd5f76n%40googlegroups.com.

Latimur Shahov

unread,
Nov 7, 2023, 9:16:37 PM11/7/23
to fiction-b...@googlegroups.com
Я тут вообще запутаюсь. И тем более у меня и сам как бы скрипт и хтм
файлы не скачиваются, а просто открываются. Лучше пока не буду
вникать...

07.11.2023, stokber<sto...@gmail.com> написал(а):
> Спасибо!
> В этом скрипте часто может пригодиться ещё один регексп, условно назовём
> его "Вида «ЗАГОЛОВОК»". Это когда строка для заголовка состоит из ЗАГЛАВНЫХ
> букв + знаки препинания.
> У меня такая регулярка:
> ^[.…«\( \xA0]*([A-ZА-ЯЁ]+[-—–\d\.\*,;:?!…«»“”„\(\) \xA0]*)+$
> Галочку "учитывать регистр" обязательно проставляем.
>
> вт, 7 нояб. 2023 г. в 18:36, Sclex <scl...@gmail.com>:
>
>> Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по
>> регэкспу..." обновлен до версии 2.7.
>>
>> - теперь в регэкспах для поиска заголовков либо подзаголовков - можно
>> прописывать конструкцию "\xA0" (кроме кавычек), и эта конструкция будет
>> находить неразрывный пробел вне зависимости от того, каким символом
>> показываются в FBE неразрывные пробелы (квадратиками, кружками и т.п.).
>> - предзаданные регэкспы в данном скрипте изменены так, чтобы находились в
>> том числе и заголовки/подзаголовки, которые начинаются с пробелов
>> (простых
>> либо неразрывных), которые кончаются пробелами (простыми либо
>> неразрывными), и которые содержат внутри последовательности из
>> простых/неразрывных пробелов (например, между словами "Глава" и
>> "первая").
>>
>> Ссылки для скачивания файлов скрипта (последняя версия):
>> 05_Разметить заголовки разделов либо подзаголовки, найденные по
>> регэкспу....js
>> <https://github.com/sensboston/fictionbookeditor/raw/master/files/Scripts/13_%D0%97%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BF%D1%83%D1%81%D1%82%D1%8B%D0%B5%20%D1%81%D1%82%D1%80%D0%BE%D0%BA%D0%B8/05_%D0%A0%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%B8%D1%82%D1%8C%20%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%20%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%BE%D0%B2%20%D0%BB%D0%B8%D0%B1%D0%BE%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BD%D0%B0%D0%B9%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%BF%D0%BE%20%D1%80%D0%B5%D0%B3%D1%8D%D0%BA%D1%81%D0%BF%D1%83....js>
>> (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки")
>> Разметить заголовки разделов либо подзаголовки, найденные по регэкспу -
>> задание параметров.htm
>> <https://github.com/sensboston/fictionbookeditor/raw/master/files/HTML/%D0%A0%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%B8%D1%82%D1%8C%20%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%20%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%BE%D0%B2%20%D0%BB%D0%B8%D0%B1%D0%BE%20%D0%BF%D0%BE%D0%B4%D0%B7%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BA%D0%B8%2C%20%D0%BD%D0%B0%D0%B9%D0%B4%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5%20%D0%BF%D0%BE%20%D1%80%D0%B5%D0%B3%D1%8D%D0%BA%D1%81%D0%BF%D1%83%20-%20%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2.htm>
>> (положить в папку "HTML")
>>
>> --
>> Вы получили это сообщение, поскольку подписаны на группу "Fiction Book
>> Editor".
>> Чтобы отменить подписку на эту группу и больше не получать от нее
>> сообщения, отправьте письмо на электронный адрес
>> fiction-book-ed...@googlegroups.com.
>> Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке
>> https://groups.google.com/d/msgid/fiction-book-editor/350bd699-cfc4-4e73-a53f-80c0fbbd5f76n%40googlegroups.com
>> <https://groups.google.com/d/msgid/fiction-book-editor/350bd699-cfc4-4e73-a53f-80c0fbbd5f76n%40googlegroups.com?utm_medium=email&utm_source=footer>
>> .
>>
>
> --
> Вы получили это сообщение, поскольку подписаны на группу Fiction Book
> Editor.
>
> Чтобы отменить подписку на эту группу и больше не получать от нее сообщения,
> отправьте письмо на электронный адрес
> fiction-book-ed...@googlegroups.com.
> Просмотреть это обсуждение в Сети можно по адресу
> https://groups.google.com/d/msgid/fiction-book-editor/CALqvQh2APKc2jgQmTCXi82Bbq4opAuHd%2B%3Du1fptdoYnuRkK31Q%40mail.gmail.com.
>

Sclex

unread,
Nov 8, 2023, 3:12:17 AM11/8/23
to Fiction Book Editor
stokber, я добавил в html-файл скрипта такую строку:
<option value="^[.…«\( \xA0]*([A-ZА-ЯЁ]+[-—–\d\.\*,;:?!…«»“”„\(\) \xA0]*)+$">Вида «ЗАГОЛОВОК» (включите флажок «учитывать регистр»)</option>
но что-то при выборе такого регэкспа скрипт подвисает при обработке файла, в котором есть, например, абзац
<p>ЗАГОЛОВОК</p>
Надо разобраться, почему сценарий работает неверно.

вторник, 7 ноября 2023 г. в 22:24:24 UTC+3, sto...@gmail.com:

Sclex

unread,
Nov 8, 2023, 3:18:37 AM11/8/23
to Fiction Book Editor
Хотя если флажок "Учитывать регистр" - включен, подвисание не происходит. Но ведь и при отключенном флажке подвисать сценарий не должен.

среда, 8 ноября 2023 г. в 11:12:17 UTC+3, Sclex:

Sclex

unread,
Nov 8, 2023, 3:26:57 AM11/8/23
to Fiction Book Editor
Подвисание было вызвано тем, что регэксп был неправильно составлен. Я изменил его на
<option value="^[.…«\( \xA0]*([A-ZА-ЯЁ]+(?![A-ZА-ЯЁ])[-—–\d\.\*,;:?!…«»“”„\(\) \xA0]*)+$">Вида «ЗАГОЛОВОК» (включите флажок «учитывать регистр»)</option>
Теперь скрипт не подвисает. Счас выложу новую версию.

среда, 8 ноября 2023 г. в 11:18:37 UTC+3, Sclex:

Sclex

unread,
Nov 8, 2023, 3:33:01 AM11/8/23
to Fiction Book Editor
Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 2.8.

- в список предзаданных регэкспов добавлен пункт "Вида «ЗАГОЛОВОК» (включите флажок «учитывать регистр»)".

Ссылки для скачивания файлов скрипта (последняя версия):
05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу....js (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки")

вторник, 7 ноября 2023 г. в 22:24:24 UTC+3, sto...@gmail.com:
Спасибо!

stokber

unread,
Nov 8, 2023, 4:52:04 AM11/8/23
to Fiction Book Editor
>Подвисание было вызвано тем, что регэксп был неправильно составлен. Я изменил его
Если просто вручную вставлять его (мой предыдущий), всё правильно срабатывало. 
Воистину, неисповедимы пути регексподни!
Ещё раз спасибо!

среда, 8 ноября 2023 г. в 11:33:01 UTC+3, Sclex:

Sclex

unread,
Nov 8, 2023, 5:13:45 AM11/8/23
to fiction-b...@googlegroups.com
> Если просто вручную вставлять его (мой предыдущий), всё правильно срабатывало.
Иногда правильно, а иногда - нет. Смотря какой fb2-документ. Попробуйте, например, применить ваш регэксп на документе, содержащем такой абзац:

<p>ЧТОБЫ ИЗМЕНИТЬ ДОКУМЕНТ ПО УМОЛЧАНИЮ, ОТРЕДАКТИРУЙТЕ ФАЙЛ "BLANK.FB2" ВРУЧНУЮ.</p>

(Именно большими буквами.)

ср, 8 нояб. 2023 г. в 12:52, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/69ce59e8-38fe-40b3-9e5d-2266ad9b888dn%40googlegroups.com.

Sclex

unread,
Nov 8, 2023, 5:32:14 AM11/8/23
to Fiction Book Editor
stokber, вот здесь можете почитать, почему поиск по некоторым регэкспам может вызывать подвисание:

среда, 8 ноября 2023 г. в 12:52:04 UTC+3, sto...@gmail.com:

Sclex

unread,
Nov 8, 2023, 5:43:46 AM11/8/23
to Fiction Book Editor
> stokber, вот здесь можете почитать, почему поиск по некоторым регэкспам может вызывать подвисание:
Такая проблема называется "катастрофический возврат" (catastrophic backtracking).

среда, 8 ноября 2023 г. в 13:32:14 UTC+3, Sclex:

Sclex

unread,
Nov 8, 2023, 6:06:24 AM11/8/23
to Fiction Book Editor
> у меня и сам как бы скрипт и хтм файлы не скачиваются, а просто открываются.
Открыв файл (JS или HTML) в браузере, вы можете затем этот файл сохранить себе на накопитель, нажав Ctrl-S. Либо через меню браузера: "Файл -> Сохранить как...". Я думаю, это во всех браузерах сделано одинаково.

среда, 8 ноября 2023 г. в 05:16:37 UTC+3, shahl...@gmail.com:

stokber

unread,
Nov 8, 2023, 6:40:23 AM11/8/23
to Fiction Book Editor
> Такая проблема называется "катастрофический возврат" (catastrophic backtracking).
Спасибо! Будем вникать.
>Попробуйте, например, применить ваш регэксп на документе, содержащем такой абзац:
><p>ЧТОБЫ ИЗМЕНИТЬ ДОКУМЕНТ ПО УМОЛЧАНИЮ, ОТРЕДАКТИРУЙТЕ ФАЙЛ "BLANK.FB2" ВРУЧНУЮ.</p>
Да, действительно. Но, такая строка и в последней (2.8) версии не размечается заголовком, хотя и не виснет. Тут, конечно, другая причина, а именно отсутствие в регекспе прямых "компьютерных"
кавычек ("). Опять же, если внести их вручную в строку меню, то срабатывает. А как их поселить в нужном регекспе, в html-ке скрипта? Я уж пробовал и удваивать и экранировать и прочие комбинации. Есть ли рабочий выход?
среда, 8 ноября 2023 г. в 14:06:24 UTC+3, Sclex:

stokber

unread,
Nov 8, 2023, 6:58:50 AM11/8/23
to Fiction Book Editor
Таки, кажется, добил я его. Заменил окаймляющие на одинарные, и добавил двойную даже без экранирования.
<option value='^[.…«\( \xA0]*([A-ZА-ЯЁ]+(?![A-ZА-ЯЁ])[-—–\d\.\*,;:?!…«»“”„\(\) \xA0"]*)+$'>Вида «ЗАГОЛОВОК» (включите флажок «учитывать регистр»)</option>

среда, 8 ноября 2023 г. в 14:40:23 UTC+3, stokber:

stokber

unread,
Nov 8, 2023, 7:23:32 AM11/8/23
to Fiction Book Editor
А если нужно учесть наличие в тексте и одинарных "компьютерных" кавычек, то тогда как? 

среда, 8 ноября 2023 г. в 14:58:50 UTC+3, stokber:

Sclex

unread,
Nov 8, 2023, 8:55:09 AM11/8/23
to fiction-b...@googlegroups.com
> отсутствие в регекспе прямых "компьютерных" кавычек ("). Опять же, если внести их вручную в строку меню, то срабатывает. А как их поселить в нужном регекспе, в html-ке скрипта?
Можно было вместо прямых кавычек написать "&quot;". В HTML-коде это будет шесть символов, а в регэкспе - всего один (собственно сама прямая кавычка).

ср, 8 нояб. 2023 г. в 14:40, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на одну из тем в группе "Fiction Book Editor".
Чтобы отменить подписку на эту тему, перейдите по ссылке https://groups.google.com/d/topic/fiction-book-editor/fiNDoQRB1QU/unsubscribe.
Чтобы отменить подписку на эту группу и все ее темы, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/f3191e64-8498-46d3-9316-d98cfd0beaecn%40googlegroups.com.

Sclex

unread,
Nov 8, 2023, 8:59:00 AM11/8/23
to fiction-b...@googlegroups.com
Символ апострофа вроде как можно записать как "&apos;".

ср, 8 нояб. 2023 г. в 15:23, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/3174750a-f6fb-4526-8bb3-374e74c9fda7n%40googlegroups.com.

Sclex

unread,
Nov 8, 2023, 9:04:10 AM11/8/23
to Fiction Book Editor
Хотя в IE6 у меня запись "&apos;" не сработала. Сработала запись "&#39;". Такие штуки называются HTML Character Entities. Можете, например, посмотреть их частичный перечень здесь: https://www.w3schools.com/html/html_entities.asp

среда, 8 ноября 2023 г. в 16:59:00 UTC+3, Sclex:

Sclex

unread,
Nov 8, 2023, 9:27:45 AM11/8/23
to Fiction Book Editor
В статье Википедии "Мнемоники в HTML" написано, что мнемоника "&apos;" поддерживается в HTML начиная с версии 5.0. Поэтому в скриптах FBE такую мнемонику использовать не следует. Я программирую сценарии FBE так, чтобы они работали в IE начиная с 6-й версии. А IE6 от HTML5 очень далек. Апостроф лучше записывать мнемоникой "&#39;".

среда, 8 ноября 2023 г. в 16:59:00 UTC+3, Sclex:
Символ апострофа вроде как можно записать как "&apos;".

stokber

unread,
Nov 8, 2023, 11:44:12 AM11/8/23
to Fiction Book Editor
Большое спасибо за развернутые со ссылками ответы.

среда, 8 ноября 2023 г. в 17:27:45 UTC+3, Sclex:

Sclex

unread,
Nov 11, 2023, 2:27:46 AM11/11/23
to Fiction Book Editor
Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 2.9.
- теперь, если в регэкспе, введенном пользователем в диалоге скрипта, содержатся символы неразрывных пробелов (символы с кодом 160), то они будут находить неразрывные пробелы в fb2-документе вне зависимости от того, каким символом в fb2-документе они (неразрывные пробелы) показываются (квадратиком, кружком и т.п.).

Ссылки для скачивания файлов скрипта (последняя версия):

stokber

unread,
Nov 11, 2023, 11:43:17 AM11/11/23
to Fiction Book Editor
В версии 2.9 заголовки, в которых есть пробел(ы) у меня не размечаются совсем.


суббота, 11 ноября 2023 г. в 10:27:46 UTC+3, Sclex:

stokber

unread,
Nov 11, 2023, 11:48:50 AM11/11/23
to Fiction Book Editor
Ещё проверил. Уточняю.
Размечаются строки с пробелами ТОЛЬКО квадратиками (ну, наверное, и другими символами кроме пустого пробела).

суббота, 11 ноября 2023 г. в 19:43:17 UTC+3, stokber:

Sclex

unread,
Nov 11, 2023, 12:54:40 PM11/11/23
to fiction-b...@googlegroups.com
> В версии 2.9 заголовки, в которых есть пробел(ы) у меня не размечаются совсем.
Да, действительно. Может, исправлю это завтра. Уже не сегодня. Спасибо, что сообщили.

сб, 11 нояб. 2023 г. в 19:43, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/41019b54-f64e-45f1-890b-d2873b41c5cen%40googlegroups.com.

Sclex

unread,
Nov 12, 2023, 2:15:23 AM11/12/23
to Fiction Book Editor
> Размечаются строки с пробелами ТОЛЬКО квадратиками (ну, наверное, и другими символами кроме пустого пробела).
Вроде я всё наладил. Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 3.0.

Ссылки для скачивания файлов скрипта (последняя версия):

суббота, 11 ноября 2023 г. в 19:48:50 UTC+3, sto...@gmail.com:

stokber

unread,
Nov 12, 2023, 2:19:18 AM11/12/23
to Fiction Book Editor
Уже написал, только собрался отправлять, а тут и 3.0 подоспела.
Может заодно получится ещё один регексп внедрить:
<option value="^[ \xA0]*«.{1,50}([?!]\.\.|\?!\.|…|\.\.\.)»[ \xA0]*$">Вида «Заголовок стиха из текста первой строки…»</option>

суббота, 11 ноября 2023 г. в 20:54:40 UTC+3, Sclex:

Федор

unread,
Nov 12, 2023, 2:30:47 AM11/12/23
to fiction-b...@googlegroups.com

Sclex, спасибо за новую версию скрипта!

вс, 12 нояб. 2023 г. в 09:19, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/f3ee0fd1-6daf-46ac-a2b8-b764e92d9e19n%40googlegroups.com.


--
С уважением, Федор

stokber

unread,
Nov 12, 2023, 2:39:43 AM11/12/23
to Fiction Book Editor
Пожалуй 50 символов маловато будет, 65-70 бы:
<option value="^[ \xA0]*«.{1,70}([?!]\.\.|\?!\.|…|\.\.\.)»[ \xA0]*$">Вида «Заголовок стиха из текста первой строки…»</option>

воскресенье, 12 ноября 2023 г. в 10:30:47 UTC+3, Федор:

Sclex

unread,
Nov 12, 2023, 3:42:26 AM11/12/23
to Fiction Book Editor
Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." обновлен до версии 3.2.
- в список предзаданных регэкспов добавлен пункт "Вида «Заголовок стиха из текста первой строки…»".
- теперь менять состояние флажка "Учитывать регистр при поиске по регэкспу" можно щелчком мыши по этой подписи к флажку.

e-paper.ru

unread,
Nov 12, 2023, 4:43:54 AM11/12/23
to fiction-b...@googlegroups.com
Про заголовки стихов есть пожелание иметь отдельный скрипт )
Когда стихи еще не размечены тэгами, а просто обычные "короткие" строки
Как-то так это виделось год назад:

7) Скрипт "Заголовки стихов"

Когда делается сборник стихов, часто у стихов нет заголовков. Хочется скрипт, который может сделать стихам заголовки.


а) Предварительно в начале будущих стихов имеем (в исходнике или расставляем руками) маркеры начала стихов в виде звездочек или чего-то еще.
Для того, чтобы они не путались с маркерами сабтайтлов, можно использовать маркеры решетки ### или еще какие (zzz).

б) Взамен этих маркеров делаем заголовок (подзаголовок) по первой строке стиха - берем первую строку стиха, копируем ее в заголовок секции "в кавычках..." с многоточием в конце заголовка внутри кавычек

Предварительное форматирование тэгами стихов нам не обязательно на этом этапе.


в) В скрипте надо иметь выбор радиокнопкой - расставлять Заголовки или Подзаголовки.

г) В конце работы скрипта маркеры начала стихов удаляем.

По умолчанию скрипт работает целиком с файлом, без выделения фрагмента.

Также желательно иметь возможность запуска скрипта только для выделенного куска текста.

вс, 12 нояб. 2023 г. в 10:19, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/f3ee0fd1-6daf-46ac-a2b8-b764e92d9e19n%40googlegroups.com.

Sclex

unread,
Nov 12, 2023, 4:52:36 AM11/12/23
to Fiction Book Editor
ТаКир, за идею спасибо, но в ближайшее время навряд ли ее реализую.

воскресенье, 12 ноября 2023 г. в 12:43:54 UTC+3, TaKir:

e-paper.ru

unread,
Nov 12, 2023, 4:55:54 AM11/12/23
to fiction-b...@googlegroups.com
Да мне не горит, так, если вдруг у тебя будет время и желание повозиться и создать очередную волшебную кнопку "Сделать красиво" )
За доработку скрипта по заголовкам спасибо большое!


вс, 12 нояб. 2023 г. в 12:52, Sclex <scl...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/ce3d4b42-7ac0-4708-8f8f-916365b131b0n%40googlegroups.com.

stokber

unread,
Nov 12, 2023, 4:57:14 AM11/12/23
to Fiction Book Editor
Спасибо! Теперь все отображения пробелов срабатывают.

воскресенье, 12 ноября 2023 г. в 11:42:26 UTC+3, Sclex:
Message has been deleted

Sclex

unread,
Nov 15, 2023, 1:39:13 AM11/15/23
to Fiction Book Editor
Latimur, я вас не понимаю.

вторник, 14 ноября 2023 г. в 22:25:59 UTC+3, shahl...@gmail.com:
Приветствую. Как делишки? (не обижайтесь, это с того, что обычно
отвечал (и) дела - у прокурова, а у нас только делишки). Вот прожил,
сколько то еще. поделал книжонки. Решил написать. И тут еще Вы немного
пообсуждали на сайте
> В этом скрипте часто может пригодиться ещё один регексп, условно назовём
> его "Вида «ЗАГОЛОВОК»". Это когда строка для заголовка состоит из ЗАГЛАВНЫХ.
1) Результате скрипт чего там делает - по моим скрипту и регулярке
моим хотелкам полезное нет ли там чего добавить, обновить?
2) мне еще чуточку обновить захотелось, если не очень муторно, нельзя
ли изменить - Главу на плаху 32 - в первое число, по умолчанию вместо
1, появлялась с "2" кой? И еще если бы можно было в следующих позициях
- последнее число и
Суффикс, оставались последние введенные данные? - Не как база данных,
а просто - последние. Обычно несколько файлов подряд обрабатываю.и чем
каждый раз вводить, некоторые изменение вводить быстрее было бы. А так
все прекрасно.
Спасибо!!!

stokber

unread,
Nov 15, 2023, 3:35:51 AM11/15/23
to Fiction Book Editor
Latimur

   > 1) Результате скрипт чего там делает - по моим скрипту и регулярке
   моим хотелкам полезное нет ли там чего добавить, обновить?

Скрипт "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..." СОЗДАЁТ из фрагментов-шаблонов текста Заголовки или Подзаголовки, что и следует из его названия. ДЛЯ ПЕРЕИМЕНОВАНИЯ заголовков он НЕ предназначен.
Небольшое видео, посвящённое работе этого скрипта:

   >изменить - Главу на плаху

Сделать по умолчанию "2" можно. Сделать по умолчанию последние введенные данные несколько труднее. Может когда-нибудь и сделаю, но обещать не буду.
По поводу "Плахи" пишите лучше мне на почту, так как она с темой данного скрипта "Разметить заголовки разделов либо подзаголовки, найденные по регэкспу..."  никак не соотносится.

07.11.2023, stokber<sto...@gmail.com> написал(а):
> Спасибо!
> В этом скрипте часто может пригодиться ещё один регексп, условно назовём
> его "Вида «ЗАГОЛОВОК»". Это когда строка для заголовка состоит из ЗАГЛАВНЫХ
> букв + знаки препинания.
> У меня такая регулярка:
> ^[.…«\( \xA0]*([A-ZА-ЯЁ]+[-—–\d\.\*,;:?!…«»“”„\(\) \xA0]*)+$
> Галочку "учитывать регистр" обязательно проставляем.
>
> вт, 7 нояб. 2023 г. в 18:36, Sclex <scl...@gmail.com>:
>
>> Скрипт "05_Разметить заголовки разделов либо подзаголовки, найденные по
>> регэкспу..." обновлен до версии 2.7.
>>
>> - теперь в регэкспах для поиска заголовков либо подзаголовков - можно
>> прописывать конструкцию "\xA0" (кроме кавычек), и эта конструкция будет
>> находить неразрывный пробел вне зависимости от того, каким символом
>> показываются в FBE неразрывные пробелы (квадратиками, кружками и т.п.).
>> - предзаданные регэкспы в данном скрипте изменены так, чтобы находились в
>> том числе и заголовки/подзаголовки, которые начинаются с пробелов
>> (простых
>> либо неразрывных), которые кончаются пробелами (простыми либо
>> неразрывными), и которые содержат внутри последовательности из
>> простых/неразрывных пробелов (например, между словами "Глава" и
>> "первая").
>>
>> Ссылки для скачивания файлов скрипта (последняя версия):
>> 05_Разметить заголовки разделов либо подзаголовки, найденные по
>> регэкспу....js
>> (положить в папку "Scripts\13_Заголовки, подзаголовки, пустые строки")
>> Разметить заголовки разделов либо подзаголовки, найденные по регэкспу -
>> задание параметров.htm
>> (положить в папку "HTML")
>>
>> --
>> Вы получили это сообщение, поскольку подписаны на группу "Fiction Book
>> Editor".
>> Чтобы отменить подписку на эту группу и больше не получать от нее
>> сообщения, отправьте письмо на электронный адрес
>> fiction-book-ed...@googlegroups.com.
>> Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке
>>
>
> --
> Вы получили это сообщение, поскольку подписаны на группу Fiction Book
> Editor.
>
> Чтобы отменить подписку на эту группу и больше не получать от нее сообщения,
> отправьте письмо на электронный адрес
> fiction-book-ed...@googlegroups.com.
> Просмотреть это обсуждение в Сети можно по адресу
> https://groups.google.com/d/msgid/fiction-book-editor/CALqvQh2APKc2jgQmTCXi82Bbq4opAuHd%2B%3Du1fptdoYnuRkK31Q%40mail.gmail.com.
>
Reply all
Reply to author
Forward
0 new messages