Скрипты «Поиск абзацев с непарными кавычками»

36 views
Skip to first unread message

stokber

unread,
Jan 31, 2024, 2:28:25 PMJan 31
to Fiction Book Editor
Предлагаю к ознакомлению ещё парочку скриптов. Как следует из имени, они ищут абзацы с непарными кавычками, заодно проверяя их «правильную» вложенность.
Созданы они на базе скрипта «Поиск (без замены) ошибок текста». 
Скрипт находит и выделяет абзацы с с такими «неправильными» скобками-кавычками, и в статус-баре появляется сообщение с их перечислением. Найти конкретных «виновников» такого безобразия предоставляется уже пользователю.
Сценарий проверяет следующие пары скобок-кавычек:
""  «»  „“  “” ()  []  {}  <> 
Попутно могут быть найдены цитаты из нескольких абзацев, некоторые разорванные  абзацы, неверно распознанные символы и др.
Сценарии представлены для двух типов текстов: с „традиционными“ лапками и с “альтернативными”.

— положить в папку "Обработка кавычек".
— положить в папку "Обработка кавычек".

e-paper.ru

unread,
Jan 31, 2024, 2:45:59 PMJan 31
to fiction-b...@googlegroups.com
Спасибо большое!
Тоже собирал на базе скрипта "Поиск по набору регэкспов" скрипт для поиска возможных цитат и скрипт поиска разрывов абзацев.
Аналогично можно поиск стихов сделать и, наверняка, много чего еще.

ср, 31 янв. 2024 г. в 22:28, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/9ce1f6da-7229-4ec1-9e23-a855e53b6b6cn%40googlegroups.com.

stokber

unread,
Feb 1, 2024, 5:50:55 AMFeb 1
to fiction-b...@googlegroups.com
>Спасибо большое!
Пожалуйста!

>Аналогично можно поиск стихов сделать и, наверняка, много чего еще.
Ну, со стихами, немного сложнее, там, наверное, многострочный поиск потребуется. Можно, конечно выделять отдельные короткие строки не размеченные стихами-заголовками и пр., отфильтровав короткие реплики диалогов, тексты сносок, ещё кое-что. Будет, конечно, некоторое количество ложных срабатываний, но всё-таки.

> и, наверняка, много чего еще.
Например?

ср, 31 янв. 2024 г. в 22:46, e-paper.ru <epap...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/CAKYXB9X%2B3k5s%2Bf2J9VXPJ6shkEU456awEGe6-n_%2BL7Mxzn_hCg%40mail.gmail.com.

e-paper.ru

unread,
Feb 1, 2024, 6:24:31 AMFeb 1
to fiction-b...@googlegroups.com
В свое время я пытался собрать некие признаки для ловли стихов


Подходящие кандидаты:

Общее условие:
Короткие строки (например, до 65 знаков)
Короткие строки, не начинающиеся с диалога (тире+пробел, дефис+пробел) или с цифр


Короткая строка (1 или более) обрамленные пустыми строками или ПС и Заголовок или ПС и Подзаголовок

Курсивная (или болдовая) короткая строка (1 или более) обрамленные пустыми строками

Короткие строки (2 и более подряд) с разрывами абзацев (в конце запятая или буква), в начале строки маленькая буква


У скрипта желателен режим - просто находить соответствующие вхождения, без диалоговых окон.
Фактическую разметку делает юзер по необходимости.

_________________________________________

> и, наверняка, много чего еще.
Например?

Ну как минимум:
1) поиск участков "кода" для его форматирования
2) поиск возможных "цитат" по списку ключевых слов
3) поиск левых курсивов или болдов внутри абзаца (отдельные буквы или знаки препинания) и всякое такое.
Часто бывает просто неаккуратно текст передался в фб2 - хочется поправить, чтобы стало красиво, но выискивать глазами в объемных текстах утомляет.

чт, 1 февр. 2024 г. в 13:50, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/CALqvQh2fOy7e_YodXihY6_s1_UWsCteOwt06-3UxGd2OV6_nFw%40mail.gmail.com.

stokber

unread,
Feb 1, 2024, 7:01:01 AMFeb 1
to fiction-b...@googlegroups.com
> 1) поиск участков "кода" для его форматирования
> 2) поиск возможных "цитат" по списку ключевых слов

Подробнее:
1) примеры таких участков "кода".
2) т. е. есть список слов (в каком количестве?). Нужно выделять эти слова? Или искать абзацы, с ними?

чт, 1 февр. 2024 г. в 14:24, e-paper.ru <epap...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/CAKYXB9XEG%2BG6B9ARwRPHKQK_AzUj_vAFzCCMzgdO00g%2BTss%2BsQ%40mail.gmail.com.

e-paper.ru

unread,
Feb 1, 2024, 7:22:49 AMFeb 1
to fiction-b...@googlegroups.com
1) примеры таких участков "кода".
Ну прям вот код программерский кусками, например. Как в комп. литературе всякой.
Или куски текста с тэгами внутри книги.
В фбе для него (кода) даже отдельные тэги есть, чтобы красиво смотрелось.
Понятно, что такими тэгами можно и "цитаты" выделять, если надо как-то сделать отличие одних цитат от других зачем-то.

2) т. е. есть список слов (в каком количестве?). Нужно выделять эти слова? Или искать абзацы, с ними?
Список слов есть, и можно дополнять, конечно.
Искать абзацы, но выделять, наверное, не надо, чтобы не снимать выделение при ложных срабатываниях, а их может быть как бы не столько же, сколько правильно найденных.

Скину в почту наработки.

чт, 1 февр. 2024 г. в 15:01, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/CALqvQh0PkcZ-h%3D8C3GTHZFT5u-FUACVCwJ6mSrcC5v7-B3sX%3DQ%40mail.gmail.com.

John Smith

unread,
Feb 1, 2024, 9:47:01 AMFeb 1
to Fiction Book Editor
Спасибо. Как раз есть повод поработать над парой десятков книг, заодно поковыряю вашим скриптом.
среда, 31 января 2024 г. в 21:28:25 UTC+2, sto...@gmail.com:

stokber

unread,
Feb 1, 2024, 11:12:37 AMFeb 1
to Fiction Book Editor
Пожалуйста.

четверг, 1 февраля 2024 г. в 17:47:01 UTC+3, bo0...@gmail.com:

Федор

unread,
Feb 2, 2024, 3:18:18 AMFeb 2
to fiction-b...@googlegroups.com
Спасибо! Очень полезные скрипты.

ср, 31 янв. 2024 г. в 21:28, stokber <sto...@gmail.com>:
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/9ce1f6da-7229-4ec1-9e23-a855e53b6b6cn%40googlegroups.com.


--
С уважением, Федор

stokber

unread,
Feb 2, 2024, 4:21:13 AMFeb 2
to Fiction Book Editor
Пожалуйста! Спасибо за позитивную оценку!

пятница, 2 февраля 2024 г. в 11:18:18 UTC+3, Федор:

John Smith

unread,
Feb 2, 2024, 6:49:34 AMFeb 2
to Fiction Book Editor
Сейчас как раз трудился над книгой - 1003 правых и 1004 левых кавычек. Конечно же без скрипта поиск был бы настоящим испытанием. А так кнопочку нажал и и нашел. Один из самых полезных скриптов. Еще раз благодарю за проделанную работу.

пятница, 2 февраля 2024 г. в 11:21:13 UTC+2, sto...@gmail.com:

e-paper.ru

unread,
Feb 2, 2024, 11:24:37 AMFeb 2
to fiction-b...@googlegroups.com
Сейчас тестировал скрипт поиска непарных кавычек (традиционных) - попался вариант "" - двое лапок подряд, скрипт не ловит, а хотелось бы )

ср, 31 янв. 2024 г. в 22:28, stokber <sto...@gmail.com>:
--

stokber

unread,
Feb 2, 2024, 2:51:29 PMFeb 2
to Fiction Book Editor

John Smith
>Один из самых полезных скриптов. Еще раз благодарю за проделанную работу.
Спасибо за проявленный интерес к нашим скриптам.

пятница, 2 февраля 2024 г. в 19:24:37 UTC+3, TaKir:

stokber

unread,
Feb 2, 2024, 2:58:14 PMFeb 2
to Fiction Book Editor
> Сейчас тестировал скрипт поиска непарных кавычек (традиционных) - попался вариант "" - двое лапок подряд, скрипт не ловит, а хотелось бы )
Спасибо за сообщение. Будем посмотреть.


пятница, 2 февраля 2024 г. в 22:51:29 UTC+3, stokber:

e-paper.ru

unread,
Feb 2, 2024, 3:23:13 PMFeb 2
to fiction-b...@googlegroups.com
Тут как бы не пойти по пути создания заново скрипта "расстановка елочек и лапок"... )

пт, 2 февр. 2024 г. в 22:58, stokber <sto...@gmail.com>:
Чтобы посмотреть обсуждение на веб-странице, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/fb448a46-43d4-4c7c-81db-54d0e5e23eb5n%40googlegroups.com.
Reply all
Reply to author
Forward
0 new messages