Скрипты для поиска и статистики нецензурных слов

stokber

unread,

Oct 30, 2024, 11:38:29 AM10/30/24

to Fiction Book Editor

Я при активном содействии TaKir-а написал два новых скрипта на замену предыдущему «20_Поиск (без замены) нецензурщины, упоминаний FB и Insta», который работал не так чтобы очень. Новый скрипт «Поиск нецензурных слов» находит, ну, хочется надеяться, почти все изыски табуированной лексики, плюс добавлены слова, в которых отдельные буквы заменены звёздочками, решётками или похожими буквами латиницы. Не забыты и упоминания FB и Инстаграм.
Скрипт «Статистика нецензурных слов» покажет списком все найденные слова и их количество для каждого отдельно. Латиница (псевдокириллица) в русских словах будет выделена красным шрифтом. Также красным будет выделена матерная основа составных английских слов-матов. Здесь возможны ложные срабатывания, типа нашего слова «педикюр» и др. К сожалению, поверхностное знание английской грамматики не позволило сделать эту часть функционала более совершенной. Упоминания ФБ и т. п. будут размещены в конце списка и выделены зелёным шрифтом. По запросу можно будет оставить в аннотации упоминание о наличии в книге подобной лексики.
За основу был взят регексп-антимат за авторством ув. imDaniX (за что ему отдельная признательность)(https://gist.github.com/imDaniX/8449f40655fcc1b92ae8d756cbca1264#file-swears-javascript-regex), частично переработанный для работы в FBE. Добавлены недостающие слова и исключения, слова со звёздочками и решетками, английский мат-перемат и прочие Insta-Meta. Также отдельная благодарность TaKir-у за помощь в написании, тестировании и иконки к этим двум сценариям. За ставший уже универсальным, скрипт «Поиск по набору регекспов», на базе которого собран один из представленных скриптов отдельное спасибо Sclex-у.

stokber

unread,

Oct 30, 2024, 11:46:59 AM10/30/24

to Fiction Book Editor

80_Поиск нецензурных слов.js - поместить в папку «21_Поиск и замена».
80_Поиск нецензурных слов.ico - поместить в папку «21_Поиск и замена».
10_Статистика нецензурных слов.js - поместить в папку «10_Статистика».
10_Статистика нецензурных слов.ico - поместить в папку «10_Статистика».
Статистика нецензурных слов.html - поместить в папку HTML.

Предыдущие два скрипта из папки "21_Поиск и замена":
20_Поиск (без замены) нецензурщины, упоминаний FB и Insta.js
20_Поиск (без замены) нецензурщины, упоминаний FB и Insta.ico из папки "21_Поиск и замена"
- можно удалить.

среда, 30 октября 2024 г. в 18:38:29 UTC+3, stokber:

stokber

unread,

Nov 12, 2024, 8:01:37 AM11/12/24

to Fiction Book Editor

Обновлены оба сценария для поиска и статистики нецензурных слов до v.1.7

В новых версиях ВСЕ слова, в которых звёздочки или решётки вплотную примыкают к началу слова или находятся посредине его, будут считаться «подозрительными».

В таблице скрипта "Статистика нецензурных слов" теперь будут отображаться две колонки — одна с найденными Последовательно, и другая — По алфавиту (с указанием количества каждого отдельно) словами.

80_Поиск нецензурных слов.js - поместить в папку «21_Поиск и замена».

10_Статистика нецензурных слов.js - поместить в папку «10_Статистика».

среда, 30 октября 2024 г. в 18:46:59 UTC+3, stokber:

stokber

unread,

Feb 12, 2025, 2:39:24 PM2/12/25

to Fiction Book Editor

В скрипте "Статистика нецензурных слов" произведены некоторые изменения. Поступили сообщения о слишком долгом открытии окна со статистикой. У себя на XP, Win 7 и Win 10, я, впрочем, ничего такого не заметил, но всё-таки… Теперь с помощью переменной "okno" (в начале кода) можно указать, в каком окне показывать результаты статистики: обычном или ModelessDialog. По умолчанию включено обычное html-окно. Из плюсов обычного окна — возможность тут же выделить и скопировать нужные вам строки. Окно ModelessDialog не позволяет выделить и скопировать из него, но зато открывается как правило быстро. В случае выбора окна ModelessDialog, есть возможность помещения всего содержимого таблицы статистики в буфер обмена. Это можно сделать, настроив параметры переменной "tablCopu".

Скрипт обновлён до версии 1.8.

10_Статистика нецензурных слов.js - поместить в папку «10_Статистика».

вторник, 12 ноября 2024 г. в 16:01:37 UTC+3, stokber:

Reply all

Reply to author

Forward