Плавное добавление новых слов всё время спотыкается об отсутствие некоторых префиксов.
поли- поликарбонат, полистирол...
свеже- свежеприготовленный, свежескошенный...
Их оказалось много.
Приходится брать файл правил и добавлять новые. От этого возвращаться и перепричёсывать всё опять.
--
Вы получили это сообщение, поскольку подписаны на группу "Fiction Book Editor".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес fiction-book-ed...@googlegroups.com.
Чтобы посмотреть обсуждение, перейдите по ссылке https://groups.google.com/d/msgid/fiction-book-editor/CAN7iDvUp6CXkb-mU%3Du1ZeEdr4bBpZK-U_xrcMf%3DCwk8_eGp9og%40mail.gmail.com.
Простое добавление новых слов, как оказалось, это самое простое. Потому что в в текущем массиве довольно много того, что сделано было помимо задуманных правил. Поэтому я отставил механическое добавление новых слов на потом, взялся за анализ существующего.
Вчера изменял правила словам с приставкой, которую ввёл в файл правил. Вручную это было очень трудоёмко, около 600 слов. Сегодня написал скрипт, который делает это за меня. Останется только проверить результаты.
По приставкам, которые накидал сам, в дополнение к тем, что были, получилось что-то в районе 9.000 слов. Потом решил проверить приставки, которые уже были в словаре. И оказалось, что никто их системно не причёсывал. Стал делать. Прошёл наверное половину. Получилось около 25.000 слов. Компьютеру тяжело. Гудит, беспрерывно работает. Сравнение всех со всеми. Из четырёх ядер оставил себе одно. Остальные пашут не покладая рук.
Выкладывать словарь с причёсанными приставками смысла не имеет пока. Потому что ничего не добавлено будет. Своих добавлю ещё хотя бы 10.000, тогда выложу.
С приставками закончил. Получилось 47.000. соответственно словарь похудел на это же количество.
При проверке обнаружил ошибки. Но чтобы исправлять их, пришлось написать ещё один скрипт. Потому что вручную это было нереально исправить.
Начну добавлять новые слова.
Пока исправлял сделанное, пересчитал приставки которые были и которые стали.
https://drive.google.com/file/d/1SQLeYkuMhiT8ZJOJShQO63ddeHuJdU48/view?usp=drivesdk
https://drive.google.com/file/d/122yKslSXVpwH6-rXY1wEeMJSvHeT5hNU/view?usp=drivesdk