Пара глюков: ошибочно ставит ё в бубен (музыкальный инструмент), выходит бубён (масть); и суете => суёте — что вспомнилось. (Без компилирования и прочей ереси, можно словарь ёфикатора поправить в текстовом редакторе?)
Собственно, желателен инструмент для ручной обработки или хотя бы нахождение этих омографов (ёмографов?) по словарю. Если о все=>всё и нем=>нём, ещё вспоминаю, то с остальным сложнее.
--
Вы получили это сообщение, поскольку подписаны на группу FBTools.org (Russian).
Чтобы отказаться от подписки на эту группу и перестать получать из нее сообщения, отправьте электронное письмо на адрес ru-fbtools+...@googlegroups.com.
Чтобы добавлять сообщения в эту группу, отправьте письмо по адресу ru-fb...@googlegroups.com.
Перейдите в группу по ссылке http://groups.google.com/group/ru-fbtools.
Настройки подписки и доставки писем: https://groups.google.com/groups/opt_out.
Но надо будет перелопатить сотни тысяч слов на предмет выявления двузначности - а это сложно... И долго... Я пока внесу в этот список те слова, которые вы указали. Потом по ходу можно всегда будет расширять этот список.
Если вы найдете еще такие слова из ё-словаря (txt файл находится внутри расширения), то напишите.
???
Не стоит валить в одну кучу логику (программную реализацию) и составление претендующего на достаточную полноту словаря.
Для проработки логики приведённых примеров достаточно.
Упираться же в составление _словаря_ полагаю вообще нецелесообразным.
Оптимальным решением здесь ИМХО будет иметь в виду эту задачу в процессе чтения и/или работы над текстами.
Если вы найдете еще такие слова из ё-словаря (txt файл находится внутри расширения), то напишите.А для ревизии существующих файлов (склонен полагать пропуск части слов по рассматриваемому критерию) можно пригласить товарищей гуманитариев.
Боюсь, что нет. С "отелем" и "отёлом" все ясно, но программа не может знать, какие слова пользователь захочет ёфицировать, а какие - нет. Тогда придется для всех слов в словаре и для каждого найденного соответствия в тексте делать интерактивный запрос - что делать - оставить или ёфицировать? Это не выход. Или другой подход - составить словарь со словами двойственного значения (могут быть с "ё" и "е", и уже только по ним делать интерактивный запрос.Для проработки логики приведённых примеров достаточно.Если так-то по-другому, то я пока не могу уловить суть подхода...
Найти бы таких...Если вы найдете еще такие слова из ё-словаря (txt файл находится внутри расширения), то напишите.А для ревизии существующих файлов (склонен полагать пропуск части слов по рассматриваемому критерию) можно пригласить товарищей гуманитариев.
Мне казалось, что идея озвучена и понята…
Что словарь для ёфикации в нулевом приближении заимствован — самоочевидно.
Но пора его и это самое… натурализировать в проекте.
Полагаю необходимым разбить его на два или три файла:
1. Слова, подлежащие ёфикации безусловно и однозначно.
2. Возможный вариант: слова, которые _можно_ (но не обязательно) ёфицировать автоматически, для фанатов буквы 'ё'.
3. Слова, меняющие смысл (и имеющие варианты прочтения) как с буквой 'ё', так и без неё. Для отработки этой категории необходимо спрашивать пользователя.
Пожалуй, есть варианты. Посмотрю что можно сделать.