python 3

245 views
Skip to first unread message

Mikhail Korobov

unread,
Apr 3, 2012, 9:14:06 PM4/3/12
to nltk-r...@googlegroups.com
Для адаптации даже первой главы ( https://groups.google.com/forum/?fromgroups#!topic/nltk-russian/M_VcIMpmMjA ) потребуется довольно много изменений, улучшений и даже хаков, связанных с поддержкой юникода. 

Все было бы проще, если б можно было использовать 3й питон, но его использовать нельзя, т.к. nltk сейчас 3й питон не поддерживает. 

Можно поступить амбициозно: писать книгу для python 3, добавляя поддержку 3го питона в nltk по мере перевода. Ориентировочный срок завершения перевода - пол-года? Думаю, Стивен будет только рад выпустить nltk3 к этому времени, если поддержку 3го питона туда добавим. Это задача абсолютно реальная, и если найдется 2-3 энтузиаста (больше - лучше), которые мне согласятся помочь, то можно двух зайцев сразу убить: добавить поддержку 3го питона в nltk и сделать книгу понятнее, избежать ужасов с кодировками и поддержкой русского текста. Я могу за это и один взяться, но мне кажется, что для успеха всей затеи это будет плохой идеей - перевод nltk на 3й питон станет ограничивающим фактором в переводе книги на русский язык, и на одного человека полагаться тут не хорошо. Поможете?

О себе: в nltk помог сделать текущую инфраструктуру тестов, исправлял там некоторые ошибки, добавил поддержку pypy в nltk, написал pymorphy (русский POS-теггер), добавлял поддержку 3го питона в pymorphy, организовывал перевод pytils на 3й питон (изначально хотели браться именно за nltk, но тесты были в нестабильном состоянии и поэтому перевели pytils), еще несколько пакетов на 3й питон переводил.

Alisa_IPN

unread,
Apr 4, 2012, 12:25:00 AM4/4/12
to nltk-russian
Ого, да ты просто кладезь знаний по nltk!


Честно говоря, мне кажется, лучше было бы попробовать адаптировать все
к Python 2.6 -2.7. Это более популярные версии, большинство курсов/
учеников по Питону напралвен именно на них. Т.е. люди, которые
осваивают Питон для конкретных узких целей <написания диссера> (как
я), скорее всего, будут знать именно 2ю версию. А т.к. эта книга для
широкого круга (судя по предисловию, от новичков в программировании до
профи по Питону), то лучше и писать на более распространенных версиях
2.6-2.7 (честно говоря, я не знаю, существенная ли между ними
разница).

Ты сам пишешь в другой теме, про адаптацию главы 1, что все-таки лушче
выбрать 2.6 и 2.7.
Дальше в теме про 1ю главу отпишу.

On 3 апр, 20:14, Mikhail Korobov <kmik...@googlemail.com> wrote:
> Для адаптации даже первой главы (https://groups.google.com/forum/?fromgroups#!topic/nltk-russian/M_VcI...

Reply all
Reply to author
Forward
0 new messages