> > продвижение вперёд обещаю ...- Скрыть цитируемый текст -
>
> - Показать цитируемый текст -
1) Шрифт Charter IE для символов unicode установил. Однако не могу
активировать его в EmEditor (бесплатная версия, OS: Windows XP Pro
English). Лично мне было бы, наверное, удобней править в MS Word 2003.
Есть против этого какие-нибудь возражения?
2) Таблицу транслитерации санскрита IAST нашёл здесь:
http://alanlittle.org/projects/transliterator/translitTable.html
Там же приведены коды unicode, harvard kyoto и itrans. Есть возражения
против этого источника?
3) Это, скорее, не вопрос, а замечание:
распознанный текст содержит плохо читаемые "композиты", как здесь:
v&ni+
[m1][trn] 1) звук 2) голос 3) музыка 4) речь;
язык слов;
слова 5) литературное произведение 6) [p][i]nom.[/p] [p]pr.[/i][/p]
богиня Сарасвати;
[p][i]см.[/i][/p] "xt-qdi 1)[/trn][/m]
поэтому скан "оригинала" Кочергиной приходится держать тоже перед
глазами.
4) Используемые тэги формата Лингво очень просты. Однако имеет,
наверное, смысл выложить здесь сжатое описание, что есть что и как
карточка словаря должна быть оформлена.
2) Источник как источник. Сам придерживаюсь http://groups.google.com/group/Nagari/web/iast-1912
3) Ведь, если имеете ввиду ""xt-qdi", то это сделала машина, поэтому и
надо править словарь чтобы все внутренние ссылки поправить. Что же
касается скана - да, разумеется, он всегда перед нами.
4) Очень хорошее предложение, однако за 2 года идеальную статью пока
не удалось составить. Впрочем, не только у меня.
On 6 мар, 16:12, "Worga" <swo...@googlemail.com> wrote:
> Вопросы по правке словаря:
On 6 мар, 16:12, "Worga" <swo...@googlemail.com> wrote:
> Вопросы по правке словаря:
1. Все правки необходимо делать в ворде, без всяких тегов.
2. Последующая расстановка тэгов должна осуществляться с помощью
специального макроса.
3. Вся работа по возможности должна быть автоматизирована с помощью
средств ворда, все участники должны придерживаться четких правил,
оформленных в виде специального руководства.
4. Формат группы Гугл совершенно не приспособлен для подобных
проектов. Он не позволяет распределять задания, отслеживать выполнения
работ и осуществлять общую координацию.
На мой взгляд, наилучшим вариантом было бы использовать уже
существующий опыт по оцифровке БКРС и БЯРС и перенести его на данный
проект с учетом его специфики. Если участники проекта не против, я
предложил бы осуществлять проект оцифровки санскритских словарей на
ПВФ, тем более, что специальный раздел под него уже создан.
-
Олег.
На нашем собрании индийских риши. Долго пришлось тебя ждать.
On 7 мар, 01:21, "prp...@gmail.com" <prp...@gmail.com> wrote:
> Не хочу вас огорчать, но предлагаемый вариант работы совершенно
> бесперспективен.
Смею поспорить. Скорость выполнения оцифровки БКРС тоже кажется
http://forum.vostokopedia.ru/lofiversion/index.php/f183.html чуточку
затянутой. Китайский, не спорю, (чисто с точки зрения набора) куда
сложнее, однако санскрит бесконечен.
Формат группы Google пока сохраняем.
> 1. Все правки необходимо делать в ворде, без всяких тегов.
Тэги уже есть, сгенерированы макросом и далеко не полностью валидны.
Их уже не сотрешь, да и это не нужно. Что же касается целесообразности
набора и правки в Word'е - вероятно ты прав.
> 2. Последующая расстановка тэгов должна осуществляться с помощью
> специального макроса.
Надеюсь ответил строчкой выше. Макрос будет нужен для правильной
сортировки алфавита, но это уже следующая и не такая уж и большая
проблема. Надеюсь, что к этому времени Миша уже сможет подключится к
данной работе.
> 3. Вся работа по возможности должна быть автоматизирована с помощью
> средств ворда, все участники должны придерживаться четких правил,
> оформленных в виде специального руководства.
Именно так. Не знаю кто писал руководство БКРС (человек логического
склада ума и просто, видимо, прирожденный лексикограф), но одно могу
сказать - написано очень грамотно. А что же касается автоматизации -
интересно, а что же мы упустили?
> 4. Формат группы Гугл совершенно не приспособлен для подобных
> проектов. Он не позволяет распределять задания, отслеживать выполнения
> работ и осуществлять общую координацию.
Формат форума Invision Power Board к этому приспособлен так же мало,
как и эта группа. Были бы добровольцы, - задание распределим, а что
касается отслеживания, тот тут уже в дело пускаем gmail.com,
skype.com, на худой конец icq.com. Недостатки данной технологии (гугл
групп) мне известны, смею уверить, даже лучше тебя, тем не менее я
считаю, что это перспективнее.
> На мой взгляд, наилучшим вариантом было бы использовать уже
> существующий опыт по оцифровке БКРС и БЯРС и перенести его на данный
> проект с учетом его специфики. Если участники проекта не против, я
> предложил бы осуществлять проект оцифровки санскритских словарей на
> ПВФ, тем более, что специальный раздел под него уже создан.
> Олег.
Согласен, но только с первым утверждением. Согласен полностью. Олег,
если оцифровка словаря хинди тебя еще (окончательно) не загубила,
то твоя помощь как раз при составлении руководства была бы незаменима.
Пока что http://forum.vostokopedia.ru/lofiversion/index.php/f187.html
пустеет,
а здесь хоть маленький, но течет ручеек. Там ведь все японисты и
синологи.
Если форум приведет хотя бы троих участников, которые при этом будут
не лентяями,
то можно и пересмотреть стратегию скрытого форума где-то в
окрестностях Щамбалы.
Как только устроюсь на новом месте, попрошу вернуть двухтомник хинди,
- я все
же его отсканирую, хотя, похоже, только после санскритских штучек.
Достать макет словаря hindi Ульциферова не удастся, его накрепко
держит в железной схватке недавно переименованное издательство
"Русский язык медиа". Что будем делать, когда Лингво
захочет иметь словарь хинди? или, упаси бог, тамили? Надо быть готовым
ко всему.
http://rapidshare.com/files/15798310/Rus-Tam1965.pdf
Марцис, Акадэм
Если сравнивать с Кочергиной, то он раз в десять побольше. )))
> А что же касается автоматизации -
> интересно, а что же мы упустили?
Понятия не имею, найти здесь правила форматирования, цели проекта и
правила работы не представляется возможным.
>
> Формат форума Invision Power Board к этому приспособлен так же мало,
Тем не менее его возможности гораздо богаче. Никак не участвуя в
оцифровки японского словаря, я всегда был в курсе как он продвигается
и на каком этапе. Здесь же, кроме отрывочных сообщений, которые
исчезают в хаосе других тем, никак не связанных с оцифровской,
отследит что либо вообще не возможно.
On 7 мар, 19:49, "prp...@gmail.com" <prp...@gmail.com> wrote:
> > Смею поспорить. Скорость выполнения оцифровки БКРС тоже кажетсяhttp://forum.vostokopedia.ru/lofiversion/index.php/f183.htmlчуточку
> > затянутой.
>
> Если сравнивать с Кочергиной, то он раз в десять побольше. )))
28 000 x 10 = 280 000, что лизко к 250 000, что и есть правда.
> > А что же касается автоматизации -
> > интересно, а что же мы упустили?
>
> Понятия не имею, найти здесь правила форматирования, цели проекта и
> правила работы не представляется возможным.
Цель номер один - восстановить, как есть. Цель номер два - убрать
всякие глупости наподобие квази-корней и просто очевидных ляпов. Цель
номер три - сверить объем картотеки Кочергины с глоссариями и
словарями среднего объема. Цель номер четыре - добавить контексты.
Правила форматирования и правила работы пока не утврждены.
>
> > Формат форума Invision Power Board к этому приспособлен так же мало,
>
> Тем не менее его возможности гораздо богаче. Никак не участвуя в
> оцифровки японского словаря, я всегда был в курсе как он продвигается
> и на каком этапе. Здесь же, кроме отрывочных сообщений, которые
> исчезают в хаосе других тем, никак не связанных с оцифровской,
> отследит что либо вообще не возможно.
Тема эта приклеена, поэтому никуда не исчезнет. Отдельные страницы
здесь может править каждый, в том числе страницу, которая касается
словаря. Возможности богаче, но нужны ли они все нам? Твоая основная
претензия - хаос, правильно понимаю?!
Так вы делаете электронный словарь или некую базу данных? Если е-
словарь, то достаточно лишь первого пункта. Все остальные пункты
требуют профессиональной редактуры. Я тебя уважаю, но пользоваться
исправленной тобой версией словаря Кочергиной мне как-то сомнительно.
> Правила форматирования и правила работы пока не утврждены.
А чем вы собственно тогда занимаетесь? ))) Я так понимаю, каждый
делает оцифровку так, как он себе это представляет, а потом все дружно
будут переделывать свои файлы, потому что окажется, что из нельзя
свести воедино.
> Тема эта приклеена, поэтому никуда не исчезнет. Отдельные страницы
> здесь может править каждый, в том числе страницу, которая касается
> словаря. Возможности богаче, но нужны ли они все нам? Твоая основная
> претензия - хаос, правильно понимаю?!
Любой серьезный проект надо делать по возможности профессионально, а
не по дилетантски. Не распыляя ресурсы и не тратя впустую энтузиазм
людей, который ты привлекаешь к проекту. Сравни организацию проекта по
оцифровке БЯРС
http://forum.vostokopedia.ru/index.php?showforum=81
и раздел по оцифровке санскритских словарей:
http://forum.vostokopedia.ru/index.php?showforum=187
Разница достаточно очевидна, чтобы желающие подключится к работе
испытывали весьма серьезные сомнения в том, что этот проект
жизнеспособен.
А ты говоришь, пусть придут с форума хотя бы три человека, да не
придут они никогда, потому что совершенно не ясно, какие цели ставятся
и насколько они реальны.
Что имеем:
Результат распознавания текста (OCR):
vā
[m1][trn](U. [p][i]pr.[/p] váyati/váyaíe[/i] —— [i]lV;
[p]fut.[/p] vayişyáti/vayiţyáíe;
[p]aor.[/p] uyát, ávāsii/ávāsta, vāsíşţa;
[p]pp.[/p] utá)[/i] 1) ткать 2) плести 3) соединять, связывать
<->
[p]см.[/p] ЗЯ I Щ^° ш*- [p]см.[/p] ЗТЧ ●•S -\\ 3W ш&п 1. говорящий 2.
♂ 1) изречение, формула 2) болтовня 3) разговор[/trn][/m]
Предполагаемая работа редактора:
वा
[m1] वा I vā [trn]([i][p]pcl.[/p][/i] 1) или 2) как 3) пожалуй 4) же
5) иногда;
~ ... वा ... или ... или; यदि वा ... ~ ли ... или; त वा ... ~,
त ... ~ ни ... ни; को ~ न;
के ~ न кто же не ...; каждый, все[/trn][/m]
[m1] वा II vā [trn](P. [i][p]pr.[/p] vti – II; [p]fut.[/p] vasyáti;
[p]pf.[/p] vaváu; [p]aor.[/p] ávāsit) [/i] 1) дуть 2) веять 3) идти 4)
распространяться 5) уставать
[/trn][/m]
[m1] वा III vā [trn](U. [i][p]pr.[/p] váyati/váyate – IV;
[p]fut.[/p] vayiṣyáti/vayiṣyáte; [p]aor.[/p] yāt, ávāsit/ávāsta,
vāsiṣṭa;
[p]pp.[/p] utá)[/i] 1) ткать 2) плести 3) соединять, связывать[/trn]
[/m]
[m1] वा IV vā [trn]([i]см.[/i] [ref]वन्[/ref] I[/trn][/m]
Что необходимо прояснить:
1) Каким шрифтом набираем деванагари?
2) Каким шрифтом знаки пунктуации?
3) Каким шрифтом транслит (Charter IE)?
4) Каким шрифтом тэги и сокращения?
5) «Главные слова» набираем транслитом или деванагари?
После того, когда будут чётко определены правила форматирования
карточек словаря, составим подробную инструкцию, чтобы при сведении
кусков словаря, редактируемых разными участниками проекта, не было
разногласий.
On 8 мар, 03:29, "Marcis" <gasy...@gmail.com> wrote:
> Почему же, Зализняк не сомневался, что подправить Кочергину надо и что
> я смогу, а ты не будешь пользоваться? Не захочешь, заставим. Все же
> просьба, пропиши еще раз свой ник вhttp://groups.google.com/groups/profile?myprofile
2) Каким шрифтом знаки пунктуации?
Arial Unicode MS. Возникают несколько проблем. Для передачи знака,
который обозначает «вначале сложного слова», «в конце сложного слова»
в Чартере прорисованы (неюникодовские) отдельные знаки, но во время
набора предлагаю использовать: 1)°- 2) -°
3) Каким шрифтом транслит (Charter IE)?
Arial Unicode MS во время редактирования, для Интернета и Лингво, для
книги Чартер ( а также шрифт Петербург).
4) Каким шрифтом тэги и сокращения?
Замену цвета в Ворде можно сделать в любой момент. Шрифт тот же что и
в остальном транслите (хотя в бумажном издании будет совершенно другой
шрифт для метаязыка словаря). Предлагаю оранжевым.
5) «Главные слова» набираем транслитом или деванагари?
Ответил в первом пункте – ради экономии места и по техническим
причинам (не потому, что не можем, а потому что потом в любой момент
сможем) – все транслитом.
Что же касается инструкции, просьба всех, кроме Олега и Петра
(которые видят эти инструкции во снах) ознакомится с вородвскими
документами.
Сначала был БКРС, поэтому тут читаем
http://forum.vostokopedia.ru/index.php?showtopic=1999
Они, наверно, как и мы теперь, допустили все возможные
методологические ошибки, на их ошибках учились БЯРС:
http://www.vostokopedia.ru/forum/index.php?showtopic=125
Возражения, предложения, что-то не так?
> Сначала был БКРС, поэтому тут читаемhttp://forum.vostokopedia.ru/index.php?showtopic=1999
> > > привести все в порядке не по силам. Давай объединим головы!- Zitierten Text ausblenden -
>
> - Zitierten Text anzeigen -
Это не плагиат, мы просто учитываем опыт коллег, зачем же наступать на
одни и те же грабли дважды ...
Тогда я потихоньку пишу "rules" - в ближайшие дни выложу здесь для
последующей доработки сообществом ...
> > будут подправить.- Zitierten Text ausblenden -
On 10 мар, 11:09, "Marcis" <gasy...@gmail.com> wrote:
> Олег, умоляюhttp://groups.google.com/group/Nagari/subscribe
> проставь все же ник, а не мыло вместо имя.
Имя стоит, но не отражается:
http://groups.google.ru/groups/profile?enc_user=USP31hAAAAB2wjmxf9D94oKutTKL3ca0
Что ж я могу поделать с этим кривым гуглом.
Phase One Preparing and comparing the verses from each chapter in the
Sanskrit and Tibetan versions.
Phase Two Selecting Medical Terms and Preparing Sanskrit-English and
Tibetan-EnglishEntries.
Phase Three Adding the German Equivalents.
Phase Four Preparing the Materia Medica, including Latin Botanical
Names.
Phase Five Editing.
Phase Six Electronic Processing.