Формат трапнакрона

2 views
Skip to first unread message

Часлав Илић

unread,
Jul 21, 2009, 4:47:39 AM7/21/09
to so...@googlegroups.com
Друштво,

Мислим да не би било лоше да темељито отклонимо уобичајену примедбу у вези с
транскрибовањем и превођењем појединих именица налик на властите — да се
тиме читалац лишава изворног облика, када му затреба ради даљег истраживања.
Ово је начелно просто извести — довољно је да се одржава списак превода и
транскрипција назива и акронима („трапнакрон“) и у једном крајњем облику
буде на месту где га Гугл и компанија могу индексирати. Тако ће веза
прилагођени — изворни облик стајати тачно на путањи тог даљег истраживања.
Још ако корисник упиту дода кључну реч трапнакрон или trapnakron, изворни
облик ће се обавезно добити већ у исечку текста под првим поготком (тј. неће
бити потребе да се кликне на везу).

Један такав трапнакрон одржавам последње две године у вези с превођењем КДЕ-
а (http://sr.l10n.kde.org/trapnakron/), али сам сад намерио да га раздвојим
од унутрашње скеле превода КДЕ-а, тако да буде шире употребљив. С тим у виду
планирам да како програмску подршку тако и изворне датотеке трапнакрона
гурнем у Пологију, у одељак за српски (
http://websvn.kde.org/trunk/l10n-support/pology/l10n/sr/), како би ти подаци
били при руци при било каквим аутоматским обрадама превода̂.

Оно што је ми је проблем, и због чега пишем ово сада, пре готова посла,
јесте формат датотека трапнакрона; онај што сам до сада користио треба мало
поједноставити и поопштити. За разлику од формата Сверачунарског појмовника
где је опширност ИксМЛ-а понајмањи проблем >:), сматрам да формат
трапнакрона треба да буде максимално сажет и очигледан за једноставне уносе
(каквих ће бити највише), уз што простије додавање допунских елемената где
су потребни, како би се могао допуњавати уз што мање трења. Да изложим шта
сам издумао, па ако ко има боље решење...

Уз изостављање једног битног али ортогоналног детаља, већина уноса би могла
да изгледа некако овако:

Google: Гугл

Нпр. у досадашњем формату сам имао и тачку-зарез на крају, али заиста не
видим разлога да се у истом реду ниже више уноса, па сам рад да и њу шутнем.
За ретке подуже уносе, ако баш хоћемо да их преламамо, могло би с
уобичајеним \ на крају реда.

Слично, у ретким случајевима где неки од специјалних знакова затреба као
обичан, може се избећи са \, на пример:

Destination\: Void: Одредиште\: ништавило

Када је згодно додати још по неки облик прилагођеног назива, то би могло
следећом синтаксом (г= за генитив, оп= за описни придев):

Kopete: Копете, г=Копетеа
Fortran: фортран, оп=фортрански

Општије, зарези би раздвајали својства прилагођења, којих поред ових
граматичких, може бити и разних других. Сам формат не би дефинисао својства,
већ би зависила од примене. Могла би постојати декларација познатих
својстава, тако да рашчлањивач може да укаже на типфелере.

Зарезима би се такође раздвајало и више изворних графија или синонима:

Sergey Korolyov, Sergei Korolev: Сергеј Корољов, изв=Сергей Королёв

Овде су као изворни наведена два романизована облика, а својство изв= даје
стварни изворни.

Као у претходном примеру, мислим да је добро користити романизоване облике
као изворне, чак и ако нису стварни извор, из више разлога: прво, зато што
је управо романизовани облик онај који нам је најчешће најпречи за даље
истраживање; друго, зато што може бити више тих облика, па да се не уводи
сложенија синтакса за њихово пописивање; треће, да би се лако аутоматски
изводили чисти аски идентификатори уноса, који могу бити корисни за
аутоматске обраде (нпр. претходни унос би добио два имплицитна
идентификатора, sergeykorolyov и sergeikorolev).

Може се десити и да се исти изворни назив користи за две различите ствари.
За такве случајеве замислио сам нешто овако:

Linux, ~linuxkern: Линукс, о=језгро
Linux, ~linuxos: линукс, о=класа оперативних система

Овде је тилдом изричито задат идентификатор уноса, тако да ниједан од ова
два уноса неће добити аутоматски изведени идентификатор linux. Својство о=
је скраћено од опис, што је вероватно корисно у оваквим случајевима.

На крају, неће увек бити довољно навести један прилагођени израз (одн. израз
и скуп својстава), већ ће затребати више алтернатива:

Isaac Newton: Исак Њутн, о=ренесансни научник
@сист Ајзак Њутон

@сист је скр од ‘системска транскрипција’, другим речима овде алтернатива
даје како би изворно име било прилагођено да се ради о савременом научнику.
Алтернативе заправо треба да покривају сва својства, и спадају
хијерархијски. На пример, ако бих затражио својство о= за алтернативу @сист
уноса isaacnewton, добио бих „ренесансни научник“ из нулте алтерантиве;
евентуално поновљено о= под @сист потиснуло би оно нулто:

Isaac Newton: Исак Њутн, о=ренесансни научник
@сист Ајзак Њутон, о=бла бла

Запис алтернатива ми је најпроблематичнији, не могу да смислим ниједан који
није некако ружњикав. Као горе, за сада сам на томе да иду у редовима за
нултом алтернативом, увучено (произвољно, али једнообразно у истој датотеци,
што би рашчлањивач захтевао), и са ознаком алтернативе која почиње са @.
Строго говорећи, @ није потребно, али би ми без њега ознака била исувише
неугледна. Један важан захтев је да додавање или одузимање једне алтернативе
не дотиче редове других, ради доброг разликовања при управљању верзијама.

Толико.

signature.asc

Milos Popovic

unread,
Aug 11, 2009, 7:28:05 AM8/11/09
to so...@googlegroups.com
Časlave, ideja je genijalna, kao i uvek.

У уто, 21. 07 2009. у 10:47 +0200, Часлав Илић пише:

Часлав Илић

unread,
Aug 11, 2009, 10:31:13 AM8/11/09
to so...@googlegroups.com
> [: Milos Popovic :]

> Časlave, ideja je genijalna, kao i uvek.

Уф, уф... Како било, довршавам га по изнесеном плану. Готово је и истицање
синтаксе за Кејт (снимак у прилогу). Требало би најскорије да предам све то
под Пологију.

Снимак показује и ортогонални детаљ који сам изоставио из претходне приче:
поред номинатива, макропроширењима дефинишу се и остали падежи и потребни/
могући придевски облици (систем у целости зовем „дериватор синтагми“).

synder-01.png
signature.asc

Filip Miletić

unread,
Aug 11, 2009, 10:35:29 AM8/11/09
to so...@googlegroups.com
2009/8/11 Часлав Илић <casla...@gmx.net>:

> Снимак показује и ортогонални детаљ који сам изоставио из претходне приче:

Примедбица — „фреецелл“ је „фрисел“, а „фреецив“ је „фрицив“.

ф

Часлав Илић

unread,
Aug 11, 2009, 11:22:25 AM8/11/09
to so...@googlegroups.com
> [: Filip Miletić :]

> Примедбица — „фреецелл“ је „фрисел“, а „фреецив“ је „фрицив“.

Нисам схватио :) Помислих прво да сам случајно изврнуо преводе, нисам. Да не
мислиш нешто око величине почетног слова?

signature.asc

Часлав Илић

unread,
Nov 11, 2009, 11:39:07 AM11/11/09
to so...@googlegroups.com
> [: Часлав Илић :]
> [...] довршавам га по изнесеном плану. [...] Требало би најскорије да

> предам све то под Пологију.

Добро, мало је потрајало док сам испеглао све детаље, пренео постојећу
грађу, документовао неопходно.

О трапнакрону у Пологији:

http://nedohodnik.dyndns.org/pology/l10n/sr/doc/trapnakron.html

О подложном формату дериватора синтагми:

http://nedohodnik.dyndns.org/pology/doc/html/pology.misc.synder-module.html

signature.asc
Reply all
Reply to author
Forward
0 new messages