Fwd: Algoritm de traducere a Terminologia Histologica în limba română - temă licență

40 views
Skip to first unread message

Loredana Cirstea

unread,
Sep 30, 2014, 3:12:02 PM9/30/14
to public-...@googlegroups.com

---------- Forwarded message ----------
From: Loredana Cirstea <loredana...@gmail.com>
Date: 2013-12-15 21:18 GMT+02:00
Subject: Algoritm de traducere a Terminologia Histologica în limba română - temă licență
To: luminit...@yahoo.com, Christian Tzurcanu <christian...@gmail.com>


Către Șeful Catedrei de Informatică Medicală, Conf.Dr. Luminița Iliuță,


Sunt Loredana Cîrstea, student anul VI în cadrul U.M.F. "Carol Davila", Medicină Generală și vă scriu în legatură cu tema lucrării de licență, pe care mi-am ales-o: “Algoritm de traducere a Terminologia Histologica în limba română și utilitare de mentenanță pentru un vocabular controlat.”

Din cauza faptului că site-ul oficial al U.M.F. “Carol Davila” ( http://www.umfcaroldavila.ro/ ) nu conține detalii despre membrii și reprezentanții disciplinei “Marketing, Tehnologie și Informatică Medicală”, adresa dumneavoastră o am de la Șeful Disciplinei menționate anterior, Conf. Dr. Purcarea Victor Lorin. Din păcate, nu mi-a fost dată funcția dumneavoastră exactă și atunci vă rog să mă corectați, dacă m-am adresat incorect.

Subiectul ales poate să fie plasat în cadrul a două discipline: Biologie Celulară și Informatică Medicală. Dat fiind faptul că reprezentanții disciplinei “Medicină Celulară și Moleculară. Medicina Dezvoltării Umane” se consideră puțin depășiți de subiectul meu, m-am hotărât să mă adresez disciplinei “Marketing, Tehnologie și Informatică Medicală”. Voi atașa detaliile legate de subiectul lucrării la sfârșitul email-ului, precum și metodologia pe care o voi folosi.

Menționez că după terminarea facultății voi lucra în domeniul cercetării medicale și informatice. Am început lucrul la prezentul prezentul proiect de 1-2 ani de zile, în cadrul Sapiens Mapping Project ( http://sliced.ro/docs/about.php ). Din 23 Octombrie sunt în discuții cu membrii și reprezentanții disciplinei “Medicină Celulară și Moleculară. Medicina Dezvoltării Umane”, pentru a-mi coordona lucrarea în cadrul programului de licență, fără un rezultat pozitiv.

Pentru că această lucrare face parte și din Sapiens Mapping Project - datele oficiale folosite aparțin proiectului -, toate colaborările vor respecta principiile generale ale acestui proiect ( http://sliced.ro/docs/collab.php ). Pe scurt, regulile de transparență impun comunicarea scrisă, preferabil prin email, folosind limba engleză. De aceea, voi traduce și această conversație în limba engleză și îl voi adăuga pe Leader-ul de Proiect al SMP la destinatar.

Metodologia și principiile lucrării de licență le puteți vedea aici:

https://docs.google.com/document/d/19fpYMNVjo0FqeIcAv18xMAYt22mOjH898keFqfcG8fY/edit

Metodologia, pe scurt:

  1. voi compila o traducere a termenilor latini din TH din traducerea exactă a cuvintelor (latină->română), utilizând dicționare deja alcătuite și referențiabile online.

  2. voi corecta manual traducerea de la punctul 1., pentru greșeli de formă a cuvintelor

  3. voi compila traducerea în limba română a termenilor din TH, așa cum sunt ei folosiți în acest moment; aici ar fi fost nevoie de ajutor histologic specializat, dar m-am hotarât pentru alcătuirea unei baze de date cu referințe bibliografice ale fiecărui termen din Terminologia Histologica, așa cum apare el în publicațiile românești importante, specifice centrelor universitare medicale mari.

  4. voi alcătui o variantă proprie de traducere, care să respecte principiile computabilității, bazată pe traducerea avizată de la punctul 3 și instrumentele lingvistice existente; cele mai importante principii sunt : eliminarea, pe cât posibil, a cuvintelor de legătură, crearea unui raport de 1:1 între cuvintele latine și cele românești, dintr-un termen, folosirea aceluiași sinonim (cel mai potrivit) în toata terminologia, apropierea, pe cât posibil, de traducerea directă din limba latină.

  5. voi compara toate aceste variante de traducere (translation statistics), demonstrând că propunerea mea va avea maximul de computabilitate; voi demonstra valoarea existenței unei asemea traduceri, în contextul creării unei surse online oficiale unice a termenilor științifici, care poate oferi referință fiecărui termen, conectându-l cu traducerile sale în alte limbi, conferind reproductibilitate calitativă unui text științific. Lucrările științifice s-ar putea actualiza în mod automat, din punct de vedere al terminologiei, în cazul schimbării acesteia.

  6. varianta propusă de mine va fi făcută publică și deschisă către peer-review, pentru îmbunătățire și corectare.

Limbajul folosit în prelucrarea datelor: R language. Voi face o librarie în R cu termenii din Terminologia Histologica în latină, engleză și traducerile în limba română, pentru mentenanță si update colaborativ. API-ul va fi public.

Aștept răspunsul dumneavoastră în ceea ce privește prezenta propunere de a-mi coordona lucrarea de licență pe acest subiect. In caz contrar, vă rog să mă ghidați spre datele de contact ale membrilor catedrei de Informatică Medicală, în vederea trimiterii aceleiași propuneri.


Cu stimă,

Loredana Cîrstea,

student anul VI, Medicină Generală, U.M.F. “Carol Davila”

Manager de Proiect pentru Sapiens Mapping Project.



English translation:



To the Head of the “Medical Informatics” Department, Conf.Dr. Luminița Iliuță,


This is Loredana Cirstea, 6th year student at U.M.F. “Carol Davila”, General Medicine and I am writing in regard to my graduation thesis: “Algorithm of translation in the Romanian language for the Terminologia Histologica and APIs for a controlled vocabulary”.

Due to the fact that the official site for U.M.F. “Carol Davila” ( http://www.umfcaroldavila.ro/ ) does not have details about the members and reprezentatives of the “Marketing, Technology and Medical Informatics” Discipline, I have your email address from the Head of the aforementioned Discipline, Conf. Dr. Purcarea Victor Lorin. Unfortunately, your exact official position has not been given to me, therefore please correct me if I have addressed you incorrectly.

My subject can be part of two disciplines: Cellular Biology and Medical Informatics. Due to the fact that the reprezentatives of the “Cellular and Molecular Medicine. Human Development Medicine” Discipline consider that they do not have the necessary expertise for my subject, I decided to also address the “Marketing, Technology and Medical Informatics” Discipline. I will attach details regarding the thesis subject at the end of the email, also giving details about the methodology I am using.

I want to mention that after graduation I plan on working in the medical and computer programming field of research. I have started working on this project for 1-2 years, inside the Sapiens Mapping Project ( http://sliced.ro/docs/about.php ). From the 23rd of October I am in discussions with the “Cellular and Molecular Medicine. Human Development Medicine” Discipline members and reprezentatives, for finding a coordinator for my thesis, without positive results.

Because this project is part of the Sapiens Mapping Project, all collaboration will respect the general principles of the SMP ( http://sliced.ro/docs/collab.php ). In short, the transparency rules impose written conversations, preferably on email, in the English language. This is why I will translate this conversation in English and I will add the Project Leader of the SMP to the receiver’s list.

My graduation thesis methodology and principles can be found here :

https://docs.google.com/document/d/19fpYMNVjo0FqeIcAv18xMAYt22mOjH898keFqfcG8fY/edit

The methodology , in short :

  1. I will compile a translation of the Latin terms from TH using the exact translation of the words (Latin -> Romanian ), using online dictionaries and linguistics references already existing.

  2. I will manually correct translation from point 1. , for mistakes on the form of words

  3. I compile the Romanian translation of TH terms as they are currently used. This is where I needed histological educated help. However, I have decided on making a database with bibliographical references for every TH term, as it appears in important Romanian publications, from the big medical university centers.

  4. I will create my own translation, which will respect the computability principles, based on the approved translation from point 3 and the existing linguistic tools. The most important principles are : to eliminate as far as possible the linking words, creating a ratio of 1:1 between Romanian and Latin words from a term, using the same synonym ( the best one ) throughout the terminology, respecting the direct translation from Latin.

  5. I will compare all these variants of translation (translation statistics), showing that my proposal will have maximum computability. I will demonstrate the value of the existence of such a translation, in the context of creating a single official online source of scientific terms, which can provide reference for each term, connecting it with its translations in other languages, giving qualitative reproducibility of scientific text. The scientific papers should be able to automatically update the official terms included, in case of change of terminology.

  6. My proposed version will be made ​​public and open to peer review for improvement and correction.

Language used in data processing: R language. I will make a R library with the terms from Terminologia Histologica in Latin, English and the Romanian translations, for maintenance and collaborative update. The API will be made public.

I await your response regarding the my present proposal of coordinating my graduation thesis on this subject. If not, please guide me to the contact information for the members of the Medical Informatics Department, in order for me to sent them the same proposal.


Respectfully,

Loredana Cirstea,

6th year Medical Student at U.M.F. "Carol Davila"

Project Manager for the Sapiens Mapping Project.


Loredana Cirstea

unread,
Sep 30, 2014, 3:12:17 PM9/30/14
to public-...@googlegroups.com
---------- Forwarded message ----------
From: Loredana Cirstea <loredana...@gmail.com>
Date: 2014-01-15 2:34 GMT+02:00
Subject: Re: Algoritm de traducere a Terminologia Histologica în limba română - temă licență
To: luminit...@yahoo.com, Christian Tzurcanu <christian...@gmail.com>


Către Șeful Catedrei de Informatică Medicală, Conf.Dr. Luminița Iliuță,


Vă readuc aminte de email-ul meu anterior din 15 dec 2013. Dacă nu îmi răspundeți la acesta în termen de 48 de ore, voi considera că ați respins oferta de coordonare a lucrării mele de diplomă pe subiectul Terminologia Histologica.

De asemenea, fiindca informațiile de contact ale membrilor catedrei nu sunt făcute publice pe site-ul oficial al U.M.F. “Carol Davila”, vă readuc aminte cererea din email-ul meu anterior: “vă rog să mă ghidați spre datele de contact ale membrilor catedrei de Informatică Medicală, în vederea trimiterii aceleiași propuneri.”


Cu stimă,

Loredana Cîrstea,

student anul VI, Medicină Generală, U.M.F. “Carol Davila”

Manager de Proiect pentru Sapiens Mapping Project.


English translation:


To the Head of the “Medical Informatics” Department, Conf.Dr. Luminița Iliuță,


I am reminding you about my previous email from 15 Dec 2013. If you do not reply in the next 48 hours, I will consider my offer of coordinating my graduation thesis on the Terminologia Histologica, declined.

Also, given the fact that the contact information of the members of your department are not made public on the official site of U.M.F. “Carol Davila”, I remind you of my request from my previous email: “please guide me to the contact information for the members of the Medical Informatics Department, in order for me to sent them the same proposal.”


Respectfully,

Loredana Cirstea,

6th year Medical Student at U.M.F. "Carol Davila"

Project Manager for the Sapiens Mapping Project.




2013/12/15 Loredana Cirstea <loredana...@gmail.com>
Reply all
Reply to author
Forward
0 new messages