Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Konwersja Latex -> rtf (lub doc) - czym?

314 views
Skip to first unread message

smE

unread,
May 31, 2008, 1:29:17 PM5/31/08
to
Witajcie!

Chciałem się spytać czym można przekonwertować dokument latexa na rtf pod
Windowsem i najlepiej za darmo. Piszę pracę magisterską przy wykorzystaniu
latexa lecz moja uczelnia życzy sobie aby praca była w formacie .doc tak,
aby można ją było załadować do Plagiatu. Dzisiaj chciałem zobaczyć jak taka
konwersja będzie wyglądała, ale niestety nie mogę znaleźć rzadnego
narzędzia, które by mi to umożliwiło.

Proszę o naprowadzenie czym można przekonwerować dokument .tex na .rtf.

pozdrawiam

Wojciech Myszka

unread,
May 31, 2008, 2:05:46 PM5/31/08
to

Dnia 31-05-2008, So o godzinie 19:29 +0200, smE pisze:
[...]

> Proszę o naprowadzenie czym można przekonwerować dokument .tex
> na .rtf.

Najlepsze narzędzie to chyba tex4ht. Konwertuje albo do HTMLa (i jest
taka wersja którą dobrze Word chwyta) albo do ODF (OO skonwertuje do
DOCa).

Narzędzia konwersji do RTF (są takie) są bardzo stare i ogromnie
zawodne.

Inna rzecz jak można kupić(?) program (a generalnie stworzyć), który
potrafi obsłużyć zamknięty format binarny a nie potrafi sobie poradzić z
najprostszym formatem tekstowym. Niekompetencja informatyczna w tym
kraju jest przeogromna.

No, można jeszcze - ale to będzie złośliwe przekonwertować każdą stronę
na bitmapę, a te wpakować do doca. Formalnie będzie doc...

Mniej złośliwe to skorzystać z jakiegokolwiek skanera z jakimś
programame do OCRowania. Te zapisują jako rtf (albo i DOC).

W

smE

unread,
May 31, 2008, 3:44:56 PM5/31/08
to
Dnia Sat, 31 May 2008 20:05:46 +0200, Wojciech Myszka napisał(a):

> Dnia 31-05-2008, So o godzinie 19:29 +0200, smE pisze:
> [...]
>> Proszę o naprowadzenie czym można przekonwerować dokument .tex
>> na .rtf.
>
> Najlepsze narzędzie to chyba tex4ht. Konwertuje albo do HTMLa (i jest
> taka wersja którą dobrze Word chwyta) albo do ODF (OO skonwertuje do
> DOCa).

Konwersja do odf'a byłaby idealna :) Ściągnąłem tex4ht i niestety nie umiem
tego uruchomić... Może są jakieś prostsze narzędzia (okienkowe) które
wykorzystują ten tex4ht a są proste w obsłudze?

Jarosław Sokołowski

unread,
May 31, 2008, 4:14:54 PM5/31/08
to
Pan Wojciech Myszka napisał (najprawdopodobniej samodzielnie):

> Inna rzecz jak można kupić(?) program (a generalnie stworzyć), który
> potrafi obsłużyć zamknięty format binarny a nie potrafi sobie poradzić
> z najprostszym formatem tekstowym. Niekompetencja informatyczna w tym
> kraju jest przeogromna.

A czy rzeczywiście nie potrafi? Gdyby tak w pliku wordowym zacytować
kawałek TeXowego manuskryptu z plagiatem, to co, nie wygrepuje sobie
tam niczego? Programu do łowienia plagiatów na oczy nie widziałem, ale
ktoś mi mówił, że twórcy dopuszczaja formaty DOC i TXT na wejściu. Tyle
że panie w dziekanatach (przeogromnie niekompetentne informatycznie) nie
wiedzą co to takiego ten format TXT (pewnie coś ogromnie skomplikowanego,
skoro nikt tego nie używa), więc wymagaja DOC.

Druga sprawa, czy faktycznie radzi sobie z formatem DOC. Worda nie znam,
w życiu nie napisałem w tym wynalazku dzieła dłuższego niż kilka zdań,
a i to z obrzydzeniem wielkim. Ale zdaje się, że do dokumentu mogą być
tam dołączone fonty. Nic zatem nie stoi na przeszkodzie by pisać teksty
zakodowane w rot13 i użyć fontów z enkodinkiem również pomieszanym przez
rot13. Albo nawet zamiast rot13 użyć jakiejś losowej funkcji. Na ekranie
i w druku niczym nie będą różnić się od normalnych. Ale wtedy można będzie
teksty Kanta, Gaussa czy Feynmana (zależy z czego ktoś akurat chce się
bronić) zamieścić jako własne. Wątpię, by jakiś program był w stanie to
przeanalizować.

> No, można jeszcze - ale to będzie złośliwe przekonwertować każdą stronę
> na bitmapę, a te wpakować do doca. Formalnie będzie doc...

Jeśli program do plagiatów sam nie zamienia dokumentów na bidmapy i ich
samodzielnie nie OCR-uje, to do kitu taki program. Zatem niczego złośliwego
w takim działaniu nie widzę.

--
Jarek

Jarosław Sokołowski

unread,
May 31, 2008, 4:15:16 PM5/31/08
to
Pan Wojciech Myszka napisał (najprawdopodobniej samodzielnie):

> Inna rzecz jak można kupić(?) program (a generalnie stworzyć), który


> potrafi obsłużyć zamknięty format binarny a nie potrafi sobie poradzić
> z najprostszym formatem tekstowym. Niekompetencja informatyczna w tym
> kraju jest przeogromna.

A czy rzeczywiście nie potrafi? Gdyby tak w pliku wordowym zacytować


kawałek TeXowego manuskryptu z plagiatem, to co, nie wygrepuje sobie
tam niczego? Programu do łowienia plagiatów na oczy nie widziałem, ale
ktoś mi mówił, że twórcy dopuszczaja formaty DOC i TXT na wejściu. Tyle
że panie w dziekanatach (przeogromnie niekompetentne informatycznie) nie
wiedzą co to takiego ten format TXT (pewnie coś ogromnie skomplikowanego,
skoro nikt tego nie używa), więc wymagaja DOC.

Druga sprawa, czy faktycznie radzi sobie z formatem DOC. Worda nie znam,
w życiu nie napisałem w tym wynalazku dzieła dłuższego niż kilka zdań,
a i to z obrzydzeniem wielkim. Ale zdaje się, że do dokumentu mogą być
tam dołączone fonty. Nic zatem nie stoi na przeszkodzie by pisać teksty

zakodowane w rot13 i użyć fontów z enkodingiem również pomieszanym przez


rot13. Albo nawet zamiast rot13 użyć jakiejś losowej funkcji. Na ekranie
i w druku niczym nie będą różnić się od normalnych. Ale wtedy można będzie
teksty Kanta, Gaussa czy Feynmana (zależy z czego ktoś akurat chce się
bronić) zamieścić jako własne. Wątpię, by jakiś program był w stanie to
przeanalizować.

> No, można jeszcze - ale to będzie złośliwe przekonwertować każdą stronę


> na bitmapę, a te wpakować do doca. Formalnie będzie doc...

Jeśli program do plagiatów sam nie zamienia dokumentów na bidmapy i ich

Wojciech Myszka

unread,
Jun 1, 2008, 3:10:01 AM6/1/08
to
Dnia 31-05-2008, sob o godzinie 20:15 +0000, Pan Jarosław Sokołowski
napisał:
[...]

> Nic zatem nie stoi na przeszkodzie by pisać teksty
> zakodowane w rot13 i użyć fontów z enkodingiem również pomieszanym
> przez
> rot13. Albo nawet zamiast rot13 użyć jakiejś losowej funkcji. Na
> ekranie
> i w druku niczym nie będą różnić się od normalnych.

No cóż... Ale taki co to potrafi zrobić nie potrzebuje nic ściągać.
I zasługuje na magisterium. Ciekawe jak na ten Pomysł zareaguje
nasze lokalne podziemie sprzedające prace dyplomowe... Obawiam się,
że wariant nielosowy całkiem szybko się spali -- kolejne prace zaczną
być do siebie podobne...

Wojtek
--
---(___C'>

Wojciech Myszka

unread,
Jun 1, 2008, 3:04:21 AM6/1/08
to
Dnia 31-05-2008, sob o godzinie 21:44 +0200, smE napisał(a):

> Konwersja do odf'a byłaby idealna :) Ściągnąłem tex4ht i niestety nie umiem
> tego uruchomić...

Chyba nie Ty jeden, bo, na przykład, w MikTeXu nigdy to nie działało
dobrze. W TeXLive działa bez problemu - choć chyba też nie jest
kompletne.

> Może są jakieś prostsze narzędzia (okienkowe) które
> wykorzystują ten tex4ht a są proste w obsłudze?

Takie rzeczy to "tylko w ERZe" ja tam nie wiem.

Ale znalazłem Ci coś takiego: http://latex2rtf.sourceforge.net/
Też nie używałem, więc nie wiem. Zwracam tylko uwage, że taki
RTF nie zna pojęcia listy. Każda zatem konwersja generuje
środowisko wyglądem przypominające listę (przyanajmniej tak było
gdy ja z jakichś takich konwerterów korzystałem).

W
--
---(___C'>

Jarosław Sokołowski

unread,
Jun 1, 2008, 8:16:24 AM6/1/08
to
Pan Wojciech Myszka napisał:

>> Nic zatem nie stoi na przeszkodzie by pisać teksty zakodowane w rot13
>> i użyć fontów z enkodingiem również pomieszanym przez rot13. Albo nawet
>> zamiast rot13 użyć jakiejś losowej funkcji. Na ekranie i w druku niczym
>> nie będą różnić się od normalnych.
>
> No cóż... Ale taki co to potrafi zrobić nie potrzebuje nic ściągać.
> I zasługuje na magisterium. Ciekawe jak na ten Pomysł zareaguje
> nasze lokalne podziemie sprzedające prace dyplomowe...

Ja bym wolał, aby to nie podziemie reagowało, a kto inny. Dobrze by też
było, aby zareagowano w sposób pozytywny. Owszem, można również próbować
oskarżać mnie o współudział w przestępstwie pogwałcenia praw autorskich
i poświadczenia nieprawdy (bo na mącenie błogiego spokoju i przerwanie
miłego stanu nieświadomości paragrafu chyba nie ma), ale to niewiele da.

Natomiast gdyby skutkiem Pomysłu było wprowadzenie wymagania, aby do każdej
składanej pracy wykonanej w technice dowolnej (może być ręcznie malowany
jedwab), dołączony był *plik tekstowy[1]* o *treści* zgodnej z oryginałem,
to bym uznał, że Pomysł się nie zmarnował.

> Obawiam się, że wariant nielosowy całkiem szybko się spali -- kolejne
> prace zaczną być do siebie podobne...

Pomyślałem o tym jesczsze raz. Zamiast mieszać istniejący zestaw znaków
łacińskich, lepiej umieścić w tym samym pliku TTF jego drugą przetasowaną
losowo kopię do składania niewygodnych fragmentów. Wtedy dokument będzie
przy edycji zachowywał się całkiem normalnie -- będzie można do niego
dopisywać dalszy tekst i poprawiać literówki.

Taki scrambler do fontów i tekstów jestem w stanie napisać w jeden weekend
(nie ten, jest zbyt ładna pogoda). Użycie scramblera ściągniętego z sieci
nie powinno przekraczać umiejętności gimnazjalisty. Czyli chyba liczy się
tylko Pomysł, a nie jego wykorzystanie. A skoro tak, to gotów jestem przyjąć
od jakiejś uczelni magisterium honorisc causa za zasługi na polu. Nie
wzgardzę też zaproszeniem na gościnne wykłady (ze stawką 4096 zł za godzinę).
Albo stanowiskiem Generalnego Inspektora d/s Plagiatów.

Jarek

--------
[1] Nawet MS Word ma w menu coś takiego jak "zapisz jako -> plik tekstowy".

--
Stirlitz zamyślił się. Spodobało mu się. Stirlitz zamyślił się jeszcze raz.

usene...@nospam.gazeta.pl

unread,
Jun 1, 2008, 9:12:15 AM6/1/08
to
Wojciech Myszka <mys...@norka.eu.org> napisał(a):

> Ale znalaz=B3em Ci co=B6 takiego: http://latex2rtf.sourceforge.net/
> Te=BF nie u=BFywa=B3em, wi=EAc nie wiem. Zwracam tylko uwage, =BFe taki=20
> RTF nie zna poj=EAcia listy. Ka=BFda zatem konwersja generuje=20
> =B6rodowisko wygl=B1dem przypominaj=B1ce list=EA (przyanajmniej tak by=B3=
> o
> gdy ja z jakich=B6 takich konwerter=F3w korzysta=B3em).
>

Super, wielkie dzięki za naprowadzenie! Wcześniej odwiedziłem stronę tego
projektu, ale nie zauważyłem, że jest tam wersja okienkowa.

Program działa przyzwoicie, wprawdzie nie obsługuje pakietów: polski,
setspace, itd. ale generowany plik rtf wygląda znośnie. Spis treści mogę sobie
sam dopisać :)

Co do programu Plagiat to rzeczywiście są pewne hacki jak np. podmiana
niektórych liter z alfabetu łacińskiego na cyrylicę, dzięki czemu program nie
rozpoznaje słowa a co za tym idzie - nie wykazuje plagiatu. Podejrzewam też,
że dziala to na zasadzie: pani w dziekanacie otwiera plik, ctrl+A, ctrl+C,
ctrl+V w okienko programu, program mieli i wyskakuje wynik zbieżności z innymi
pracami w bazie.
Mam tylko nadzieję, że w miejscach cytatów (tam gdzie używam cudzysłowu) nie
będzie problemu - cudzysłów otwieram poprzez 2 przecinki, a zamykam tym
znakiem nad apostrofem. Po konwersji do rtf znaki są zachowane, co nie wygląda
dobrze, tzn. na początku są 2 przecinki a na końcu takie dziwne coś
przypominające cudzysłów zamykający.

pozdrawiam

--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/

t.przechlewski

unread,
Jun 2, 2008, 1:57:45 PM6/2/08
to

Jarosław Sokołowski pisze:

> Pan Wojciech Myszka napisał (najprawdopodobniej samodzielnie):
>
>> Inna rzecz jak można kupić(?) program (a generalnie stworzyć), który
>> potrafi obsłużyć zamknięty format binarny a nie potrafi sobie poradzić
>> z najprostszym formatem tekstowym. Niekompetencja informatyczna w tym
>> kraju jest przeogromna.
>
> A czy rzeczywiście nie potrafi? Gdyby tak w pliku wordowym zacytować
> kawałek TeXowego manuskryptu z plagiatem, to co, nie wygrepuje sobie
> tam niczego? Programu do łowienia plagiatów na oczy nie widziałem, ale
> ktoś mi mówił, że twórcy dopuszczaja formaty DOC i TXT na wejściu. Tyle
> że panie w dziekanatach (przeogromnie niekompetentne informatycznie) nie
> wiedzą co to takiego ten format TXT (pewnie coś ogromnie skomplikowanego,
> skoro nikt tego nie używa), więc wymagaja DOC.
>
To raczej nie są panie z dziekanatu:
Na Uniw. Gdańskim wygląda to tak, [więcej tutaj
http://gnu.univ.gda.pl/~tomasz/z/Sem/format-det.html]:

Wymagania dotyczące wersji elektronicznej są uregulowane następującymi
zarządzeniami rektora UG: nr 20/R/06 w sprawie obowiązku przekazywania
wersji elektronicznej egzemplarza pracy dyplomowej | nr 16/R/06 w
sprawie obowiązku przekazywania wersji elektronicznej egzemplarza pracy
dyplomowej .

... praca dyplomowa w formie elektronicznej przekazywana jest na płycie
CD/DVD wraz z drukowaną wersją pracy do właściwego dziekanatu, nie
później niż na 14 dni przed wyznaczonym terminem obrony. Na płycie musi
być: praca w formatach PDF i TXT oraz opis pracy w postaci pliku
wygenerowanego z formularza dostępnego tutaj (czyli razem trzy pliki)
...
że zarządzenie stanowi dalej iż: Pracownik dziekanatu przyjmujący
pracę dyplomową zobowiązany jest do sprawdzenia, czy opiekun/promotor
przejrzał pod względem zgodności pliki w formacie PDF oraz TXT z
drukowaną wersją pracy poprzez porównanie losowo wybranych stron pracy w
wersji elektronicznej z wersją drukowaną

he, a jak porównać plik TXT i PDF na okoliczność żeby były jednakowe?

reasumując wchodzenie państwowych [w tym jak słyszałem niby to
renomowanych typu UJ] uczelni w dziwny system zwany
plagiat.pl uważam za dowód kompletnego upadku ww.

plus dla UG że nie chce DOC-a tylko PDF a TXT pewnie na potrzeby
ww. plagiat.pl

--tp

Jarosław Sokołowski

unread,
Jun 2, 2008, 7:07:13 PM6/2/08
to
Pan t.przechlewski napisał:

>> Programu do łowienia plagiatów na oczy nie widziałem, ale ktoś mi
>> mówił, że twórcy dopuszczaja formaty DOC i TXT na wejściu. Tyle że
>> panie w dziekanatach (przeogromnie niekompetentne informatycznie)
>> nie wiedzą co to takiego ten format TXT (pewnie coś ogromnie
>> skomplikowanego, skoro nikt tego nie używa), więc wymagaja DOC.
>
> To raczej nie są panie z dziekanatu:
> Na Uniw. Gdańskim wygląda to tak, [więcej tutaj
> http://gnu.univ.gda.pl/~tomasz/z/Sem/format-det.html]:

Ja to znam wyłącznie z relacji córki -- na jej uczelni badają nie tylko
magisterskie, ale i pomniejsze prace, więc doświadczenie ma wieloletnie.
Tam właśnie panie z dziekanatu informują (może rektor też formalnie coś
zarządził, ale kto by takie rozporządzenia czytał), że ma być DOC. Nie
RTF, nie TXT, nie co innego, tylko DOC. A DOC robi się Microsoft Wordem,
ma się rozumieć.

[...wyciąg z zarządzeń władz...]

> he, a jak porównać plik TXT i PDF na okoliczność żeby były jednakowe?
>
> reasumując wchodzenie państwowych [w tym jak słyszałem niby to
> renomowanych typu UJ] uczelni w dziwny system zwany plagiat.pl uważam
> za dowód kompletnego upadku ww.
>
> plus dla UG że nie chce DOC-a tylko PDF a TXT pewnie na potrzeby
> ww. plagiat.pl

Co do plagiat.pl, to się zgadzam, że to skandal i jakiś grubszy przekręt,
oszustwo, a może nawet prokomizm płatniczy. Poguglałem sobie trochę w tym
kierunku, włos mi się głowie zjeżył od tego co przeczytałem. Jak można
wyprodukować takie dziadostwo? Jak można przyjąć tak kretyńskie założenia
do orzekania czy coś jest czy nie jest plagiatem?! I jak można brać tak
duże pieniądze (w ogóle jakiekolwiek) za podobne "analizy"! Więcej nie
mam siły pisać na ten temat, jak ktoś ciekaw, nich sam sobie gugla.

Natomiast co do zaleceń Magnificencji z Gdańska, w pełni się zgadzam
i popieram. Zarządzenie w stu procentach zgodne jest z tym, co napisałem
wcześniej. Format PDF do biblioteki, aby nie kolekcjonowac niepotrzebnie
makulatury, niech zostanie w takiej formie, jaką nadał autor pracy.
A format tekstowy do celów pozostałych. Niekoniecznie do analizy plagiatów.
Może też być do jakiegoś indeksowania.

Zdecydowana większość prac magisterskich (dyplomowych, licencjackich etc.)
w niczym nie ucierpi po zapisaniu jako plik TXT. A jeśli ucierpi, to
dlatego, że autor nie potrafił oddzielić formy od treści, a tej umiejętności
należy wymagać od absolwentów. Tak, uważam że da się porównać TXT i PDF na
okoliczność jednakowości.

Nieliczne dzieła (matematyka, chemia) po zapisaniu w TXT mogą stać się
niezrozumiałe. Ale do analizy plagiatologicznej (jak już ktoś musi),
taki zapis wystarczy. A jeśli trzeba czegoś więcej? No to przy odpowiedzi
skorzystam z tego, że jesteśmy na Właściwej Grupie: należy pisać w TeXu.

Jarek

--
Wiadomość sprawdzona pod względem oryginalności.

Michal Jankowski

unread,
Jun 3, 2008, 4:29:29 AM6/3/08
to
Jarosław Sokołowski <ja...@lasek.waw.pl> writes:

> Tam właśnie panie z dziekanatu informują (może rektor też formalnie coś
> zarządził, ale kto by takie rozporządzenia czytał), że ma być DOC. Nie
> RTF, nie TXT, nie co innego, tylko DOC. A DOC robi się Microsoft Wordem,
> ma się rozumieć.

rename praca.tex praca.txt
open praca.txt
save praca.doc

8-)

MJ

Jarosław Sokołowski

unread,
Jun 3, 2008, 9:41:39 AM6/3/08
to
Pan Michal Jankowski napisał:

>> Tam właśnie panie z dziekanatu informują (może rektor też formalnie
>> coś zarządził, ale kto by takie rozporządzenia czytał), że ma być DOC.
>> Nie RTF, nie TXT, nie co innego, tylko DOC. A DOC robi się Microsoft
>> Wordem, ma się rozumieć.
>
> rename praca.tex praca.txt
> open praca.txt
> save praca.doc

One, te panie, zaglądają do środka. A jak zajrzą do tak przygotowanego
pliku praca.doc, to będą krzyczeć, że to niemożliwe aby tak wyglądała
praca z filozofii. Czyli cały czas problem w paniach -- z technicznego
punktu widzenia można poprzestać na samym "rename", problemów nie będzie.
Chyba że takie, że program uzna preambułę za dłuższy fragment zerżnięty
z innej pracy (to bardzo prawdopodobny scenariusz). Dlatego lepiej jest,
gdy o sprawach uczelni decyduje rektor, a nie panie z dziekanatu.

--
Jarek

0 new messages