kyrillisch

4 views
Skip to first unread message

Horst Leps

unread,
Jul 22, 2022, 3:55:18 PM7/22/22
to

Ich möchte in einen deutschen Text diesen kyrillischen Text einfügen.

Указом Президента України
від 24 березня 2021 року № 117/2021

Es ist die Überschrift eines Dekrets des ukrainischen Präsidenten.

Wenn ich diesen Text einfach so in den 1.tex reinschreibe, wird er
ignoriert.

Was tun?

Danke, Horst

--

Ulrike Fischer

unread,
Jul 23, 2022, 4:50:27 AM7/23/22
to
In die log-Datei schauen, welche Meldungen es gibt.

Abgesehen davon, könntest du schon etwas weniger sparsam mit
Informationen sein. Es kommt schon darauf an, was in deiner
TeX-Datei steht, und welche Engine du für die Kompilation benutzt.




--
Ulrike Fischer
http://www.troubleshooting-tex.de/

Horst Leps

unread,
Jul 24, 2022, 12:07:52 PM7/24/22
to
Am 23.07.2022 um 10:50 schrieb Ulrike Fischer:

Danke für die Rückmeldung!

> Abgesehen davon, könntest du schon etwas weniger sparsam mit
> Informationen sein. Es kommt schon darauf an, was in deiner
> TeX-Datei steht, und welche Engine du für die Kompilation benutzt.

Weil ich den Fehler nicht reproduzieren konnte, habe ich weiter
gesucht. Dabei bin ich auf nach einiger Zeit auf russianb.pdf gestoßen,
https://ctan.math.illinois.edu/macros/latex/contrib/babel-contrib/russian/russianb.pdf,
und habe den Header meiner Datei so ergänzt, wie dort auf S.3 dort
angesagt.

Und nun bekomme ich mitten im deutschen Text ein paar russische
Wörter.

Auf Deiner Seite habe ich gesehen, dass Du in Sachen LaTeX sehr
engagiert bist, daher kurz meine LaTeX-Umgebung:

Aquamacs mit Orgmode zum Schreiben, das jeweils aktuelle TexLive von
Homebrew auf dem Mac.

Vorteil von Orgmode: Derselbe Quelltext ergibt latex-pdf und html, man
muss nicht nachfummeln. Möglicher Nachteil: Sieht nicht so aus, als ob
alle Möglichkeiten von LaTeX und html damit ausgeschöpft werden können.

http://blog.leps.de/wp-content/uploads/2022/07/GesamtEntwurf9.html#orgb807cc9

Grüße,

Horst

--

Tobias Schlemmer

unread,
Jul 25, 2022, 8:49:05 AM7/25/22
to
Hallo Horst,

Es gibt mehrere Möglichkeiten, dem zu begegnen:
1. LuaTeX oder XeLaTeX. Hier müssen auch die kyrillischen Zeichensätze
aktiviert werden. Hilfe findest Du auf der Console mit `texdoc fontspec`.
2. Babel Laden. Dazu musst Du in der Präambel mit
`\usepackage[ukrainian]{babel}` das Paket mit ukrainischer Unterstützung
laden. Außerdem muss ein kyrillischer Zeichensatz geladen werden. Für
Russisch ist das üblicherweise T2A, der wird vermutlich auch für
Ukrainisch gehen. Sieh Dir die Doku zu babel und fontenc mal an.
Inputencoding sollte auf UTF-8 stehen. Danach sollte babel automatisch
den Zeichensatz wählen.

Generell gilt: Wenn Du was in einer ausländischen Sprache schreibst,
braucht eine moderne Textverarbeitung wie (La)TeX die Information,
welche Sprache das sein soll (Das gilt auch für Word und LibreOffice),
um diverse Regeln korrekt umzudefinieren. Bei LaTeX sind dafür babel
oder wahlweise polyglossia zuständig. Babel ist älter, zwischenzeitlich
war Polyglossia moderner, dann hat Babel nachgezogen und ich den
Überblick verloren. Für Deine Zwecke reicht die Unterstützung dicke aus.
Im Übrgen ist das Ukrainische auch in der HTML-Datei falsch (also gar
nicht) sprachgetaggt. Siehe hierzu auch
https://www.w3.org/International/questions/qa-html-language-declarations.de

Um Dir konkrete Hinweise geben zu können, bräuchten wir ein (nahezu)
minimales Beispiel, das den Sachverhalt schildert, also eine .org-Datei,
die sich einfach in PDF übersetzen lässt und die daraus erzeugte
LaTeX-Datei. Zwei Zeilen Text (eine Ukrainisch und eine Deutsch) sollten
reichen.

Wenn ich mir den Text ansehe, kannst Du auch mal einen Blick auf die
vielen HTML-Generatoren für LaTeX werfen. Ich fand tex4ht sehr
vielversprechend, da TeX benutzt.

Viele Grüße
Tobias

Am 24.07.22 um 18:07 schrieb Horst Leps:

Horst Leps

unread,
Jul 25, 2022, 3:20:35 PM7/25/22
to
Am 25.07.2022 um 14:49 schrieb Tobias Schlemmer:

Hallo Tobias,

> Um Dir konkrete Hinweise geben zu können, bräuchten wir ein (nahezu)
> minimales Beispiel, das den Sachverhalt schildert, also eine
> .org-Datei, die sich einfach in PDF übersetzen lässt und die daraus
> erzeugte LaTeX-Datei. Zwei Zeilen Text (eine Ukrainisch und eine
> Deutsch) sollten reichen.

Der orgmode-Text:

------------------------------------

#+TITLE: Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks
#
#+DATE: \today
#+AUTHOR: HL
#+HTML_DOCTYPE: html4-transitional

#+LATEX_CLASS_OPTIONS: [a4paper,12pt]

#+LATEX_HEADER: \usepackage[T1,T2A]{fontenc}
#+LATEX_HEADER: \usepackage[utf8]{inputenc}
#+LATEX_HEADER: \usepackage{lmodern}
#+LATEX_HEADER: \usepackage[ukrainian,russian,germanb]{babel}

#+OPTIONS: toc:nil

Präsident der Ukraine: Anordnung vom 24. März 2021 Nr. 117/2021

Указом Президента України від 24 березня 2021 року № 117/2021

---------------------------------

ergibt:

---------------------------------

% Created 2022-07-25 Mon 21:07
% Intended LaTeX compiler: pdflatex
\documentclass[a4paper,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{graphicx}
\usepackage{grffile}
\usepackage{longtable}
\usepackage{wrapfig}
\usepackage{rotating}
\usepackage[normalem]{ulem}
\usepackage{amsmath}
\usepackage{textcomp}
\usepackage{amssymb}
\usepackage{capt-of}
\usepackage{hyperref}
\usepackage[germanb]{babel}
\usepackage[T1,T2A]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{lmodern}
\usepackage[ukrainian,russian,germanb]{babel}
\author{HL}
\date{\today}
\title{Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks}
\hypersetup{
pdfauthor={HL},
pdftitle={Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks},
pdfkeywords={},
pdfsubject={},
pdfcreator={Emacs 25.3.50.1 (Org mode 9.3.6)},
pdflang={Germanb}}
\begin{document}

\maketitle
Präsident der Ukraine: Anordnung vom 24. März 2021 Nr. 117/2021



Указом Президента України від 24 березня 2021 року № 117/2021
\end{document}

------------------

Der html-text ist riesig lang, viel Java und sonst was. Aber er
funktioniert auch. Kann gut sein, dass ich damit den Bedürfnissen eines
Texters, der den Unterschied von Russisch und Ukrainisch auch noch genau
drauf haben will, nicht entspreche, aber mir kommt es nur auf etwas
Kyrillisch-Deko im Text an.




An tex4ht habe ich alte Erinnerungen: Ich habe anno damals dem Eitan
geholfen, die deutschen Umlaute zu implementieren, dann ist er ja viel
zu schnell und zu früh gestorben. Ich komme da heute mit den
Kommandozeilen-Befehlen nicht mehr klar, ist zu lange her.

Grüße,

Horst

--

Ulrike Fischer

unread,
Jul 25, 2022, 3:43:53 PM7/25/22
to
Am Mon, 25 Jul 2022 21:20:31 +0200 schrieb Horst Leps:

> % Created 2022-07-25 Mon 21:07
> % Intended LaTeX compiler: pdflatex
> \usepackage[germanb]{babel}
> \usepackage[ukrainian,russian,germanb]{babel}

babel wird zweimal geladen, das sollte einen Fehler geben.


> \usepackage[utf8]{inputenc}
> \usepackage{grffile}

beides wird heutzutage nicht mehr benötigt.

Juergen Fenn

unread,
Jul 26, 2022, 4:14:00 AM7/26/22
to
Am 25.07.22 um 21:20 Uhr schrieb Horst Leps:
>
> An tex4ht habe ich alte Erinnerungen: Ich habe anno damals dem Eitan
> geholfen, die deutschen Umlaute zu implementieren, dann ist er ja viel
> zu schnell und zu früh gestorben. Ich komme da heute mit den
> Kommandozeilen-Befehlen nicht mehr klar, ist zu lange her.


Da du unter macOS arbeitest: <http://www.simpletex4ht.free.fr/> kennst du?

Viele Grüße,
Jürgen.

Horst Leps

unread,
Jul 26, 2022, 4:47:29 AM7/26/22
to
Am 25.07.2022 um 21:43 schrieb Ulrike Fischer:

> Am Mon, 25 Jul 2022 21:20:31 +0200 schrieb Horst Leps:

> babel wird zweimal geladen, das sollte einen Fehler geben.

die kürzeste funktionierende Fassung, auch für html:

----orgmode

#+TITLE: Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks
#
#+DATE: \today
#+AUTHOR: HL
#+HTML_DOCTYPE: html4-transitional

#+LATEX_CLASS_OPTIONS: [a4paper,12pt]

#+LATEX_HEADER: \usepackage[T2A]{fontenc}

#+LATEX_HEADER: \usepackage{babel}

#+OPTIONS: toc:nil


Präsident der Ukraine: Anordnung vom 24. März 2021 Nr. 117/2021

----erzeugt lated

\documentclass[a4paper,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{graphicx}
\usepackage{grffile}
\usepackage{longtable}
\usepackage{wrapfig}
\usepackage{rotating}
\usepackage[normalem]{ulem}
\usepackage{amsmath}
\usepackage{textcomp}
\usepackage{amssymb}
\usepackage{capt-of}
\usepackage{hyperref}
\usepackage[germanb]{babel}
\usepackage[T2A]{fontenc}
\usepackage{babel}
\author{HL}
\date{\today}
\title{Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks}
\hypersetup{
pdfauthor={HL},
pdftitle={Zu einer aktuellen Unterrichtseinheit „Krieg und Frieden“ mit Elementen eines Lehrstücks},
pdfkeywords={},
pdfsubject={},
pdfcreator={Emacs 25.3.50.1 (Org mode 9.3.6)},
pdflang={Germanb}}
\begin{document}

\maketitle
Präsident der Ukraine: Anordnung vom 24. März 2021 Nr. 117/2021



Указом Президента України від 24 березня 2021 року № 117/2021
\end{document}



Указом Президента України від 24 березня 2021 року № 117/2021


----

Wesentlich ist das T2A. Was sonst überflüssig ist, könnte man vermutlich
mit irgendeiner Schreibweise im orgmode-Text rauskürzen, ich weiß es nicht.

Hier geht es ja nur darum, in ein Material ein Kyrillisch-Deko
unterzubringen.

--

Horst Leps

unread,
Jul 26, 2022, 4:50:04 AM7/26/22
to
Ja, ausprobiert, schönes Teil.

Aber bei orgmode habe ich LaTeX und html gleichzeitig, manche
LaTeX-Tücken werden mir obendrein abgenommen.


--

Horst Leps

unread,
Jul 26, 2022, 10:13:02 AM7/26/22
to
Am 26.07.2022 um 10:47 schrieb Horst Leps:


Korrektur:

Die einfachste orgmode-Fassung ist:

#+LATEX_CLASS_OPTIONS: [a4paper,12pt]

#+LATEX_HEADER: \usepackage[T2A]{fontenc}


#+OPTIONS: toc:nil

Präsident der Ukraine: Anordnung vom 24. März 2021 Nr. 117/2021

Указом Президента України від 24 березня 2021 року № 117/2021

----

ergibt ein viel zu großes .tex, aber pdf, html und odt passend.

Marcus Gloeder

unread,
Sep 12, 2022, 9:03:56 PM9/12/22
to
Hallo alle zusammen, hallo Horst,

am 24.07.22 18:07, schrieb Horst Leps:
>Aquamacs mit Orgmode zum Schreiben, das jeweils aktuelle TexLive von
>Homebrew auf dem Mac.

Orgmode habe ich mal gegoogelt, weil ich das nicht kannte. Dabei ist mir
aufgefallen, dass das, was Du machst, eigentlich auch mit Markdown gehen
müsste. Das heißt, Du schreibst Deine Texte in Markdown mit dem
Markdown-Mode für Emacs (bzw. Aquamacs).[1] Mit Pandoc kannst Du die dann
in nahezu jedes andere Format übersetzen, jedenfalls dann, wenn es sich um
ein offenes Zielformat handelt.[2] Mit offen meine ich, dass Du eine Datei
in diesem Format in jeden beliebigen Texteditor laden kannst und etwas
lesbares bekommst.

>Grüße,
>
>Horst

Viele Grüße
Marcus

[1]
Siehe zum Beispiel hier:
https://jblevins.org/projects/markdown-mode/

[2]
https://pandoc.org/

--
PMs an: m.gl...@gmx.de

Horst Leps

unread,
Sep 15, 2022, 8:00:18 AM9/15/22
to
Am 13.09.2022 um 03:03 schrieb Marcus Gloeder:


Hallo Marcus,

ich bin rein zufällig auf orgmode aufmerksam geworden, und weil ich
schon fast 30 Jahre mit dem Emacs-Gnus schreibe, dachte ich, ich
probiere es mal aus.

Mein Eindruck: Die Syntax ist einfacher als die von Latex und Html. (Ob
man mit orgmode Mathe-Formeln schreiben kann, habe ich nicht ausprobiert
...) Die mit Orgmode erzeugten Latex-PDFs sind nicht schlechter als
andere auch, wird ja auch von texlive erstellt. Das Html dagegen ist
eben einfaches Html, 90er Jahre Stil.

Auf https://www.leps.de/2022/08/16/vorbereitung-zu-einem-vortrag/ gibt
es einen mit Orgmode geschriebenen Vortrag, mal als Latex-PDF, mal als
Html. (Ist Politik, der Inhalt muss nicht gefallen ...)

Die Ormode-Steuerzentrale bietet auch Odt (OpenOffice) als Export-Format
an. Meine Erfahrung: Das geht bei Texten, die ein paar Seiten lang sind,
recht gut, bei längeren Texten kommt irgendwann eine kryptische
Fehlermeldung, klappt dann nicht. Bei diesem Text geht es nicht.

Dein Hinweis auf Markdown hat mich neugierig gemacht: Den Org.Text kann
man in der Steuerzentrale des emacs-orgmodes auch nach md
konvertieren. Dieses md habe ich dann mit der Kommandozeile nach .odt
und .docx konvertiert. Hat im Prinzip geklappt, mit Ausnahme der
Fußnoten, die müssten alle noch einmal geschrieben werden, ist also bei
100 Fußnoten nicht so attraktiv.

Die .org-, .tex- und .md-Texte habe ich mal hier ablegt:
https://www.leps.de/category/technick/

Frage wäre also, ob .odt und / oder .docx über .md insgesamt sicherer zu
erzeugen wären als über .org? Und wie steht es von .md aus mit .tex und
.html?

Grüße,

Horst


>
> Orgmode habe ich mal gegoogelt, weil ich das nicht kannte. Dabei ist mir
> aufgefallen, dass das, was Du machst, eigentlich auch mit Markdown gehen
> müsste. Das heißt, Du schreibst Deine Texte in Markdown mit dem
> Markdown-Mode für Emacs (bzw. Aquamacs).

--

Marcus Gloeder

unread,
Sep 17, 2022, 3:21:33 AM9/17/22
to
Am 15.09.22 14:00, schrieb Horst Leps:
>Hallo Marcus,

Hallo Horst, hallo alle zusammen,

Du hast geschrieben:

>Mein Eindruck: Die Syntax ist einfacher als die von Latex und Html.

Deshalb bin ich auf Markdown gekommen. Markdown ist eine stark vereinfachte
Textauszeichnungssprache, die mit dem Ziel entwickelt worden ist, eine
einfache Alternative zu HTML beim verfassen von Texten für das Web zu
haben. Pandoc ist in diesem Zusammenhang zur Konvertierung von Markdown zu
HTML entwickelt worden. Inzwischen ist Pandoc aber zu einem universellen
Konvertierungstool geworden, mit dem Du nahezu jedes offene Format in
nahezu jedes andere offene Format konvertieren kannst. Wenn Du also eine
Datei in einem beliebigen Format beispielsweise in den Windows-Editor lädst
und etwas im Prinzip lesbares angezeigt bekommst, dann hast Du sehr gute
Chancen, dass Pandoc das in ein anderes Format konvertieren kann.

> (Ob man mit orgmode Mathe-Formeln schreiben kann, habe ich nicht ausprobiert ...)

Bei Markdown ist es so, dass es inzwischen verschiedene Markdown-Arten
gibt; neben Standard-Markdown auch erweiterte Formen wie MultiMarkdown und
Pandoc-Markdown. Im Unterschied zu Standard-Markdown können letztere auch
LaTeX-Formel-Code verstehen, der dann via MathJax gerendert wird.

>Die mit Orgmode erzeugten Latex-PDFs sind nicht schlechter als andere auch, wird ja auch von texlive erstellt. Das Html dagegen ist eben einfaches Html, 90er Jahre Stil

Pandoc kann aus jedwedem Ausgangsformat PDF-Dateien erzeugen, indem zuerst
eine LaTeX-Datei erzeugt und die dann automatisch kompiliert wird, also im
Prinzip genauso, wie Du es beschrieben hast. Bei HTML ist es so, dass
Pandoc reines HTML erzeugt, ohne PHP, JavaScript, Flash und was es sonst
noch so alles gibt. Auch CSS-Dateien werden nicht erzeugt, weil Markdown
eben keine Informationen über die Schriftart usw. enthält. (Ich glaube,
dass sich das in den erweiterten Markdown-Formen wie MultiMarkdown oder
Pandoc-Markdown über einen hizufügbaren Header ändern lässt und Pandoc dann
auch CSS-Dateien erzeugen würde. Das müsste ich aber erst noch einmal
googeln.)

>Auf https://www.leps.de/2022/08/16/vorbereitung-zu-einem-vortrag/ gibt es einen mit Orgmode geschriebenen Vortrag, mal als Latex-PDF, mal als Html. (Ist Politik, der Inhalt muss nicht gefallen ...)

(Nebenbei: das ist das Thema, über das sich zur Zeit alle zerstreiten. Ich
habe jetzt _nicht_ gelesen was genau Du jetzt meinst und sage dazu hier
auch nichts, weil ich meine, das Politik in dieser Newsgroup off-topic
ist.)

Nur soviel: die Vorbemerkung nicht als \section, sondern als \subsection zu
formatieren halte ich für unglücklich, weil Du dann die Nummerierung 0.1
statt 1 bekommst. Aber das musst Du selbst wissen

>Die Ormode-Steuerzentrale bietet auch Odt (OpenOffice) als Export-Format an. Meine Erfahrung: Das geht bei Texten, die ein paar Seiten lang sind, recht gut, bei längeren Texten kommt irgendwann eine kryptische Fehlermeldung, klappt dann nicht. Bei diesem Text geht es nicht.

Pandoc kann jeden beliebigen Text in (nahezu) jedem beliebigen
Ausgangsformat, einschließlich Org-Mode, sowohl nach .odt als auch nach
.docx exportieren. Die Größe der Dateien dürfte dabei keine Rolle spielen.
Wenn, wie bei Textauszeichnungssprachen üblich, logisches Markup verwendet
wird, ist auch der Aufwand für die Nachbearbeitung wahrscheinlich nicht
besonders groß.

Nur wenn umgekehrt eine .odt- oder .docx-Datei konvertiert werden soll, in
der hauptsächlich mit optischem Markup gearbeitet worden ist (also ohne
Formatvorlagen zu benutzen), wird es haarig.

>Dein Hinweis auf Markdown hat mich neugierig gemacht: Den Org.Text kann man in der Steuerzentrale des emacs-orgmodes auch nach md konvertieren. Dieses md habe ich dann mit der Kommandozeile nach .odt und .docx konvertiert. Hat im Prinzip geklappt, mit Ausnahme der Fußnoten, die müssten alle noch einmal geschrieben werden, ist also bei 100 Fußnoten nicht so attraktiv.

Hast Du geschaut, ob bei der Konvertierung von Org-Mode nach Markdown auch
die Fußnoten mitkonvertiert worden sind?

Versuch doch mal, was passiert, wenn Du die Konvertierung über Pandoc
machst. Ich vermute nämlich, dass das deutlich besser funktioniert. Nur
müsstest Du Dich mit der Pandoc-Syntax auseinandersetzen oder einen
Markdown-Editor benutzen, der Org-Mode via Pandoc importieren kann. Googeln
hilft.

>Die .org-, .tex- und .md-Texte habe ich mal hier ablegt:
>https://www.leps.de/category/technick/
>
>Frage wäre also, ob .odt und / oder .docx über .md insgesamt sicherer zu erzeugen wären als über .org? Und wie steht es von .md aus mit .tex und .html?

Im Grunde genommen ist, denke ich, am Ende nicht die Frage, was Du als
Ausgangsformat benutzt, sondern eher, was Du zur Konvertierung benutzt. Da
kenne ich zur Zeit nichts Besseres als Pandoc. Pandoc kann, wie auf der
Webpräsenz von Pandoc nachlesbar ist, auch mit Org-Mode als Ausgangsformat
umgehen. Probier Das doch mal aus.

Bei Markdown vs. Org-Mode ist meiner Ansicht nach nur von Bedeutung, was für
Dich einfacher zu schreiben ist (und welche Markdown-Variante genau mit
Org-Mode verglichen werden soll). Das müsstest Du einfach ausprobieren und
für Dich eine Entscheidung treffen.

>Grüße,
>
>Horst

Viele Grüße
Marcus

--
PMs an: m.gl...@gmx.de

Marcus Gloeder

unread,
Sep 17, 2022, 3:53:16 AM9/17/22
to
Hallo Horst, hallo alle zusammen,

gerade habe ich das hier entdeckt:

http://joostkremers.github.io/pandoc-mode/

Den gesamten Text der Seite habe ich nicht gelesen, aber ich glaube dass Dir
das weiterhelfen kann.

Juergen Fenn

unread,
Sep 17, 2022, 4:00:37 PM9/17/22
to
Am 15.09.22 um 14:00 Uhr schrieb Horst Leps:
> Dein Hinweis auf Markdown hat mich neugierig gemacht


Ich habe gezögert, ob ich mich nochmal einmische, aber ich schreibe
jetzt doch mal was dazu. :)

Wir sprechen über Auszeichnungssprachen und Konverter. Da gab es im
Rückblick, wenn man so will, drei Phasen, die für uns relevant sind:

1. Am Anfang ging es erst einmal nur darum, LaTeX-Dokumente ins Web zu
bringen. Davon handelt der "LaTeX Web Companion" (deutsch: "Mit LaTeX
ins Web"), der dritte Band der Companion-Reihe, von dem es nur
Nachdrucke, aber keine Folgeauflagen mehr gab. In den 1990er Jahren
wurden mehrere meist ziemlich komplexe LaTeX-nach-HTML-Konverter
entwickelt, die alle mehr oder weniger funktionierten, meist weniger.
Der letzte war TeX4ht von Eitan Gurari, der viel zu früh verstarb und
uns leider keine besonders schöne Dokumentation überlassen hatte. Nach
seinem Tod wurde das Projekt von seiner Universitätsseite nach
<https://www.tug.org/tex4ht/> übertragen, und für den Mac gibt es ein
ziemlich brauchbares Frontend <http://www.simpletex4ht.free.fr/>, das
ich schon in einem anderen Beitrag erwähnt hatte.

2. TeX4ht entstand in der Zeit, in der auch XML entwickelt wurde. Die
Idee war: Man codierte nun alles in XML (auch die Textverarbeitungen
stellten auf XML-Formate um) und konvertierte daraus die Druckvorstufe.
LaTeX wurde vom Schreibformat zum bloßen Setzer. Vom Format zur Engine.
Am Ende fiel ein PDF heraus. Dem wollen wir uns nicht weiter widmen.

3. Der jüngste Weg, der mittlerweile ziemlich weit verbreitet ist, ist
der Weg der sehr einfachen Auszeichnungssprachen wie Markdown oder
Org-mode. Auch sie gehen in die 1990er Jahre zurück und standen am
Anfang des Webs. Auch bei ihnen ging es von Anfang an darum, Content ins
Web zu bringen, aber daraus wurde mittlerweile mehr. Auch Michael
"Linux-Bibel" Kofler erzählte uns vor genau zehn Jahren
<https://kofler.info/sackgasse-latex/>
<https://texandfriends.wordpress.com/2013/08/26/von-latex-nach-epub-iii/>
über seinen Weg von LaTeX über Asciidoc zu -- ein Tusch! -- seit 2014
auch Markdown und Pandoc. Der Vorteil liegt darin, dass man Texte, die
in diesen sehr einfach gehaltenen Auszeichnungssprachen vorliegen,
leicht und praktisch verlustfrei konvertieren kann. Der Nachteil ist,
dass man kaum komplexe Inhalte darin unterbringen kann. Vor allem
Fußnoten gehen so gut wie nicht, weil sich die Entwickler dafür
anscheinend nicht interessieren. Wer also ein geistes- oder
sozialwissenschaftliches Fach betreibt, muss leider außen vor bleiben.
Wer sich gleichwohl für diesen Weg entscheidet, lese den Überblick von
Karl Voit <https://karl-voit.at/2017/09/23/orgmode-as-markup-only/>, in
dem er begründet, warum man besser Org-mode als eines der vielen
Markdown benutzen möge.

Was mache ich? Ich benutze alles, wo es passt. LaTeX für alles mögliche.
Org-mode vor allem als Outliner mode als Ideensammlung. Und Markdown
fürs Web (Blogposts kann man leicht und verlustfrei auf diese Weise
archivieren und zwischen diversen Plattformen transferieren) und für
Plattformen wie GitHub und Co. Für alles Ernsthafte, das Fußnoten
enthält und mit einer BibTeX-Datenbank zusammenarbeiten soll, bleibe ich
natürlich bei LaTeX. Auch wenn Pandoc das unterstützen mag, schreibe ich
weiterhin in LaTeX.

Probiere es aus, entwickle deinen Workflow und bleibe dann dabei, um auf
Dauer produktiv zu arbeiten.

Hope this helps.

Viele Grüße,
Jürgen.

Axel Berger

unread,
Sep 17, 2022, 5:56:48 PM9/17/22
to
Juergen Fenn wrote:
> Auch bei ihnen ging es von Anfang an darum, Content ins
> Web zu bringen,

Ich bin zugeben nicht so der Technikinsider und -geschichtler, aber ich
habe den (einen?) Zweck von Maekdown anders verstanden. Es entstand, als
in weiten Kreisen HTML in Mail und New noch verpönt waren. Ich erinere
mich an das letzte Ende der siebenbittigen Zeiten, als es Kodierungen
sachon gab aber noch nicht jedes System sie beherrschte. Damals war es
durchaus weit verbreitet, Umlaute in TeX-Notation zu schreiben. Für z.B.
Mathematik ist das imho immer noch die beste Wahl aber leider ziemlich
in Vergessenheit geraten.

LaTeX besitzt, wenn es komplexer wird, nicht die bestte Lesbarkeit, vor
allem für Nicht-Anwender. Markdown war und ist jetzt bewußt so
konzipiert, daß es auch als ASCII Quelltext nahezu mühelos und optimal
lesbar ist.

Ich selbst tippe den ersten Entwurf eines Textes sowohl für LaTeX als
auch für HTML gern schnell als reinen Text hin, schnell bevor ich den
Gedankengang wieder verliere. Dafür sind die wenigen sehr knappen
Markdown Auszeichnungen ideal, sie hemmen den Schreibfluß gar nicht.

Pandoc verwende ich nicht, ich habe Makros für meinen Editor, die all
das expandieren. Trotzdem versuche ich sehr, Ideosynkratismen zu
vermeiden und mich strikt an die dokumentierte Syntax zu halten.

> Vor allem Fußnoten gehen so gut wie nicht,

Für eine Lösung dafür wäre ich sehr dankbar. Ich konvertiere regelmäßig
(ebenfalls mitr eigenen Editormakros) LaTeX nach HTML für Micosoft und
OO Anwender. Copy/Paste aus PDF verliert zu viel und hebräische Zitate
ganz. HTML können Word und Writer problemlos einlesen.

Bei Fußnoten schreibe ich bisher nur "(Fußnote)" als sichtbaren Marker.
Eine irgendwie geartete Lösung wäre hilfreich.


--
/¯\ No | Dipl.-Ing. F. Axel Berger Tel: +49/ 221/ 7771 8067
\ / HTML | Roald-Amundsen-Straße 2a Fax: +49/ 221/ 7771 8069
 X in | D-50829 Köln-Ossendorf http://berger-odenthal.de
/ \ Mail | -- No unannounced, large, binary attachments, please! --

Marcus Glöder

unread,
Sep 17, 2022, 6:12:31 PM9/17/22
to
Hallo alle zusammen,

am 17.09.2022 um 23:58 schrieb Axel Berger:
> Juergen Fenn wrote:
>> Vor allem Fußnoten gehen so gut wie nicht,
>
> Für eine Lösung dafür wäre ich sehr dankbar. Ich konvertiere regelmäßig
> (ebenfalls mitr eigenen Editormakros) LaTeX nach HTML für Micosoft und
> OO Anwender. Copy/Paste aus PDF verliert zu viel und hebräische Zitate
> ganz. HTML können Word und Writer problemlos einlesen.
>
> Bei Fußnoten schreibe ich bisher nur "(Fußnote)" als sichtbaren Marker.
> Eine irgendwie geartete Lösung wäre hilfreich.

Hier:
https://1drv.ms/u/s!AhSmXwQDkCvag_4t9RYgVEravipzgw?e=Q2yvQE
habe ich mal eine .md-Datei, die von Pandoc daraus resultierende
LaTeX-Datei und die durch die Kompilierung mittels pdflatex erzeugten
Dateien einschließlich der resultierenden PDF-Datei abgelegt.

Wie sich sehen lässt, gehen Fußnoten in Markdown so.[^1]

[^1]: Dies ist eine Fußnote.

In der von Pandoc erzeugten LaTeX-Datei seht dann
\footnote{Dies ist eine Fußnote.}

Marcus Glöder

unread,
Sep 17, 2022, 6:45:58 PM9/17/22
to
# Errata

Am 18.09.2022 um 00:12 schrieb Marcus Glöder:
> […] habe ich mal eine .md-Datei, die von Pandoc daraus resultierende
> LaTeX-Datei und die durch die Kompilierung mittels pdflatex erzeugten
> Dateien einschließlich der resultierenden PDF-Datei abgelegt.

Das sollte heißen:

-->
[…] habe ich mal eine .md-Datei, die von Pandoc daraus *erstellte*
LaTeX-Datei und die durch die Kompilierung mittels pdflatex erzeugten
Dateien einschließlich der resultierenden PDF-Datei abgelegt.
<--

> Viele Grüße
> Marcus

Axel Berger

unread,
Sep 18, 2022, 5:22:17 AM9/18/22
to
Marcus Glöder wrote:
> Wie sich sehen lässt, gehen Fußnoten in Markdown so.[^1]
> [^1]: Dies ist eine Fußnote.
> In der von Pandoc erzeugten LaTeX-Datei seht dann
> \footnote{Dies ist eine Fußnote.}

Klar, sorum ist einfach. Mein Problem ist, in Markdown oder LaTeX
geschriebene Noten in andere Umgebungen, vorzugsweise Officeprogramme,
zu übertragen.

Axel Reichert

unread,
Sep 18, 2022, 6:44:49 AM9/18/22
to
Servus zusammen,

ein paar Gedanken zum Thema nun auch von mir. Ein bisschen Hintergrund:

Emacs seit 1996, LaTeX seit 1992, Autor diverser Pakete (units,
currvita, fancyref, cooking) und Tutorien (Gleitobjekte, Tabellensatz),
um die Jahrtausendwende hier fleissiger Stammschreiber (ein paar
Veteranen moegen mich noch kennen).

Mittlerweile ziemlich raus. Warum? Wegen der schlanken
Auszeichnungssprachen. Abtruennig wurde ich durch AsciiDoc (damals noch
nicht "Doctor"), dann entdeckte (und verfiel) ich org-mode (nach mehr
als 20 Jahren Emacs, es wurde Zeit ...).

Warum von LaTeX zu AsciiDoc? Einfacher zu lesen.

Warum von AsciiDoc zu org-mode (und nicht Markdown)? Einfacher zu
schreiben:

Die eigentliche Syntax bei den schlanken Auszeichnungssprachen tut sich
nicht viel, der Emacs ist das Killerkriterium. Mit ihm sind das Gliedern
(Abschnitte/Aufzaehlungspunkte vertauschen, hochstufen, runterstufen)
und die Tabellen ein Traum, der Orga-Kram (TODO, Agenda) und der
integrierte Code (org-babel) sind das Sahnehaeubchen. Es gibt
vi-Juenger, die wegen org-mode die Religion gewechselt haben. (-:

Mittlerweile benutze ich LaTeX kaum noch, auch nicht als Engine, weil
fuer mich der ASCII-Text meist reicht (Inhalt statt Form, eine
Alterssache?). Meine letzte groessere Veroeffentlichung fuers Netz habe
ich mit org-mode geschrieben. Das resultierende HTML war zwar
ueberraschend gut, mir dann aber doch zu profan (alte Beissreflexe ...),
das resultierende PDF (ueber LaTeX) ebenso, aber das LaTeX war eine
vernuenftige Ausgangsbasis, um es "schoen" zu machen.

Dabei habe ich dann gesehen, wie sehr ich raus bin und nach heutigem
Stand vermutlich viele "verbotene" Dinge gemacht, fuer die ich frueher
die Neulinge hier abgekanzelt haette. (-:

Was Formeln mit MathJax angeht, habe ich im Kopf, dass chrome-basierte
Browser dass nicht mehr koennen. Aber das kann sich schon wieder
geaendert haben.

Tschoe!

Axel

Marcus Gloeder

unread,
Sep 18, 2022, 1:52:14 PM9/18/22
to
Hallo Axel, hallo alle zusammen,

am 18.09.22 11:24, schrieb Axel Berger:
>Mein Problem ist, in Markdown oder LaTeX
>geschriebene Noten in andere Umgebungen, vorzugsweise Officeprogramme,
>zu übertragen.

Aha, das wusste ich nicht. Jetzt habe ich noch einmal versucht, wass
passiert, wenn ich meine .md-Testdatei über Pandoc nach .docx oder nach
.odt exportiere. Die Ergebnisse habe ich mir jeweils in Word365
(.docx-Datei) bzw. LibreOffice Writer 7.4 (.odt-Datei) angesehen und in
beiden Fällen aus dem jeweiligen Textverarbeitungsprogramm heraus eine
PDF-Datei erstellt. Die .docx-Datei, die .odt-Datei und die beiden
erzeugten PDF-Dateien habe ich dann in den bereits von mir verlinkten
Freigabeordner kopiert. Hier ist noch einmal der Link dahin:

https://1drv.ms/u/s!AhSmXwQDkCvag_4t9RYgVEravipzgw?e=Q2yvQE

Was zu sehen ist, ist, dass die Fußnoten weder für Word (.docx) noch für
Writer (.odt) ein Problem sind. LibreOffice Writer hat allerdings Probleme
mit LaTeX-Formeln. Die Inline-Formel ist in ein Bild umgewandelt worden und
bei der abgesetzten LaTeX-Formel steht nur der LaTeX-Code als Text da. In
Word sind beides echte Formeln. Auch der Befehl \tag{1} in der abgesetzten
Formel ist in Word mit umgesetzt worden, was zwar zu einer Nummer für die
Formel führt, die aber weder am rechten Rand des Satzspiegels steht noch
referenzierbar ist. Hier ist meiner Ansicht nach eine Nachbearbeitung
notwendig. Die hast Du aber immer, wenn Du in solche Formate exportierst.
Jedenfalls hat der Export in beide Formate erstaunlich gut geklappt, nach
.docx noch etwas besser als nach .odt.

Für den Export via Pandoc habe ich Typora benutzt. Das kostet zwar
inzwischen was, aber nur einmalig (d.h. jedes Update ist auch mit
inbegriffen) und es ist auch nicht besonders viel. Siehe hier:
https://typora.io/
Für Vielschreiber in Emacs oder Aquamacs gibt es eine Erweiterung für den
Export via Pandoc, siehe beispielsweise hier:
http://joostkremers.github.io/pandoc-mode/
Das habe ich aber nicht ausprobiert, weil ich den Emacs nicht benutze.

Marcus Gloeder

unread,
Sep 18, 2022, 3:19:55 PM9/18/22
to
Am 18.09.22 12:44, schrieb Axel Reichert:
>Servus zusammen,

Hallo Axel, hallo alle zusammen,

da hast Du geschrieben:

> Was Formeln mit MathJax angeht, habe ich im Kopf, dass chrome-basierte Browser dass nicht mehr koennen. Aber das kann sich schon wieder geaendert haben.

Gerade habe ich mal einen Ansatz, den ich vor Jahren auf mathefragen.de
(damals hieß das noch LetsRockMathe) geschrieben habe, über Chrome auf
meinem Android-Smartphone aufgerufen. Die Darstellung der mit LaTeX-Code
erzeugten Tabellen und Formeln ist vollkommen in Ordnung. Um das zu rendern
wird bei mathefragen.de MathJax eingesetzt. Hier ist der Link zu meinem
damaligen Aufsatz:

https://www.mathefragen.de/frage/q/ce680c56d611832b/stochastische-unabhangigkeit-und-chi-quadrat-test/

>Tschoe!
>
>Axel

Horst Leps

unread,
Sep 18, 2022, 3:51:51 PM9/18/22
to
Am 17.09.2022 um 22:00 schrieb Juergen Fenn:

> auch Markdown und Pandoc. Der Vorteil liegt darin, dass man Texte, die
> in diesen sehr einfach gehaltenen Auszeichnungssprachen vorliegen,
> leicht und praktisch verlustfrei konvertieren kann. Der Nachteil ist,
> dass man kaum komplexe Inhalte darin unterbringen kann. Vor allem
> Fußnoten gehen so gut wie nicht, weil sich die Entwickler dafür
> anscheinend nicht interessieren.

Fußnoten in meinen org-Dateien tauchen als Fußnoten in Latex bei mir
auf, als Links am Schluss des Textes bei Html. Wenn die org-Datei nicht
allzulang ist oder sonst einen mir bislang unbekannten Fehler hat und
eine odt-Datei vollständig erzeugt, hat diese odt-Datei auch
vollständige Fußnoten.

Aber da gibt es öfter ein Problem.

>
> Probiere es aus, entwickle deinen Workflow und bleibe dann dabei, um auf
> Dauer produktiv zu arbeiten.

Für gute Rechtschreibung und ordentlichen Stil benutze ich oft Papyrus,
das kann keiner besser.

DAnke!


Juergen Fenn

unread,
Sep 18, 2022, 4:28:42 PM9/18/22
to
Am 17.09.22 um 23:58 Uhr schrieb Axel Berger:
>> Auch bei ihnen ging es von Anfang an darum, Content ins Web zu
>> bringen,
> Ich bin zugeben nicht so der Technikinsider und -geschichtler, aber
> ich habe den (einen?) Zweck von Maekdown anders verstanden. Es
> entstand, als in weiten Kreisen HTML in Mail und New noch verpönt
> waren. Ich erinere mich an das letzte Ende der siebenbittigen Zeiten,
> als es Kodierungen sachon gab aber noch nicht jedes System sie
> beherrschte. Damals war es durchaus weit verbreitet, Umlaute in
> TeX-Notation zu schreiben. Für z.B. Mathematik ist das imho immer
> noch die beste Wahl aber leider ziemlich in Vergessenheit geraten.


Aaron Swartz schrieb 2004:


> For months I’ve been working with John Gruber on a new project. The
> idea was to make writing simple web pages, and especially weblog
> entries, as easy as writing an email, by allowing you to use much the
> same syntax and converting it automatically into HTML.
>
> Together we pored over the syntax details from top to bottom, trying
> to develop the perfect format, and I think we’ve got something pretty
> darn great. We’ve tested it extensively: on our blogs, in my comments
> form, in our emails. It’s all worked amazingly well.
>
> The format, and John Gruber’s perl implementation of it, is called
> Markdown. I highly recommend it. It plugs right into Movable Type and
> makes writing entries so much easier and fun.


http://www.aaronsw.com/weblog/001189

Viele Grüße,
Jürgen.

Juergen Fenn

unread,
Sep 18, 2022, 4:36:37 PM9/18/22
to
Am 18.09.22 um 11:24 Uhr schrieb Axel Berger:
> Klar, sorum ist einfach. Mein Problem ist, in Markdown oder LaTeX
> geschriebene Noten in andere Umgebungen, vorzugsweise Officeprogramme,
> zu übertragen.


Das ging noch nie (~1995 bis heute). Auch beim Ex- und Import zwischen
verschiedenen Textverarbeitungen (und den Versionen derselben
Textverarbeitung) erweisen sich Fußnotenformatierungen meist als
zerbrechlich. Ich habe es mir immer damit erklärt, dass sich Entwickler
einfach nicht für Fußnoten interessieren, es scheint ihnen egal zu sein.
Auch in HTML hatte man nicht an Fußnoten gedacht. Erst mit der
Einführung der Belegpflicht bei Wikipedia 2005 wurden Fußnoten in einem
Wiki implementiert und verbreiteten sich im Web. Freilich gibt es
Fußnoten in org-mode und in einigen Markdown-Flavours, aber das sind
keine Standards, und sie können auch nicht auf einem Standard aufbauen.

Viele Grüße,
Jürgen.

Axel Berger

unread,
Sep 19, 2022, 5:23:46 AM9/19/22
to
Juergen Fenn wrote:
> Das ging noch nie (~1995 bis heute).

Marcus schrieb ja gerade, daß Pandoc es offenbar irgendwie doch kann.
Dummerweise hilft mir das wenig, denn Pandoc verwende ich nicht, nur
Markdown als Format. Bei meinen Umwandlungen per Editorskript bin ich
mehr oder weniger auf ASCII-Formate beschränkt. Da Textverabeitungen
HTML einlesen können ist das mein Transferformat der Wahl. Alles klappt
nicht. Die Rechtsbündikeit wie Seitenzahl im Inhaltsverzeichnis oder im
konkreten Fall Preise eines alten Bußgeldkataloges konnte ich schreiben
und im Browser korrekt anzeigen lassen, aber die Übernahme in Word und
Writer ist gescheitert.

Juergen Fenn

unread,
Sep 19, 2022, 8:02:25 AM9/19/22
to
Am 19.09.22 um 11:25 Uhr schrieb Axel Berger:

>> Das ging noch nie (~1995 bis heute).
>
> Marcus schrieb ja gerade, daß Pandoc es offenbar irgendwie doch kann.
> Dummerweise hilft mir das wenig, denn Pandoc verwende ich nicht, nur
> Markdown als Format. Bei meinen Umwandlungen per Editorskript bin ich
> mehr oder weniger auf ASCII-Formate beschränkt. Da Textverabeitungen
> HTML einlesen können ist das mein Transferformat der Wahl. Alles klappt
> nicht. Die Rechtsbündikeit wie Seitenzahl im Inhaltsverzeichnis oder im
> konkreten Fall Preise eines alten Bußgeldkataloges konnte ich schreiben
> und im Browser korrekt anzeigen lassen, aber die Übernahme in Word und
> Writer ist gescheitert.

Und eben darum ging es doch. Und ich spreche nicht von 3 Fußnoten in
einem kleinen Aufsatz, sondern von knapp 1000 Fußnoten, die teilweise
über mehrere Seiten laufen, auf 200 Seiten. Sowas möchte ich übrigens
auch nicht in Markdown oder org-mode schreiben, sondern eher im Emacs
mit AUCTeX in LaTeX.

Für jeden Zweck das richtige Werkzeug auswählen.

Viele Grüße
Jürgen.

Horst Felder

unread,
Sep 19, 2022, 12:04:41 PM9/19/22
to
Hallo Axel!

Axel Berger <Sp...@Berger-Odenthal.De> schrieb:
> Dummerweise hilft mir das wenig, denn Pandoc verwende ich
> nicht, nur Markdown als Format.
[…]
> Da Textverabeitungen HTML einlesen können ist das mein
> Transferformat der Wahl.
[…]
> Die Rechtsbündikeit wie Seitenzahl im Inhaltsverzeichnis oder im
> konkreten Fall Preise eines alten Bußgeldkataloges konnte ich
> schreiben und im Browser korrekt anzeigen lassen, aber die
> Übernahme in Word und Writer ist gescheitert.

Du wandelst Markdown in HTML, um es dann in eine Textverarbeitung
einzulesen? Vielleicht solltest du dir doch mal pandoc anschauen… das
kann von Markdown direkt in docx, odt, rtf oder tex wandeln… klar, mit
den schon erwähnten Abstrichen, aber die hast du bei Markdown -> HTML
-> Textverarbeitung ja auch…

Ich verwende übrigens den Markdown-Editor ReText… hauptsächlich weil
ich dort eigene Menüpunkte definieren kann, beispielsweise pandoc
Befehlsketten… ich kann also im Menü meines Markdown-Editors
meinen Text direkt in die von mir definierten Formate wandeln… finde
ich recht praktisch!

Einen schönen Tag noch!

--
Mit freundlichen Grüßen
Horst Felder - www.flohheim.de
GNU/Linux; damit ich auch morgen noch vernünftig arbeiten kann!

Axel Berger

unread,
Sep 19, 2022, 5:19:51 PM9/19/22
to
Horst Felder wrote:
> Du wandelst Markdown in HTML, um es dann in eine Textverarbeitung
> einzulesen?

Ich lese es nicht ein, ich verwende so Zeug nicht. Aber die Dozentin
kann meine hebräische Abschrift (des Photos) einer mittelalterlichen
Handschrift nicht aus dem PDF (mit cjhebrew erstellt) herauskopieren und
mit TeXquellen nichts anfangen. HTML verwende ich ohnehin selbst. Da
bietet es für mich an, ihr HTML zu geben, das kann sie einlesen. HTML
ist auch für mich ein gutes Zwischenformat, um den hebräischen Text
(cjhewrew) in die wissenschaftliche Transliteration zu wandeln (einmal
Tippen reicht). Ich könnte in einer Schleife Buchstabe für Buchstabe
vorgehen, das wäre extrem langsam. Suchen/Ersetzen ist sehr schnell aber
muß eindeutig sein. Das Zwischenformat &#nnn; läßt keine Verwechslung
zwischen noch nicht gewandelten und schon gewandelten Zeichen zu. Eine
lange Erstzungsliste, aber ich schrieb sie nur genau einmal.

Auch in der Gegenrichtung hat es sich für mich als Transferformat
bewährt. Wenn ich ein .docx oder ähnlich bekomme, z.B. um es mittels TeX
als z.B. Flyer zu setzen, kann ich es als .txt speichern, aber dabei
gehen alle Auszeichnungen verloren. Aus HTML kann ich mühelos alles
überflüssige rausschmeißen und das sinnvolle wandeln. Das spart mir
enorm viel Handarbeit. Diese Arbeitsflüsse sind über lange Zeit
gewachsen und haben sich für mich bewährt.

Beispiele: http://axel.berger-odenthal.de/work/Koeln/

Axel Reichert

unread,
Sep 24, 2022, 3:58:42 AM9/24/22
to
Servus Marcus,

[MathJax-Unterstuetzung im Browser]

> Die Darstellung der mit LaTeX-Code erzeugten Tabellen und Formeln ist
> vollkommen in Ordnung. Um das zu rendern wird bei mathefragen.de
> MathJax eingesetzt.

Gut zu wissen, danke. Ein schneller Test hier mit LibreWolf hat auch
geklappt, sehr schoen.

Tschoe!

Axel
Reply all
Reply to author
Forward
0 new messages