Olá pessoal!
Meu nome é Paulo Moreno e atuo no mercado editorial há vários anos. Atualmente, venho explorando novos modelos de publicação aberta e me deparei com o
Quarto Markdown (
https://quarto.org/), que considero uma solução promissora para fluxos de trabalho ainda baseados em arquivos MS Word.
Nesse contexto, tentei utilizar o
Pandoc (
https://pandoc.org/) para converter arquivos Word (
DOCX) em Quarto Markdown (
QMD), mas os resultados não foram totalmente precisos — principalmente porque meus arquivos DOCX utilizam estilos de parágrafo personalizados que o Pandoc acaba ignorando. Além disso, gostaria de extrair as informações do cabeçalho da primeira página do DOCX e incluí-las como uma seção YAML dentro do QMD, mas ainda não encontrei uma forma eficiente de fazer isso.
Entendo que é possível utilizar
Lua filters para otimizar o processo de conversão e, possivelmente, mapear todos os estilos de parágrafo em diferentes classes dentro do arquivo Markdown convertido (veja imagem em anexo para mais detalhes sobre o mapeamento de estilos de paragráfos).
Gostaria de saber se vocês têm experiência ou métodos automatizados para alcançar uma conversão precisa de DOCX para QMD utilizando Lua filters. Além disso, conhecem algum estudo de caso em que o Pandoc tenha sido usado como conversor base, complementado por Lua para reduzir a “lacuna semântica” entre a estrutura orientada a layout do Word e o formato Markdown mais semanticamente rico do Quarto?
Antecipadamente agradeço a ajuda!
Att:
Paulo Moreno