笨办法:
Acrobat -> (OCR if necessary) -> 全选
-> Ctrl-c -> Ctrl-v -> 手调
尤其是Latex生成的pdf,全选拷下来后要很多地方要手调,
我的简历就是这样,最后干脆全部手打一遍,反而快得多。
尝试过一些库和程序,总有这样那样的问题,手调似乎是不能完全避免的。
谁若是找到完全自动化不需要人工干预的完美解决办法,不妨说说。
【 在 tangzhiyi11 (卖鱼的哲学) 的大作中提到: 】
: 实现pdf转成txt的,试了下pdfminer的pdf2txt 有的转的不错
: 有的转不了啊 求这方面的高手指点
--
[m [37m※ 来源:·水木社区
http://newsmth.net·[FROM: 98.207.104.*] [m