Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Convertir du PDF en Excel

254 views
Skip to first unread message

HD

unread,
Feb 28, 2013, 8:39:21 AM2/28/13
to
Bonjour,

Connaissez vous une appli libre qui permettrait de convertir un fichier PDF
généré à partir d'un tableur vers un fichier Excel ? Ceci afin de récupérer
les données d'un tableau en Excel. (le copier coller me donne des données
qu'il n'est pas possible de convertir en colonne... il n'y a pas de
séparateur entre colonne).

@+
HD


AgriPacTe(News)

unread,
Mar 1, 2013, 6:22:11 AM3/1/13
to
Bonjour,
Il y a trop de possibilités de solutions selon le fichier .pdf ...
Tous ces convertisseurs qui existent (gratuits ou payants) ne sont pas
utiles dans la majorité des cas.

Il faudrait avoir concrètement votre fichier et votre question pour
vous apporter (probablement) une solution qui vous étonnera par sa
simplicité.

Personnellement, je fais cela couramment, ce n'est jamais un problème
complexe, mais c'est rarement la même solution deux fois de suite ...

(et je n'utilise jamais de convertisseur ... même gratuit!)

Si vous voulez m'envoyer le fichier hors-liste, vous pouvez ...


Cordialement,
--
|Claude Safon, AgriPacTe, (agri...@wanadoo.fr)|
|----------------------------------------------------------------------|
|- Pour une nouvelle agriculture méditerranéenne, écologique, durable -|
└----------------------------------------------------------------------┘

HD

unread,
Mar 1, 2013, 8:01:37 AM3/1/13
to
> Il y a trop de possibilités de solutions selon le fichier .pdf ...
> Tous ces convertisseurs qui existent (gratuits ou payants)
> ne sont pas utiles dans la majorité des cas.
Habituellement, avec un PDF texte (généré à partir d'un tableur ou d'un
éditeur de texte) je fais un simple ctrl+a, ctrl+c puis ctrl+v. Cela me
copie le texte sans souci.

Sauf que dans le cas où il y'a des colonnes, les données sont collés mais
une ligne complète va apparaitre sans séparateur autre que le caractère
espace. Ce qui pose problème lorsque par exemple en première colonne l'on a
du texte avec des mots séparés par des espaces et où l'on a le séparateur de
milliers qui est également l'espace.

> Il faudrait avoir concrètement votre fichier et votre question pour
> vous apporter (probablement) une solution qui vous étonnera par sa
> simplicité.
Dans le cas présent... j'en doute. Mais bon, l'on ne peut pas tout savoir.

Ce n'est pas mon tableau, mais voici un exemple du type de tableau qui pose
problème: http://elveapharma.com/indices-glycemiques.pdf

L'on a plusieurs colonnes avec du texte (parmi lequel l'on a des espaces
entre les mots), des chiffres, etc... L'on copie les données du PDF, on le
colle dans Excel et là l'on perd toutes indications de colonnes.

@+
HD



Stéphane Santon

unread,
Mar 16, 2013, 5:11:11 PM3/16/13
to
Bonjour,

Pourquoi cherches-tu une appli libre ?
La plupart des applis d'OCR font ça.

HD a écrit :
--
Stéphane

Jeune Chambre Economique de Saintes *** http://www.jce-saintes.org
Agitateurs d'idées... accélérateurs de talents !

BTS Electrotechnique *** http://enselec.santonum.eu


AgriPacTe(News)

unread,
Mar 17, 2013, 3:23:48 AM3/17/13
to
Le 16/03/2013 22:11, Stéphane Santon a écrit :
> Bonjour,
>
> Pourquoi cherches-tu une appli libre ?
> La plupart des applis d'OCR font ça.

Avez-vous essayé d'obtenir ce que demande HD (un tableau)
à partir du fichier qu'il fourni (pdf non organisé en tableau) ?

Je crois volontiers qu'un logiciel OCR fournisse des bouts de texte
(correspondant à chacune des zones du pdf) ... mais "en vrac" ...

Si vous voyez une piste que je ne vois pas, veuillez traduire le
fichier fourni et exposer le résultat. Merci ...

> HD a écrit :
>> Connaissez vous une appli libre qui permettrait de convertir un
>> fichier PDF généré à partir d'un tableur vers un fichier Excel ? Ceci
>> afin de récupérer les données d'un tableau en Excel. (le copier coller
>> me donne des données qu'il n'est pas possible de convertir en
>> colonne... il n'y a pas de séparateur entre colonne).


Stéphane Santon

unread,
Mar 17, 2013, 3:59:21 AM3/17/13
to
Bonjour,

AgriPacTe(News) a écrit :
> Avez-vous essayé d'obtenir ce que demande HD (un tableau)
> à partir du fichier qu'il fourni (pdf non organisé en tableau) ?

Oui, je le fais tous les jours.

> Je crois volontiers qu'un logiciel OCR fournisse des bouts de texte
> (correspondant à chacune des zones du pdf) ... mais "en vrac" ...

Un /mauvais/ logiciel d'OCR peut-être

> Si vous voyez une piste que je ne vois pas, veuillez traduire le
> fichier fourni et exposer le résultat. Merci ...

En une minute avec FineReader

http://demo.ovh.com/download/b6e78bfd45dddd8f6e5274d7cceb3da4/indices-glycemiques.xls

Stéphane Santon

unread,
Mar 17, 2013, 4:08:26 AM3/17/13
to
Stéphane Santon a écrit :
Et une minute c'est très large, hein ! Le détail de la manip :
- lancer FineReader
- Fichier | Ouvrir un fichier / une image PDF
- Séletionner le fichier, valider
- attendre 10 secondes
- Fichier | Enregistrer le document sous | Fichier Microsoft Excel
97/2003 | Valider

Voilou

HD

unread,
Mar 18, 2013, 9:12:45 AM3/18/13
to
Le souci de l'OCR est qu'il n'est pas fiable à 100%. Par exemple, Il peut
parfois reconnaitre un 1 comme étant un i ou un 7.

Ce que je cherche c'est un logiciel libre qui permettrait directement de
prendre un document PDF avec tableau pour le retranscrire en tableau Excel.
L'information des lignes et colonnes est dans le fichier PDF mais il n'est
pas faisable d'obtenir un tableau en passant par un copier/coller.

FineReader n'est pas une application libre... et vu son tarif autant acheter
un logiciel permettant l'importation de tableau d'un PDF dans Excel.

@+
HD


Stéphane Santon

unread,
Mar 18, 2013, 12:51:44 PM3/18/13
to
Bonjour,

HD a écrit :
> Le souci de l'OCR est qu'il n'est pas fiable à 100%. Par exemple, Il peut
> parfois reconnaitre un 1 comme étant un i ou un 7.

Seulement si le fichier est une image et non un fichier PDF texte.
Ta source est un fichier PDF texte, donc fiable à 100%.

> Ce que je cherche c'est un logiciel libre qui permettrait directement de

Pourquoi libre ??? Tu veux modifier le logiciel ?
Un gratuit ne suffirait pas ?

> prendre un document PDF avec tableau pour le retranscrire en tableau Excel.
> L'information des lignes et colonnes est dans le fichier PDF mais il n'est
> pas faisable d'obtenir un tableau en passant par un copier/coller.

FineReader permet de récupérer un document *en forme de* tableau même
si ce n'est pas un tableau PDF, donc c'est encore mieux.

> et vu son tarif autant acheter
> un logiciel permettant l'importation de tableau d'un PDF dans Excel.

Euh... tu penses à quel logiciel là, parce que c'est plus limité alors.

Après pour le prix, c'est toi qui vois la fréquence d'utilisation et ce
que coûte ton temps de recherche / travail.

HD

unread,
Mar 19, 2013, 12:47:20 PM3/19/13
to
> Seulement si le fichier est une image et non un fichier PDF texte.
> Ta source est un fichier PDF texte, donc fiable � 100%.
Ok, je ne pensais pas qu'il �tait faisable de faire de l'OCR sur du PDF
texte... effectivement, cela fait gagner en fiabilit�. Je pensais � de l'OCR
sur de l'image.

>> Ce que je cherche c'est un logiciel libre qui permettrait directement de
> Pourquoi libre ??? Tu veux modifier le logiciel ?
> Un gratuit ne suffirait pas ?
Oui, effectivement. Mais il existe des logiciels gratuits pour de l'OCR sur
PDF ? J'en ai test� un... mais l'on obtient un fichier avec du texte o� les
donn�es sont m�lang�es par ligne... il n'y a pas de notions de colonnes...

> FineReader permet de r�cup�rer un document *en forme de* tableau m�me si
> ce n'est pas un tableau PDF, donc c'est encore mieux.
Quel est le tarif pour FineReader ? Je viens de voir qu'il y'avait une
version d'�valuation... j'aurais pr�f�r� un logiciel gratuit mais bon si il
n'en existe pas de performants...

@+
HD


Stéphane Santon

unread,
Mar 19, 2013, 1:36:08 PM3/19/13
to
Bonsoir,

HD a ᅵcrit :
>>> Ce que je cherche c'est un logiciel libre qui permettrait directement de
>> Pourquoi libre ??? Tu veux modifier le logiciel ?
>> Un gratuit ne suffirait pas ?
> Oui, effectivement. Mais il existe des logiciels gratuits pour de l'OCR sur
> PDF ? J'en ai testᅵ un... mais l'on obtient un fichier avec du texte oᅵ les
> donnᅵes sont mᅵlangᅵes par ligne... il n'y a pas de notions de colonnes...

C'est pas parce qu'il est libre qu'il est meilleur.

>> FineReader permet de rᅵcupᅵrer un document *en forme de* tableau mᅵme si ce
>> n'est pas un tableau PDF, donc c'est encore mieux.
> Quel est le tarif pour FineReader ? Je viens de voir qu'il y'avait une
> version d'ᅵvaluation... j'aurais prᅵfᅵrᅵ un logiciel gratuit mais bon si il
> n'en existe pas de performants...

J'ai utilisᅵ FineReader 7 et 8 Evaluation pendant 2 ans quand j'ᅵtais
sous XP et que je rᅵinstallais une image de Windows chaque mois, mais
finalement il est tellement bon et je gagnais tellement de temps que
j'ai achetᅵ la Version 11.

Tu peux trouver une version 9 dᅵjᅵ trᅵs bien :
http://www.amazon.fr/Avanquest-FineReader-9-0/dp/B000WI8OX0/ref=sr_1_4?ie=UTF8&qid=1363714246&sr=8-4

--
Stᅵphane

Jeune Chambre Economique de Saintes *** http://www.jce-saintes.org
Agitateurs d'idᅵes... accᅵlᅵrateurs de talents !

Marc Espie

unread,
Apr 13, 2013, 6:08:00 AM4/13/13
to
In article <mn.9c5c7dd3df...@team-santonum.com>,
St�phane Santon <new...@team-santonum.com> wrote:
>Bonsoir,
>
>HD a �crit :
>>>> Ce que je cherche c'est un logiciel libre qui permettrait directement de
>>> Pourquoi libre ??? Tu veux modifier le logiciel ?
>>> Un gratuit ne suffirait pas ?
>> Oui, effectivement. Mais il existe des logiciels gratuits pour de l'OCR sur
>> PDF ? J'en ai test� un... mais l'on obtient un fichier avec du texte o� les
>> donn�es sont m�lang�es par ligne... il n'y a pas de notions de colonnes...
>
>C'est pas parce qu'il est libre qu'il est meilleur.

c'est quoi l'interet de lire fr.comp.applications.libre si vous n'adherez
au principe ethique sous-jacent, a savoir vouloir avoir une base
d'applications dont on a le code source et qu'on peut faire evoluer sans
etre dependant de la boite qui les a produites.

Stéphane Santon

unread,
Apr 13, 2013, 12:38:35 PM4/13/13
to
Bonjour,

Marc Espie a ᅵcrit :
>> C'est pas parce qu'il est libre qu'il est meilleur.
>
> c'est quoi l'interet de lire fr.comp.applications.libre si vous n'adherez
> au principe ethique sous-jacent, a savoir vouloir avoir une base
> d'applications dont on a le code source et qu'on peut faire evoluer sans
> etre dependant de la boite qui les a produites.

Si si, j'adhᅵre, qu'est-ce qui vous fait penser le contraire ?

Mais nombre de visiteurs de ce groupe confondent encore "libre" et
"gratuit". Donc lorsqu'aucun libre ne satisfait l'usager, je fais
prᅵciser si c'est vraiment nᅵcessaire qu'il soit libre, alors qu'un
gratuit leur suffirait parfois.

Et j'aimerais connaᅵtre la proportion d'utilisateurs d'aplications
libres qui modifient rᅵellement le code source...

Bon temps libre ! ;-)

ST

unread,
Apr 13, 2013, 8:54:00 PM4/13/13
to
On 2013-04-13, Stéphane Santon <new...@team-santonum.com> wrote:

> Mais nombre de visiteurs

Tu veux dire ... 2 ?

> Et j'aimerais connaître la proportion d'utilisateurs d'aplications
> libres qui modifient réellement le code source...

L'intéret du Libre ne se limite pas à modifier le code source, c'est
avantage du Libre, mais il y en a d'autres. Par exemple, le fait qu'une
application Libre soit plus facilement portable, même si on ne la porte
pas soit même, c'est quand même très pratique de retrouver les mêmes
outils sur n'importe quel OS.

Les applications Libres sont pérennes, ça a l'air de rien, mais c'est
super important. Je redécouvrais Groff l'autre jour, un formateur de
texte assez puissant, simple à apprendre et très rapide. Ce logiciel est
là parce qu'il est Libre, je doute qu'un logiciel commercial équivalent
en 1980 soit encore disponible pour l'installer sur mon OS X
aujourd'hui.



Michael DENIS

unread,
Apr 14, 2013, 4:28:52 AM4/14/13
to
Bonjour,

Le 13/04/2013 18:38, Stᅵphane Santon a ᅵcrit :
> Et j'aimerais connaᅵtre la proportion d'utilisateurs d'aplications
> libres qui modifient rᅵellement le code source...

Trᅵs certainement proche de zᅵro (%). L'exploration du code sans
modification doit ᅵtre dᅵjᅵ un tout petit peu plus frᅵquente, bien que
"presque personne" que multiplie "quelques individus" doit toujours
donner un rᅵsultat proche de zᅵro (%). :-)

Mais l'intᅵrᅵt du libre me semble bien plus important que ᅵa, mᅵme si je
suis trᅵs loin d'ᅵtre un spᅵcialiste de la question. De ce que j'ai pu
en voir, le (relativement) rᅵcent exemple du rachat de Sun par Oracle et
de ce qui s'est passᅵ ensuite avec OpenOffice/LibreOffice me semble une
trᅵs belle illustration de l'open source et de son trᅵs grand intᅵrᅵt.

Et d'autres exemples existent sᅵrement.

--
Michaᅵl DENIS
Message has been deleted

ST

unread,
Apr 14, 2013, 10:31:52 AM4/14/13
to
On 2013-04-14, Eric Demeester <neu...@grosnaze.org.invalid> wrote:

> J'ai un copain qui utilise un netbook (petit écran). Et bien, à force de
> ne pas faire attention, les barres diverses et variées incrustées dans
> son navigateur utilisent les deux tiers de l'espace d'affichage,
> pourtant déjà riquiqui.

En même temps, quitte à utiliser des logiciels Libres, autant les faire
tourner sur un OS Libre comme Linux. OS sur le quel je n'ai jamais vu ce
type de problème.

Sur OS X non plus, d'ailleurs.

Marc Espie

unread,
Apr 15, 2013, 2:19:07 PM4/15/13
to
In article <pialm8t8kl8k4355s...@4ax.com>,
Eric Demeester <eric.RE...@mailody.org> wrote:
>Par contre, concernant les logiciels libres, je trouve cette pratique
>plus douteuse. Au moins pourraient-ils ne pas inclure ces publictés par
>défaut, mais les proposer en expliquant qu'en les acceptant, on apporte
>une aide finacière aux développeurs.

Parfois, faut se bagarrer un peu.

Suis tombe recemment sur deux logiciels libres avec zero lien de download
sans inscription, OpenERP etant celui dont je me souviens.

Vu sa licence, ca donne une tres furieuse envie de construire un miroir
de telechargement totalement ouvert... C'est du AGPL, donc il est totalement
legal de prendre la distribution, et de la poser ailleurs.

Tulle2008

unread,
Sep 1, 2013, 3:01:31 PM9/1/13
to
Réponse très tardive (pb probablement résolu). En très peu de clics, j'
ai obtenu un résultat acceptable, en allant ici:
http://www.freepdfconvert.com/pdf-excel#

> @+
> HD
>
>
>


HD

unread,
Sep 4, 2013, 2:51:06 AM9/4/13
to
> Réponse très tardive (pb probablement résolu).
> En très peu de clics, j'ai obtenu un résultat
> acceptable, en allant ici:
> http://www.freepdfconvert.com/pdf-excel

Mais niveau confidentialité l'on ne sait pas de ce qu'ils font de nos
fichiers...

@+
HD


0 new messages