Selam,
http://packages.python.org/openpyxl/�denediniz mi ? Baz� dosyalar xlsx format�nda oluyor, xlrd de onlar� a�am�yor.
Kolay gelsin.
2012/12/24 Timucin Kizilay <timucin...@gmail.com>
�
xlrd k�t�phanesi ile excel dosyalar�n� okuyup i�indeki verileri veritaban�na aktar�yorum.
Gelen bir ka� excel dosyas�nda �u hatay� ald�m:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '\xef\xbb\xbf<?xml'
excel dosyas�n� gedit ile a�t���mda i�eri�inin xml oldu�unu g�rd�m.
dosyan�n ilk bir ka� sat�r� a�a��da:
<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
<Author>XXXX</Author>
<LastAuthor>XXXXXXXXXXX</LastAuthor>
<Created>2012-12-21T14:30:41Z</Created>
<Version>14.00</Version>
</DocumentProperties>
---------------------------
Bu dosyalar� bir web uygulamas� olu�turuyor ve web uygulamas�ndan indirilen .xls uzant�l� dosyay� libreoffice ile a��nca sorunsuz a��l�yor. Windows makinalarda msoffice ile de d�zg�n a��l�yor ama python ile a��p i�lemek i�in bir library bulamad�m. xlrd ise ofis2010 dosyalar�n� bile tan�mas�na ra�men bu tip dosyalar� a�am�yor. Bu tip dosyalarla kar��la�anlar python ile i�lemek i�in ne kullan�yorlar merak ettim.
Selam,
openpyxl de denedim, sonuç aynı.
xlrd son versiyonu .xlsx uzantılı office 2010 dosyalarını da açabiliyor. Benim sorunum gelen .xls dosyasının aslında xls dosyası değil xml dosyası olması. Bir şekilde openoffice ve msoffice bu dosyaları normal xls dosyası gibi açıyor ama xlrd ile açılmıyor.
Belki bu tipte dosyaları açan başka bir library vardır diye araştırıyorum, yoksa xml parse edip içinden verileri çekmekle uğraşmak zorunda kalacağım. çok uğraştırmayan bir xml parser library ne tavsiye edersiniz?
On 24-12-2012 19:16, Deniz Kurucu wrote:
Selam,
http://packages.python.org/openpyxl/ denediniz mi ? Bazı dosyalar xlsx formatında oluyor, xlrd de onları açamıyor.
xlrd kütüphanesi ile excel dosyalarını okuyup içindeki verileri veritabanına aktarıyorum.
Gelen bir kaç excel dosyasında şu hatayı aldım:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '\xef\xbb\xbf<?xml'
excel dosyasını gedit ile açtığımda içeriğinin xml olduğunu gördüm.
dosyanın ilk bir kaç satırı aşağıda:
<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
<Author>XXXX</Author>
<LastAuthor>XXXXXXXXXXX</LastAuthor>
<Created>2012-12-21T14:30:41Z</Created>
<Version>14.00</Version>
</DocumentProperties>
---------------------------