Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Wsadowa aktualizacja plików xml

17 views
Skip to first unread message

ape...@gmail.com

unread,
Aug 6, 2012, 4:39:43 AM8/6/12
to
Witam wszystkich.

Jak można zrealizować następującą kwestię

Potrzebuje przerobić ok 50 plików typu:
koj_opje_ADM_A.xml
oj_adad_ADM_A.xml
...

które zawierają w swojej treśći znacznik <ID>1234</ID>

Po przeróbce w znaczniku powinno dopisać się pewna stała, część nazwy pliku i parametr oraz to co było. Plik po przeróbce powinien wyglądać jak w przykładzie

jest: <ID>1234</ID>

ma być: <ID>stała.ADM_A.parametr.1234</ID>

Proszę o informacje jak to najlepiej zrealizować. Pliki xml mogą być rozmiaru do 1 GB.

Pozdrawiam
Andrzej.

TOUDIdel

unread,
Aug 6, 2012, 4:47:54 AM8/6/12
to
Najprościej i najszybciej to byłoby DOM-em w prostym skrypcie
JavaScript. Ale załadowanie do DOM-a pliku o wielkości 1 GB pewnie go
rozłoży na łopatki. Wtedy zostaje SAX.

-- td

W dniu 06.08.2012 10:39, ape...@gmail.com pisze:

ape...@gmail.com

unread,
Aug 6, 2012, 5:31:32 AM8/6/12
to
W dniu poniedziałek, 6 sierpnia 2012 10:47:54 UTC+2 użytkownik TOUDIdel napisał:
> Najprościej i najszybciej to byłoby DOM-em w prostym skrypcie
>
> JavaScript. Ale załadowanie do DOM-a pliku o wielkości 1 GB pewnie go
>
> rozłoży na łopatki. Wtedy zostaje SAX.
>
Czy SAX wymaga jakiegoś środowiska? Jakiego?

TOUDIdel

unread,
Aug 6, 2012, 9:48:34 AM8/6/12
to
W dniu 06.08.2012 11:31, ape...@gmail.com pisze:
> Czy SAX wymaga jakiego� �rodowiska? Jakiego?

Implementacje SAX-a znajdziesz chyba na ka�dy system operacyjny i
wi�kszo�� j�zyk�w programowania
--
td

mindc.net

unread,
Feb 6, 2013, 3:49:54 AM2/6/13
to
> Jak można zrealizować następującą kwestię
>
> Potrzebuje przerobić ok 50 plików typu:
> koj_opje_ADM_A.xml
> oj_adad_ADM_A.xml
> ...
> które zawierają w swojej treśći znacznik<ID>1234</ID>
> Po przeróbce w znaczniku powinno dopisać się pewna stała, część nazwy pliku i parametr oraz to co było. Plik po przeróbce powinien wyglądać jak w przykładzie
>
> jest:<ID>1234</ID>
> ma być:<ID>stała.ADM_A.parametr.1234</ID>

Ja bym to zrobił sedem.
Jeżeli część nazwy pliku jest niezmienna 'ADM_A' to:

STALA='stala';
PARAMETR='parametr1';
sed -re "s#<ID>([0-9]+)</ID>#<ID>${STALA}.ADM_A.${PARAMETR}.\1</ID>#" -i
./*ADM_A.xml

pozdrawiam
mindc.net

TOUDIdel

unread,
Feb 6, 2013, 7:35:40 AM2/6/13
to
W dniu 06.02.2013 09:49, mindc.net pisze:
> Ja bym to zrobił sedem.
> Jeżeli część nazwy pliku jest niezmienna 'ADM_A' to:
>
> STALA='stala';
> PARAMETR='parametr1';
> sed -re "s#<ID>([0-9]+)</ID>#<ID>${STALA}.ADM_A.${PARAMETR}.\1</ID>#" -i
> ./*ADM_A.xml

da się :) ale xml mentalnie nie jest plikiem tekstowym

--
td

Sylwester Zarębski

unread,
Feb 6, 2013, 12:39:16 PM2/6/13
to
Dnia Wed, 06 Feb 2013 13:35:40 +0100, TOUDIdel napisaďż˝(a):

[...]
> da siďż˝ :) ale xml mentalnie nie jest plikiem tekstowym

A kto� m�wi�, �e sed nadaje si� tylko do tekstowych? Ka�dy plik si�
nadaje pod warunkiem sensowno�ci u�ycia z wyra�eniem regularnym.

P.S. Zreszt� XML to jest przede wszystkim tekst, a dopiero wt�rnie
"struktura".

--
pozdrawiam
Sylwester Zar�bski

Aby wys�a� email zmie� zbieracz w adresie na sylwek

szomiz

unread,
Feb 7, 2013, 7:06:16 AM2/7/13
to
U�ytkownik "Sylwester Zar�bski" <zbie...@isp.net.pl> napisa� w wiadomo�ci
news:cym38wd27a0u$.1sea5y4e5h3zj.dlg@40tude.net...

> P.S. Zreszt� XML to jest przede wszystkim tekst, a dopiero wt�rnie
> "struktura".

HTML tez, a jednak document.write uwazany jest za szczyt obciachu.

sz.


Sylwester Zarębski

unread,
Feb 7, 2013, 2:19:14 PM2/7/13
to
Dnia Thu, 7 Feb 2013 13:06:16 +0100, szomiz napisaďż˝(a):

> U�ytkownik "Sylwester Zar�bski" <zbie...@isp.net.pl> napisa� w wiadomo�ci
> news:cym38wd27a0u$.1sea5y4e5h3zj.dlg@40tude.net...
>> P.S. Zreszt� XML to jest przede wszystkim tekst, a dopiero wt�rnie
>> "struktura".
> HTML tez, a jednak document.write uwazany jest za szczyt obciachu.

Co nie przeszkadza, aby HTML, XML, SGML, sesja SMTP i wiele innych by�o
tekstem. To jest FAKT, bo z gustami nie zamierzam dyskutowaďż˝.

szomiz

unread,
Feb 10, 2013, 4:30:35 AM2/10/13
to

Użytkownik "Sylwester Zarębski" <zbie...@isp.net.pl> napisał w wiadomości
news:1c5ay9vqedsvq.dtom3qlzzmqp$.dlg@40tude.net...
> Dnia Thu, 7 Feb 2013 13:06:16 +0100, szomiz napisał(a):
>
>> Użytkownik "Sylwester Zarębski" <zbie...@isp.net.pl> napisał w
>> wiadomości
>> news:cym38wd27a0u$.1sea5y4e5h3zj.dlg@40tude.net...
>>> P.S. Zresztą XML to jest przede wszystkim tekst, a dopiero wtórnie
>>> "struktura".
>> HTML tez, a jednak document.write uwazany jest za szczyt obciachu.
>
> Co nie przeszkadza, aby HTML, XML, SGML, sesja SMTP i wiele innych było
> tekstem. To jest FAKT, bo z gustami nie zamierzam dyskutować.

Od czasu UTF-a tekst juz nie jest tekstem. Ale to, rozumiem, dopiero przy
doktoracie bedzie.

sz.


Sylwester Zarębski

unread,
Feb 10, 2013, 8:04:09 AM2/10/13
to
Dnia Sun, 10 Feb 2013 10:30:35 +0100, szomiz napisaďż˝(a):

> U�ytkownik "Sylwester Zar�bski" <zbie...@isp.net.pl> napisa� w wiadomo�ci
> news:1c5ay9vqedsvq.dtom3qlzzmqp$.dlg@40tude.net...
>> Co nie przeszkadza, aby HTML, XML, SGML, sesja SMTP i wiele innych by�o
>> tekstem. To jest FAKT, bo z gustami nie zamierzam dyskutowaďż˝.
> Od czasu UTF-a tekst juz nie jest tekstem. Ale to, rozumiem, dopiero przy
> doktoracie bedzie.

Zabawne. Jaki� pow�d? Hint: kodowanie nie ma znaczenia i nigdy nie
mia�o.

P.S. Jeszcze jakbyďż˝ podaďż˝ UTF-16, no, to bym rozumiaďż˝ twďż˝ niewiedzďż˝, ale
przy UTF-8?

szomiz

unread,
Feb 10, 2013, 9:17:46 AM2/10/13
to
Użytkownik "Sylwester Zarębski" <zbie...@isp.net.pl> napisał w wiadomości
news:algmeakqhyni.1v405zwemfe0z$.dlg@40tude.net...

> Zabawne. Jakiś powód? Hint: kodowanie nie ma znaczenia i nigdy nie
> miało.

Przy partackim traktowaniu xml-a jako stringa (a do tego sie odnioslem) -
ma. I to duze.

> P.S. Jeszcze jakbyś podał UTF-16, no, to bym rozumiał twą niewiedzę, ale
> przy UTF-8?

Bylbym bluznal, ale poczekam az zycie zweryfikuje twoja (z malej, bo
zaproponowales taka konwencje...).

EOT.

sz.


Sylwester Zarębski

unread,
Feb 10, 2013, 3:19:31 PM2/10/13
to
Dnia Sun, 10 Feb 2013 15:17:46 +0100, szomiz napisał(a):

> Użytkownik "Sylwester Zarębski" <zbie...@isp.net.pl> napisał w wiadomości
> news:algmeakqhyni.1v405zwemfe0z$.dlg@40tude.net...
>> Zabawne. Jakiś powód? Hint: kodowanie nie ma znaczenia i nigdy nie
>> miało.
> Przy partackim traktowaniu xml-a jako stringa (a do tego sie odnioslem) -
> ma. I to duze.

Tekst to tekst, nie ma nic wspólnego z implementacją, czy kodowaniem.

Z Wikipedii PL: Plik tekstowy (ang.) text file – plik zawierający dane w
postaci alfanumerycznej.

Z Wikipedii EN: At a generic level of description, there are two kinds
of computer files: text files and binary files.

Szczególne zastosowania tekstu i strukturyzacja w celu osiągnięcia
pewnego celu nie zmienia faktu, że plik czy strumień jest tekstowym.
Nie ma znaczenia również fakt, że pewne narzędzia (jak regexp) mogą być
niepomocne w przeglądaniu takiego pliku, bo gdy znamy strukturę to
możemy dopasować/dobrać narzędzie.
Jednakże nadal nie zmienia to faktu, że XML czy inne to tekst (patrz np.
uproszczona definicja Wikipedii).

--
pozdrawiam
Sylwester Zarębski

Aby wysłać email zmień zbieracz w adresie na sylwek
0 new messages