Jak často se to má spouštět? Jak velký ten soubor je? V jakém kódování je?
S jakou verzí Pythonu to má fungovat?
Pokud je na jednom řádku zápis celého slovníku, normálně bych
z toho udělal slovník (eval) a nedělal bych si s tím těžkou hlavu.
Pokud se to nemá provádět velmi intenzivně, nemá smysl se
zabývat optimalizacemi.
Něco takového:
>>> a = "{'a': 1, 'b': 2}"
>>> a
"{'a': 1, 'b': 2}"
>>> d = eval(a)
>>> d
{'a': 1, 'b': 2}
>>>
Petr
To skoro vypada, jako JSON format, na ktery existuji parsery (I
primo v Pythonu). 6000 znaku nema smysl nijak optimalizovat, to je
zbytecna ztrata casu.
Mrkni se, jestli to nepujde parsovat pres JSON. Evil je zlo, hojne
pouzivane v JS a PHP, v Pythonu jsem ho (nastesti) snad nikdy nevidel.
Jirka
> _______________________________________________
> Python mailing list
> Pyt...@py.cz
> http://www.py.cz/mailman/listinfo/python
>
"Zlo" se v pythonu jmenuje exec() :-)
A vida, diky za opravu :) Mea culpa :)
Jirka
Proti importom, builtin namespace atd sa daju zabezpecit obe. Nekonecny
cyklus, nekonecna rekurzia, vsetko sa da spravit aj v eval aj v exec.
Jediny rozdiel je v tom, ze jeden vykonava vyrazy a jeden prikazy.
Jan Janech
On 05/05/10 11:49, Hynek Fabian wrote:
> Jirka Vejrazka (st�eda 05 Kv�ten 2010 10:33:39):
>> Mrkni se, jestli to nepujde parsovat pres JSON. Evil je zlo, hojne
>> pouzivane v JS a PHP, v Pythonu jsem ho (nastesti) snad nikdy nevidel.
> D�l�m to nerad, ale mus�m se evalu zastat. Narozd�l od PHP v pythonu eval()
> nese�ere libovoln� k�d, ale pouze vyhodnot� v�raz. A kdy� se mu podstr��
> nedefaultn� jmenn� prostory, m�l by b�t dostate�n� izolovan�.
>
> "Zlo" se v pythonu jmenuje exec() :-)
> _______________________________________________
> Python mailing list
> Pyt...@py.cz
> http://www.py.cz/mailman/listinfo/python
>
>
>
--
____________________________
Ing. Jan Janech
Katedra softverovych technologii
Fakulta riadenia a informatiky
Zilinska Univerzita
pokud to vypadá jako JSON, asi nejlepší bude použít na to nějakou
knihovnu, jak už tu zaznělo. Další zmíněná možnost, eval, se mi moc
nelíbí.
Načítat do paměti bych se to nebál, 6 kB není zase tolik.
Kdyby to ale náhodou JSON nebyl, pak přeji příjemnou zábavu :)
Poslední dobou se objevují docela šikovné knihovny na parsování textu
pomocí zadané gramatiky, např. malá ukázka pro slovník:
http://gist.github.com/390687
Samozřejmě další možností je použít na obsah souboru regulární výraz,
pokud je to možné.
PM
2010/5/5 Tomas Hnizdil <toma...@gmail.com>:
> Hezky den,
> jelikoz s pythonem nemam zas tak moc zkusenosti, napadlo me, ze udelam
> takovy maly brainstorming, nez se pustim do prace.
> Mam soubor, ve kterem mam textova data ve formatu dictionary tj. '{'KLIC':
> 'hodnota', ...... {'SUBSLOVNIK': 'hodnota' ....} ...}
> Potrebuji zjistit hodnotu dvou klicu, ktere jsou umitsteny skoro na konci
> toho slovniku. Vsechno je to ulozeno jako jedna radka a ma to v prumeru 6000
> znaku, prijde mi proto neefektivni to cist od zacatku a navic to nacitat
> cele do pameti, python ma spoustu sikovnych funkci, o kterych nevim, proto
> se ptam, zda to jde udelat nejak lepe ...
>
> ... staci odkaz, na ktery jsem nenarazil, necekam step by step navod - vazim
> si vaseho casu :).
>
> diky
> Tom
>
No, kdyby na to doslo, da se samozrejme pouzit pyparsing, ale je to
trochu kanon na vrabce :)
Jirka
eval(x, {}, {})
Jakým X se dá z takové konstrukce utéci?
2010/5/5 Hynek Fabian <hynek....@firma.seznam.cz>:
Petr Messner (středa 05 Květen 2010 14:37:20):
staci nieco taketo:
>>> eval(superNebezpecnyKod, {'__builtins__': {}}, {})
alebo
>>> exec superNebezpecnyKod in {'__builtins__': {}}, {}
zavisi ale od toho, akym situaciam sa chcete vyhnut.
coho sa nezbavite (ani evalom) je napr nekonecna rekurzia:
>>> superNebezpecnyKod='(lambda x=(lambda y: y(y)): x(x))()'
to az tak neboli, ak nemate povolenu nejaku prilis hlboku uroven rekurzie.
co tak ale nekonecny cyklus?
>>> superNebezpecnyKod='(lambda x=[1]: [x.append(1) for i in x])()'
alebo supernarocne operacie?
>>> superNebezpecnyKod='2**10000000000000000'
vela stastia pri vyuzivani evalu a execu :D
Jan Janech
On 05/05/10 14:26, Hynek Fabian wrote:
> Jan Janech (st�eda 05 Kv�ten 2010 13:08:49):
>> Dovolim si oponovat. Vsetko co sa da v pythone v exec spravit pre
>> narusenie bezpecnosti sa da spravit aj v eval.
> Jak?
>
> eval(x, {}, {})
>
> Jak�m X se d� z takov� konstrukce ut�ci?
> _______________________________________________
> Python mailing list
> Pyt...@py.cz
> http://www.py.cz/mailman/listinfo/python
>
>
>
2010/5/5 Jan Janech <de...@atlas.sk>:
> Potesim Vas, z evalu ani z execu sa pokial mi je znamo utiect neda. Teda ak
> to clovek vie spravit.
>
> staci nieco taketo:
>
>>>> eval(superNebezpecnyKod, {'__builtins__': {}}, {})
>
> alebo
>
>>>> exec superNebezpecnyKod in {'__builtins__': {}}, {}
>
> zavisi ale od toho, akym situaciam sa chcete vyhnut.
>
> coho sa nezbavite (ani evalom) je napr nekonecna rekurzia:
>
>>>> superNebezpecnyKod='(lambda x=(lambda y: y(y)): x(x))()'
>
> to az tak neboli, ak nemate povolenu nejaku prilis hlboku uroven rekurzie.
>
> co tak ale nekonecny cyklus?
>
>>>> superNebezpecnyKod='(lambda x=[1]: [x.append(1) for i in x])()'
>
> alebo supernarocne operacie?
>
>>>> superNebezpecnyKod='2**10000000000000000'
>
> vela stastia pri vyuzivani evalu a execu :D
>
> Jan Janech
>
>
> On 05/05/10 14:26, Hynek Fabian wrote:
>>
>> Jan Janech (středa 05 Květen 2010 13:08:49):
>>>
>>> Dovolim si oponovat. Vsetko co sa da v pythone v exec spravit pre
>>> narusenie bezpecnosti sa da spravit aj v eval.
>>
>> Jak?
>>
>> eval(x, {}, {})
>>
>> Jakým X se dá z takové konstrukce utéci?
list(xrange(10000000000000))
neviem kolko nul tam moze byt, aby to zobralo. Toto som skusil ked som
pisal predchadzajuci mail. Potom som ho musel pisat znovu, lebo mi linux
zabil thunderbird pre nedostatok pamate.
Viem, ze ak sa to spravi spravne, nemozem v eval a exec pouzivat ziadne
fcie (ani list, ani xrange), takze hentak uplne to napisat nepojde. Ale
verim, ze niekde na svete existuje vacsi borec ako ja ( :-D ) a ten to
dokaze takyto problem vytvorit aj so standardnymi prvkami jazyka.
Jan Janech
On 05/05/10 15:27, Jakub Z�ka wrote:
> Na Linuxu bych se proti p�et�en� procesoru br�nil tak, �e bych
> spustil skript jako samostatnďż˝ proces (napďż˝. modul multiprocessing
> nebo subprocess) a pak bych mu pos�lal sign�ly SIGSTOP a SIGCONT p�es
> funkci os.kill(pid, sig). Kdyby mi p�ipadalo, �e u� b�� n�jak moc
> dlouho, prost� bych ho vypnul p�es sign�l TERM, pokud by nereagoval
> (mysl�m, �e se to m�e st�t, kdy� po��t� nap�. 100000**10000000), tak
> sign�l KILL. Proto�e by u�ivatel nemohl zm�nit chov�n� p�i p�ijet�
> sign�l� (proto�e by nemohl importovat pot�ebn� modul), m�lo by to
> fungovat celkem spolehliv�. Maxim�ln� velikost pou�it� pam�ti lze
> omezit p�es modul resource.
>
> 2010/5/5 Jan Janech<de...@atlas.sk>:
>> Potesim Vas, z evalu ani z execu sa pokial mi je znamo utiect neda. Teda ak
>> to clovek vie spravit.
>>
>> staci nieco taketo:
>>
>>>>> eval(superNebezpecnyKod, {'__builtins__': {}}, {})
>>
>> alebo
>>
>>>>> exec superNebezpecnyKod in {'__builtins__': {}}, {}
>>
>> zavisi ale od toho, akym situaciam sa chcete vyhnut.
>>
>> coho sa nezbavite (ani evalom) je napr nekonecna rekurzia:
>>
>>>>> superNebezpecnyKod='(lambda x=(lambda y: y(y)): x(x))()'
>>
>> to az tak neboli, ak nemate povolenu nejaku prilis hlboku uroven rekurzie.
>>
>> co tak ale nekonecny cyklus?
>>
>>>>> superNebezpecnyKod='(lambda x=[1]: [x.append(1) for i in x])()'
>>
>> alebo supernarocne operacie?
>>
>>>>> superNebezpecnyKod='2**10000000000000000'
>>
>> vela stastia pri vyuzivani evalu a execu :D
>>
>> Jan Janech
>>
>>
>> On 05/05/10 14:26, Hynek Fabian wrote:
>>>
>>> Jan Janech (st�eda 05 Kv�ten 2010 13:08:49):
>>>>
>>>> Dovolim si oponovat. Vsetko co sa da v pythone v exec spravit pre
>>>> narusenie bezpecnosti sa da spravit aj v eval.
>>>
>>> Jak?
>>>
>>> eval(x, {}, {})
>>>
>>> Jak�m X se d� z takov� konstrukce ut�ci?
>>> import resource
>>> resource.setrlimit(resource.RLIMIT_AS, (20000000, 20000000))
>>> a = []
>>> while True: a.append(1000)
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
MemoryError
>>>
btw. Váš příklad mi nefungoval, asi tam bylo moc nul. Prej to nejde
zkonvertovat na integer. Nebo máte 64-bit procesor?
2010/5/5 Jan Janech <de...@atlas.sk>:
> Ak myslite, ze je to take jednoduche, skuste si spustit,
>
> list(xrange(10000000000000))
>
> neviem kolko nul tam moze byt, aby to zobralo. Toto som skusil ked som pisal
> predchadzajuci mail. Potom som ho musel pisat znovu, lebo mi linux zabil
> thunderbird pre nedostatok pamate.
>
> Viem, ze ak sa to spravi spravne, nemozem v eval a exec pouzivat ziadne fcie
> (ani list, ani xrange), takze hentak uplne to napisat nepojde. Ale verim, ze
> niekde na svete existuje vacsi borec ako ja ( :-D ) a ten to dokaze takyto
> problem vytvorit aj so standardnymi prvkami jazyka.
>
> Jan Janech
>
> On 05/05/10 15:27, Jakub Zíka wrote:
>>
>> Na Linuxu bych se proti přetížení procesoru bránil tak, že bych
>> spustil skript jako samostatný proces (např. modul multiprocessing
>> nebo subprocess) a pak bych mu posílal signály SIGSTOP a SIGCONT přes
>> funkci os.kill(pid, sig). Kdyby mi připadalo, že už běží nějak moc
>> dlouho, prostě bych ho vypnul přes signál TERM, pokud by nereagoval
>> (myslím, že se to může stát, když počítá např. 100000**10000000), tak
>> signál KILL. Protože by uživatel nemohl změnit chování při přijetí
>> signálů (protože by nemohl importovat potřebný modul), mělo by to
>> fungovat celkem spolehlivě. Maximální velikost použité paměti lze
>> omezit přes modul resource.
>>
>> 2010/5/5 Jan Janech<de...@atlas.sk>:
>>>
>>> Potesim Vas, z evalu ani z execu sa pokial mi je znamo utiect neda. Teda
>>> ak
>>> to clovek vie spravit.
>>>
>>> staci nieco taketo:
>>>
>>>>>> eval(superNebezpecnyKod, {'__builtins__': {}}, {})
>>>
>>> alebo
>>>
>>>>>> exec superNebezpecnyKod in {'__builtins__': {}}, {}
>>>
>>> zavisi ale od toho, akym situaciam sa chcete vyhnut.
>>>
>>> coho sa nezbavite (ani evalom) je napr nekonecna rekurzia:
>>>
>>>>>> superNebezpecnyKod='(lambda x=(lambda y: y(y)): x(x))()'
>>>
>>> to az tak neboli, ak nemate povolenu nejaku prilis hlboku uroven
>>> rekurzie.
>>>
>>> co tak ale nekonecny cyklus?
>>>
>>>>>> superNebezpecnyKod='(lambda x=[1]: [x.append(1) for i in x])()'
>>>
>>> alebo supernarocne operacie?
>>>
>>>>>> superNebezpecnyKod='2**10000000000000000'
>>>
>>> vela stastia pri vyuzivani evalu a execu :D
>>>
>>> Jan Janech
>>>
>>>
>>> On 05/05/10 14:26, Hynek Fabian wrote:
>>>>
>>>> Jan Janech (středa 05 Květen 2010 13:08:49):
>>>>>
>>>>> Dovolim si oponovat. Vsetko co sa da v pythone v exec spravit pre
>>>>> narusenie bezpecnosti sa da spravit aj v eval.
>>>>
>>>> Jak?
>>>>
>>>> eval(x, {}, {})
>>>>
>>>> Jakým X se dá z takové konstrukce utéci?
hm resource modul som nepoznal, mozno by to slo vyriesit nejak takto.
Osobne ale radsej pouzijem eval a exec iba tam, kde ma bezpecnost az tak
nepali. Mam ich sice rad, ale urcite to nie je laska bez hranic.
> btw. V� p��klad mi nefungoval, asi tam bylo moc nul. Prej to nejde
> zkonvertovat na integer. Nebo m�te 64-bit procesor?
hej mam 64bit procesor. Ale ako som pisal, neviem kolko nul to este
zozerie a skusat to nebudem (zase by mi to pozabijalo vsetko mozne :-D )
Ten resource modul ale urcite niekedy vyskusam, ked budem mat viac casu,
ze ci to pomoze aj v takychto situaciach.
Jan Janech
Petr Messner
>pokud to vypadá jako JSON, asi nejlepší bude použít na to nějakou
>knihovnu, jak už tu zaznělo. Další zmíněná možnost, eval, se mi moc
>nelíbí.
Do stohu bych se sirkama taky nelezl a dětem bych nedával ostrý nůž na hraní.
Je to záležitost volby. Pokud jde o utilitku "narychlo", pro vlastní potřebu,
je podle mě použití eval() bez problémů.
Nebezpečnost eval() je úzce spojená se znalostí jeho vstupu.
Pokud jsem schopen ohlídat, že tam nic špatného nepronikne,
je to OK. Záleží na tom, kdo ten zpracovávaný soubor připravuje.
Je jasné, že do webové služby by se to cpát nemělo.
Modul json je od Python 2.6 mezi standardními moduly.
Mějte se fajn,
Petr
Tak to je odpoved, az srdecko zaplesalo :-D
Myslim, ze je na case zavest soutez o prispevek mesice...
V.