Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.

Dismiss

no i co z tymi algorytmami genetycznymi?

3 views

Skip to first unread message

Mariusz Marszałkowski

unread,

Oct 21, 2009, 8:52:05 PM10/21/09

Powitać

Jest dana macierz M, co ma R wierszy i C kolumn.
Kolumny mają średnio V różnych wartości.
Jest dana funkcja F odwzorowująca iloczyn kartezjański
wierszy i klas RxK w zbiór liczb całkowitych.

Szukane: drzewo klasyfikujące, binarne, składające się z N węzłów
decyzyjnych (i N+1 liści), które przypisze wierszom takie klasy,
alby
suma F po wszystkich wierszach była bliska maksymalnej.

Upraszczając, warunki w węzłach drzewa ograniczmy do M_ij <= C_j,
gdzie C_j jest jedną z wartości kolumny j.
Kolejne uproszczenie, niech drzewo składa się tylko z jednego
węzła N=1 decyzyjnego i dwóch liści.

Podejście bardzo naiwne:
1) Weź wszystkie warunki, których jest VxC
2) Każdy warunek sprawdź na wszystkich rekordach R, czyli
VxCxR operacji
3) Uwzględnij wszystkie kombinacje liści: K^(N+1)=KxK, razem
VxCxRxKxK operacji

Podejście mniej naiwne:
1) Zbuduj sumy częściowe F dla każdej wartości w kolumnie i dla
każdego sposobu przypisania jej do klasy: CxRxK operacji
2) Posortuj sumy częsciowe po wartościach kolumny, mamy
Cx(RxK+V*LG(V)) operacji
3) Wybierz maksymalną sumę sum częściowych dla kombinacji
klas (liści), mamy Cx(RxK+VxLg(V)+VxK) operacji

Porównujemy jeden wzór z drugim:
Cx(RxK+VxLg(V)+VxK)
----------------------------------
VxCxRxKxK

Co w przybliżeniu równa się:
R + V*Lg(V) + V
------------------------
VxRxK

1 Lg(V) 1
----- + ---------- + ---------
VxK RxK RxK

Dla dużej ilości rekordów można zaokrąglić do
1
-----
VxK

Co przykładowo przy 5 klasach i 50 wartościach
w kolumnie daje około: 1/50/5, czyli jedną dwieście
pięćdziesiątą czasu wykonania "algorytmu bardzo
naiwnego". Jeśli drzewo ma więcej węzłów niż
jeden, stosunek obu czasów wykonania maleje
wykładniczo.

Jak działa algorytm genetyczny na dwóch
powyżej opisanych algorytmów? Otóż działa
tak jak pierwszy, czyli "bardzo naiwny". Algorytm
genetyczny losuje (poniekąd to nie jest losowanie,
ale inteligentny dobór) kombinacje reguł dla
drzewa decyzyjnego a następnie testuje drzewo
na wszystkich rekordach.

Uważam że porównanie czasów obu algorytmów
stawia algorytm genetyczny w bardzo niekorzystnej
sytuacji. Testy które wykonałem zdają się to
potwierdzać. W zależności od danych, dobrym
algorytmem wyczerpującego przeszukania da
się zbudować optymalne drzewo decyzyjne
składające się 2-4 węzłowe. Algorytmem
genetycznym też można, ale znalezienie równie
dobrego rozwiązania przez algorytm genetyczny w
tym samym czasie, jest znacznie mniej prawdopodobne,
właśnie rzędu (1/250)^2 - (1/250)^4.

Pozdrawiam serdecznie

Filip Sielimowicz

unread,

Oct 22, 2009, 5:39:41 AM10/22/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci
news:65951300-fad8-4492...@g23g2000vbr.googlegroups.com...

>Jak dziaďż˝a algorytm genetyczny na dwďż˝ch
>powyďż˝ej opisanych algorytmďż˝w? Otďż˝ dziaďż˝a

>tak jak pierwszy, czyli "bardzo naiwny". Algorytm

>genetyczny losuje (poniekďż˝d to nie jest losowanie,
>ale inteligentny dobďż˝r) kombinacje reguďż˝ dla
>drzewa decyzyjnego a nastďż˝pnie testuje drzewo
>na wszystkich rekordach.

Zastosowaďż˝eďż˝ naiwny AG (naiwne kodowanie i naiwna
funkcja oceny) - to masz wynik, jaki masz ;)))

Mariusz Marszałkowski

unread,

Oct 22, 2009, 6:27:18 AM10/22/09

On 22 Paź, 11:39, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:

> Zastosowałeś naiwny AG (naiwne kodowanie i naiwna

> funkcja oceny) - to masz wynik, jaki masz ;)))

Zaproponuj lepszy AG.
Pozdrawiam

Filip Sielimowicz

unread,

Oct 22, 2009, 6:39:31 AM10/22/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci

news:d824d3b8-0e3e-40ab...@l31g2000vbp.googlegroups.com...
On 22 Paďż˝, 11:39, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:

> Zastosowaďż˝eďż˝ naiwny AG (naiwne kodowanie i naiwna

> funkcja oceny) - to masz wynik, jaki masz ;)))

Wiesz - moďż˝e ja czegoďż˝ nie rozumiem - ale moim zdaniem
nie opisaďż˝eďż˝ w jaki sposďż˝b zbudowaďż˝eďż˝ chromosom,
jak wyglďż˝daďż˝o krzyďż˝owanie i jak funkcja oceny.
Masz liniowy chromosom, w ktďż˝ry wrzucasz na sztywno
wszystkie wspďż˝czynniki z wďż˝zďż˝ďż˝w drzewa decyzyjnego ?

Istotďż˝ AG jest skďż˝adanie rozwiďż˝zania z kombinacji rozwiďż˝zaďż˝
czďż˝stkowych. Czy u Ciebie wymiana fragmentďż˝w chromosomďż˝w
zawierajacych rozwiďż˝zania 'dobre' daje prawdopodobieďż˝stwo
uzyskania rozwiďż˝zania 'lepszego' wyraďż˝nie wiďż˝ksze niďż˝ krzyďż˝owanie
dowolnych innych chromosomďż˝w, czy takie samo ?

Przy opisie dwďż˝ch rozwiďż˝zaďż˝ dokonaďż˝eďż˝ jakiejďż˝ obserwacji
dot. problemu zwiďż˝zanej z liczeniem sum czďż˝ciowych - i tďż˝
wiedzďż˝ zaszyďż˝eďż˝ w drugim algorytmie. Czy tďż˝ obserwacjďż˝
zastosowaďż˝es w AG ? Moďż˝e jakaďż˝ wielokryterialna funkcja
oceny by siďż˝ przydaďż˝a, albo wybierajďż˝ca max z jakichďż˝
funkcji czďż˝stkowych ?

Filip Sielimowicz

unread,

Oct 22, 2009, 6:46:43 AM10/22/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci

news:65951300-fad8-4492...@g23g2000vbr.googlegroups.com...
Powitaďż˝

>Jest dana macierz M, co ma R wierszy i C kolumn.

>Kolumny majďż˝ ďż˝rednio V rďż˝nych wartoďż˝ci.
>Jest dana funkcja F odwzorowujďż˝ca iloczyn kartezjaďż˝ski
>wierszy i klas RxK w zbiďż˝r liczb caďż˝kowitych.

Prawdďż˝ mďż˝wiďż˝c - nie rozumiem. jaki jest zwiďż˝zek miďż˝dzy
'wartoďż˝ciďż˝ kolumny' a funkcjďż˝ F ? Jaki wpďż˝yw 'wartosc kolumny'
ma na funkcjďż˝ F ? Z powyďż˝szego wynika, jak dla mnie, ďż˝e ďż˝aden.

Mariusz Marszałkowski

unread,

Oct 22, 2009, 8:25:00 AM10/22/09

On 22 Paź, 12:39, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:
>
> > Zastosowałeś naiwny AG (naiwne kodowanie i naiwna

> > funkcja oceny) - to masz wynik, jaki masz ;)))
>

> Wiesz - może ja czegoś nie rozumiem - ale moim zdaniem
> nie opisałeś w jaki sposób zbudowałeś chromosom,
> jak wyglądało krzyżowanie i jak funkcja oceny.
> Masz liniowy chromosom, w który wrzucasz na sztywno
> wszystkie współczynniki z węzłów drzewa decyzyjnego ?

Dobrze się domyślasz, skoro nie opisałem, to użyłem
naiwnego kodowana i naiwnego AG. Nie mam pojęcia
co można zrobić aby ulepszyć AG i czy cokolwiek
można ulepszyć.

> Istotą AG jest składanie rozwiązania z kombinacji rozwiązań
> cząstkowych. Czy u Ciebie wymiana fragmentów chromosomów
> zawierajacych rozwiązania 'dobre' daje prawdopodobieństwo
> uzyskania rozwiązania 'lepszego' wyraźnie większe niż krzyżowanie
> dowolnych innych chromosomów, czy takie samo ?
Nie rozumiem dlaczego w takim problemie jakiekolwiek krzyżowanie
dobrych osobników ma dawać większe prawdopodobieństwo powstania
lepszego osobnika. Jakie to by musiało być krzyżowanie?

> Przy opisie dwóch rozwiązań dokonałeś jakiejś obserwacji
> dot. problemu związanej z liczeniem sum częściowych - i tę
> wiedzę zaszyłeś w drugim algorytmie. Czy tę obserwację
> zastosowałes w AG ?
No właśnie nie, polegałem na "sile algorytmu genetycznego", w
ewolucji poniekąd sobie poradziły ;-)

> Może jakaś wielokryterialna funkcja
> oceny by się przydała, albo wybierająca max z jakichś
> funkcji cząstkowych ?
Może, ale co to by mogła być za funkcja?

> Prawdę mówiąc - nie rozumiem. jaki jest związek między
> 'wartością kolumny' a funkcją F ? Jaki wpływ 'wartosc kolumny'
> ma na funkcję F ? Z powyższego wynika, jak dla mnie, że żaden.
Coś w rodzaju:
max (\sum_{i=1}^{i=N} F( i , T( i ) )

N - ilość rekordów
i = 1..N - to numer rekordu
T( i ) szukany klasyfikator, przypisująca numer klasy 1..G rekordowi i
F( i , T(i) ) to dowolna funkcja przypisująca dowolne wartości
rekordowi i klasie - inaczej: funkcja F ocenia jakość klasyfikatora T
( i ).

Trzeba znaleźć takie T żeby suma F była maksymalna.
Ograniczenia nałożone na T są mniej/więcej takie:
- ma być drzewem klasyfikującym
- ma zawierać mało węzłów względem ilości rekordów, np. N*10^-5 -
N*10^-6

Pozdrawiam

Filip Sielimowicz

unread,

Oct 22, 2009, 10:53:53 AM10/22/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci

news:7aef3e64-3e94-42af...@p20g2000vbl.googlegroups.com...

>Nie rozumiem dlaczego w takim problemie jakiekolwiek krzyďż˝owanie
>dobrych osobnikďż˝w ma dawaďż˝ wiďż˝ksze prawdopodobieďż˝stwo powstania
>lepszego osobnika. Jakie to by musiaďż˝o byďż˝ krzyďż˝owanie?

No i wďż˝aďż˝nie dlatego bezpoďż˝rednie zastosowanie AG w tym przypadku jest do d
... ;)

> No wďż˝aďż˝nie nie, polegaďż˝em na "sile algorytmu genetycznego", w
> ewolucji poniekďż˝d sobie poradziďż˝y ;-)
Ewolucja rozwiďż˝zuje wiele, wiele mniej lub bardziej powiďż˝zanych
problemďż˝w jednoczeďż˝nie i kombinuje z ďż˝ďż˝czeniem tych rozwiďż˝zaďż˝
w caďż˝oďż˝ďż˝.
U Ciebie, pďż˝ki co - problem jest jeden - funkcja F - o ktďż˝rej
nie wiemy nic ... Czy jest monotoniczna, czy ma jakieďż˝ minima-maksima itp
(w zaleďż˝noďż˝ci od rekordu i w zaleďż˝noďż˝ci od T(i) ). Np. proste pytanie:
Czy jeďż˝li F ([x,y,z], k) ) daje wysoki wynik, to jest szansa, ďż˝e
F ([x,y,A], k) ) rďż˝wnieďż˝ da wysoki wynik ?

>Coďż˝ w rodzaju:

>max (\sum_{i=1}^{i=N} F( i , T( i ) )
>

>N - iloďż˝ďż˝ rekordďż˝w

>i = 1..N - to numer rekordu

>T( i ) szukany klasyfikator, przypisujďż˝ca numer klasy 1..G rekordowi i
>F( i , T(i) ) to dowolna funkcja przypisujďż˝ca dowolne wartoďż˝ci
>rekordowi i klasie - inaczej: funkcja F ocenia jakoďż˝ďż˝ klasyfikatora T
>( i ).
>
>Trzeba znaleďż˝ďż˝ takie T ďż˝eby suma F byďż˝a maksymalna.
>Ograniczenia naďż˝oďż˝one na T sďż˝ mniej/wiďż˝cej takie:
> - ma byďż˝ drzewem klasyfikujďż˝cym
> - ma zawieraďż˝ maďż˝o wďż˝zďż˝ďż˝w wzglďż˝dem iloďż˝ci rekordďż˝w, np. N*10^-5 -
>N*10^-6

Oki, to sprawa jest duďż˝o jaďż˝niejsza.
Natomiast wydaje mi siďż˝, ďż˝e kluczem do dobrego algorytmu AG jest tu
jednak przyjrzenie siďż˝ funkcji F i prďż˝ba okreďż˝lenia jakichďż˝ jej wďż˝asnoďż˝ci.
Jak znajdďż˝ w domu czas, to jeszcze nad tym poďż˝lďż˝czďż˝ ... Brakuje mi tu
jakiejďż˝ podpowiedzi dot. tego, czy klasy sďż˝ podobne - tzn, czy
sďż˝ klasy, ktďż˝re dajďż˝ podobne wyniki funkcji F dla podobnych rekordďż˝w.
Wtedy krzyďż˝owanie parametrďż˝w klasyfikatora bďż˝dzie miaďż˝o sens.
Jeďż˝li nie ma takich podobieďż˝stw miďż˝dzy klasami (z punktu widzenia
funkcji F) to mamy problem kombinatoryczny i trzeba by sprďż˝bowaďż˝
inaczej go podejďż˝ďż˝.

Pierwsza rzecz, ktďż˝ra mi siďż˝ narzuca, to:
- zostawiďż˝ krzyďż˝owanie, tak jak miaďż˝eďż˝, ale funkcjďż˝ oceny zdefiniowaďż˝
nie jako peďż˝ne sumowanie po wszystkich rekordach (tak zdaje siďż˝
zrobiďż˝eďż˝ - testujesz klasyfikator po wszystkim), ale wybierasz za
kaďż˝dym razem jakiďż˝ losowy zestaw rekordďż˝w ze zbioru, np. 10-100
(losowďż˝ prďż˝bkďż˝, im wiďż˝cej kolumn, tym wiďż˝kszďż˝), dla kaďż˝dego
z nich liczysz F i funkcjďż˝ oceny jest albo max z tych wynikďż˝w
czďż˝stkowych, albo suma. Pokombinowaďż˝bym z maxem.

Nie upieraďż˝bym siďż˝ teďż˝ przy znlezieniu absolutnie idealnego T, ale
zadowoliďż˝bym siďż˝ 'prawie idalnym' - badaj wykres funkcji
przystosowania najlepszego osobnika w zaleďż˝noďż˝ci od iteracji.

Mariusz Marszałkowski

unread,

Oct 22, 2009, 1:27:44 PM10/22/09

On 22 Paź, 16:53, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:
> > No właśnie nie, polegałem na "sile algorytmu genetycznego", w
> > ewolucji poniekąd sobie poradziły ;-)
>
> Ewolucja rozwiązuje wiele, wiele mniej lub bardziej powiązanych
> problemów jednocześnie i kombinuje z łączeniem tych rozwiązań
> w całość.
> U Ciebie, póki co - problem jest jeden - funkcja F - o której
> nie wiemy nic ...
Coś niezwykłego jest w Ewolucji, jeśli naprawdę to ona poradziła
sobie
ze skonstruowaniem oka, mózgu, itd. Wydaje się nieprawdopodobne
aby ewolucja opierała się na czymś tak prostym jak krzyżowanie i
mutacja.

> Czy jest monotoniczna, czy ma jakieś minima-maksima itp
> (w zależności od rekordu i w zależności od T(i) ). Np. proste pytanie:
> Czy jeśli F ([x,y,z], k) ) daje wysoki wynik, to jest szansa, że
> F ([x,y,A], k) ) również da wysoki wynik ?
Właśnie tego wszystkiego o funkcji chcę się dowiedzieć od algorytmu
który zbuduje klasyfikator. Chcę żeby klasyfikator sam wyznaczył
miarę podobieństwa i podobnym rekordom przypisał te same klasy.

> >Coś w rodzaju:
> >max (\sum_{i=1}^{i=N} F( i , T( i ) ))
>
> Oki, to sprawa jest dużo jaśniejsza.
> Natomiast wydaje mi się, że kluczem do dobrego algorytmu AG jest tu
> jednak przyjrzenie się funkcji F i próba określenia jakichś jej własności
Hmmm... może zbudować wiele drzew decyzyjne metodą losowo/zachłanną,
następnie osobniki zainicjować węzłami z tych drzew i odpalić algorytm
genetyczny... nie wiem czy to ma jakikolwiek sens.

> Jak znajdę w domu czas, to jeszcze nad tym poślęczę ... Brakuje mi tu
> jakiejś podpowiedzi dot. tego, czy klasy są podobne - tzn, czy
> są klasy, które dają podobne wyniki funkcji F dla podobnych rekordów.
> Wtedy krzyżowanie parametrów klasyfikatora będzie miało sens.
> Jeśli nie ma takich podobieństw między klasami (z punktu widzenia
> funkcji F) to mamy problem kombinatoryczny i trzeba by spróbować
> inaczej go podejść.
Problem jest kombinatoryczny z cechami statystycznymi. Czasami
różnica jednego bitu powoduje że rekordy powinny przynależeć do
innych klas. A czasami kombinacja kilku bitów często się powtarza
w jednej klasie. Właśnie chciałbym badać funkcję F przy pomocy
klasyfikatora.

> Pierwsza rzecz, która mi się narzuca, to:
> - zostawić krzyżowanie, tak jak miałeś, ale funkcję oceny zdefiniować
> nie jako pełne sumowanie po wszystkich rekordach (tak zdaje się
> zrobiłeś - testujesz klasyfikator po wszystkim), ale wybierasz za
> każdym razem jakiś losowy zestaw rekordów ze zbioru, np. 10-100
> (losową próbkę, im więcej kolumn, tym większą), dla każdego
> z nich liczysz F i funkcją oceny jest albo max z tych wyników
> cząstkowych, albo suma. Pokombinowałbym z maxem.
Wydaje się ciekawe, na pewno znacznie by przyspieszyło
obliczanie funkcji przystosowania.

> Nie upierałbym się też przy znlezieniu absolutnie idealnego T, ale
> zadowoliłbym się 'prawie idalnym' - badaj wykres funkcji
> przystosowania najlepszego osobnika w zależności od iteracji.

Dla dużej ilości danych nie ma szans na znalezienie optimum, no
chyba że mocno ograniczy się ilość węzłów.

Pozdrawiam

Filip Sielimowicz

unread,

Oct 23, 2009, 7:05:27 AM10/23/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci

news:1817f1e4-113c-43f2...@p23g2000vbl.googlegroups.com...

>Coďż˝ niezwykďż˝ego jest w Ewolucji, jeďż˝li naprawdďż˝ to ona poradziďż˝a
>sobie
>ze skonstruowaniem oka, mďż˝zgu, itd. Wydaje siďż˝ nieprawdopodobne
>aby ewolucja opieraďż˝a siďż˝ na czymďż˝ tak prostym jak krzyďż˝owanie i
>mutacja.
Trochďż˝ EOT, ale ... w jednym aspekcie natura ma przewagďż˝ nad komputerami:
moďż˝e doďż˝ďż˝ swobodnie wykorzystywaďż˝ siďż˝ďż˝ 'komputera molekularnego'.
Kod genetyczny skďż˝ada siďż˝ z dwďż˝ch zestawďż˝w genďż˝w, do tego istnieje
zjawisko duplikacji genďż˝w itp. Mutacja jednego z genďż˝w nie powoduje
ucieczki poprzedniej wartoďż˝ci. Moďż˝na by w przybliďż˝eniu powiedzieďż˝, ďż˝e
w kaďż˝dej pozycji, kaďż˝de lokum w genotypie moďż˝e przyjmowaďż˝
Rďż˝WNOCZEďż˝NIE kilka wartoďż˝ci. Trochďż˝ to teďż˝ przypomina
mechanikďż˝ kwantowďż˝ ;). W duďż˝ym przybliďż˝eniu mďż˝wiďż˝c, natura liczy
funkcjďż˝ oceny na fenotypie jednoczeďż˝nie dla bardzo wielu rďż˝nych
kombinacji. U nas gen ma albo wartoďż˝ďż˝ A albo B i jeďż˝li
chcielibyďż˝my zasymulowaďż˝ naturďż˝ wprowadzajac dwa zestawy genďż˝w,
musielibyďż˝my liczyďż˝ funkcjďż˝ oceny wielokrotnie, dla rďż˝nych kombinacji
genďż˝w dobieranych raz z jednego a raz z drugiego chromosomu. Przy
dďż˝ugich genotypach zďż˝oďż˝onoďż˝ďż˝ obliczeniowa roďż˝nie koszmarnie ...
Natura zaďż˝ siďż˝ tym nie martwi: wrzuca produkcjďż˝ biaďż˝ka A, wrzuca
rďż˝wnolegle produkcjďż˝ biaďż˝ka B, a funkcjďż˝ oceny zajmuje siďż˝ 'komputer
molekularny' - sprawdzi, jak oba te biaďż˝ka majďż˝ siďż˝ do wszystkich innych
biaďż˝ek, ktďż˝re sďż˝ produkowane rďż˝wnolegle w otoczeniu, czy majďż˝ na siebie
jakiďż˝ wpďż˝yw, czy nie. Mutujďż˝c A w C nie traci A ;) Tak w duďż˝ym
przybliďż˝eniu ;)

>Wďż˝aďż˝nie tego wszystkiego o funkcji chcďż˝ siďż˝ dowiedzieďż˝ od algorytmu
>ktďż˝ry zbuduje klasyfikator. Chcďż˝ ďż˝eby klasyfikator sam wyznaczyďż˝
>miarďż˝ podobieďż˝stwa i podobnym rekordom przypisaďż˝ te same klasy.
Ok, jasna sprawa.

>Hmmm... moďż˝e zbudowaďż˝ wiele drzew decyzyjne metodďż˝ losowo/zachďż˝annďż˝,
>nastďż˝pnie osobniki zainicjowaďż˝ wďż˝zďż˝ami z tych drzew i odpaliďż˝ algorytm

>genetyczny... nie wiem czy to ma jakikolwiek sens.

Teraz siďż˝ zastanawiam, jak Ty to zrobiďż˝eďż˝ ;)

Osobnikiem-fenotypem u Ciebie jest klasyfikator. Chromosomem
jest liniowy zestaw cech, opisujďż˝cy jednoznacznie klasyfikator. Np.
lista reguďż˝. Jak ty to wďż˝aďż˝ciwie robiďż˝eďż˝ ? W jaki sposďż˝b upakowaďż˝eďż˝
drzewo decyzyjne w chromosom i w jaki sposďż˝b robisz krzyďż˝owanie ?
To jest sprawa kluczowa.

>Problem jest kombinatoryczny z cechami statystycznymi. Czasami

>rďż˝nica jednego bitu powoduje ďż˝e rekordy powinny przynaleďż˝eďż˝ do
>innych klas. A czasami kombinacja kilku bitďż˝w czďż˝sto siďż˝ powtarza
>w jednej klasie. Wďż˝aďż˝nie chciaďż˝bym badaďż˝ funkcjďż˝ F przy pomocy
>klasyfikatora.
Mďż˝wisz 'bitu'. Czy elementami rekordďż˝w/macierzy sďż˝ pojedyncze bity ?

>> kaďż˝dym razem jakiďż˝ losowy zestaw rekordďż˝w ze zbioru, np. 10-100
>> (losowďż˝ prďż˝bkďż˝, im wiďż˝cej kolumn, tym wiďż˝kszďż˝), dla kaďż˝dego
>> z nich liczysz F i funkcjďż˝ oceny jest albo max z tych wynikďż˝w
>> czďż˝stkowych, albo suma. Pokombinowaďż˝bym z maxem.

>Wydaje siďż˝ ciekawe, na pewno znacznie by przyspieszyďż˝o
>obliczanie funkcji przystosowania.

Daj info, jak Ty skonstruowaďż˝eďż˝ chromosom i krzyďż˝owanie, tymczasem
ja tu coďż˝ wyeksponujďż˝ na 'dalszy ciďż˝g':
Napisaďż˝eďż˝ wczeďż˝niej:

3) Uwzglďż˝dnij wszystkie kombinacje liďż˝ci: K^(N+1)=KxK, razem
VxCxRxKxK operacji

3) Wybierz maksymalnďż˝ sumďż˝ sum czďż˝ciowych dla kombinacji
klas (liďż˝ci), mamy Cx(RxK+VxLg(V)+VxK) operacji

Co to znaczy 'kombinacji liďż˝ci' ?
W operacji krzyďż˝owania dwďż˝ch drzew decyzyjnych widzďż˝ tu
najwiďż˝ksze pole do popisu - np. przez takie zdefiniowanie krzyďż˝owania,
by modyfikowaďż˝o decyzje nadajďż˝c im rďż˝ne priorytety (poprzez przestawianie
wďż˝zďż˝ďż˝w decyzyjnych w gďż˝rďż˝/w dďż˝ drzewa i mieszania ich z decyzjami
z drugiego drzewa).
Reguďż˝y masz postaci
"Upraszczajďż˝c, warunki w wďż˝zďż˝ach drzewa ograniczmy do M_ij <= C_j,
gdzie C_j jest jednďż˝ z wartoďż˝ci kolumny j."
Nie bardzo kumam, co oznacza tu owe C_j. To wartoďż˝ďż˝ wylosowana ze
wszystkich rekordďż˝w ? Rozumiem, ďż˝e jest to po prostu jakiďż˝ mniej lub
bardziej przypadkowo wygenerowany wspďż˝czynnik ?
Czy w twoim wypadku z jednym wďż˝zďż˝em, chromosom wyglďż˝da
po prostu jak czwďż˝rka (P, I, K1, K2) - gdzie P to odpowiednik powyďż˝szego
C_j (prďż˝g), I to numer branego pod uwagďż˝ elementu z rekordu a K1 i K2
to klasy (liďż˝cie) ?
Mam tylko wďż˝tpliwoďż˝ci co do tego I 9czy je masz) - nie wiem dokďż˝adnie,
jak to drzewo decyzyjne wybiera u Ciebie jednďż˝ z wartoďż˝ci (kolumnďż˝)
w wierszu.

W kaďż˝dym bďż˝dďż˝ razie ja bym szedďż˝ w kierunku takim, ďż˝e drzewo zapisujďż˝
w postaci chromosomu jako zbiďż˝r par (P1,I1), (P2,I2), a na koďż˝cu liďż˝cie
K1, K2, ... Krzyďż˝owanie i mutacjďż˝ bym zdefiniowaďż˝ jako wymianďż˝ i przesuwanie
w ramach chromosomu cegieďż˝ek (par) (P,I) z tym, ďż˝e bym uwaďż˝aďż˝ na to, by
razem z wymianďż˝ miďż˝dzy chromosomami reguďż˝ na ostatnim poziomie
wymieniaďż˝ teďż˝ liďż˝cie (daďż˝ bym zasadďż˝ 'liďż˝cie naleďż˝ďż˝ do ostatniej reguďż˝y').
Potem bym siďż˝ zastanowiďż˝ nad mutacjami zwiďż˝zanymi z modyfikacjďż˝
samych P i K. W przypadku P mamy w przybliďż˝eniu liczby rzeczywiste, w
przypadku
K mamy jakiďż˝ zbiďż˝r klas, czyli liczby caďż˝kowite. Wiďż˝c zadanie jest o tyle
'niebanalne', ďż˝e mamy do czynienia po pierwsze z drzewem, po drugie
mamy niejednorodne geny - inaczej trzeba postďż˝powaďż˝ z progami, inaczej
z liďż˝ciami(klasami) - inne operatory mutacji itp.

W kaďż˝dym bďż˝dďż˝ razie, najpierw bym mutacje caďż˝kowicie porzuciďż˝ i skupiďż˝
siďż˝ na krzyďż˝owaniu, z generowaniem duďż˝ej populacji poczďż˝tkowej.
Powinieneďż˝ dziďż˝ki temu uzyskaďż˝ taki efekt, gdzie AG bďż˝dzie budowaďż˝
ciďż˝gi decyzyjne i kombinowaďż˝ zarďż˝wno z wartoďż˝ciami progďż˝w, jak i z
kolejnoďż˝ciďż˝ decyzji (ktďż˝re podejmowaďż˝ wpierw), oraz ze znalezieniem
najistotniejszych dla klasyfikacji kolumn - czyli bďż˝dzie badaďż˝ 'co jest
sensowne i waďż˝ne z punktu widzenia F'.

Jak bďż˝dzie ta podstawa, to widzďż˝ mnďż˝stwo moďż˝liwoďż˝ci dalszych
modyfikacji operatorďż˝w - w zaleďż˝noďż˝ci od oceny ich sensownoďż˝ci.
Moďż˝e warto wymieniaďż˝ progi miďż˝dzy reguďż˝ami - bďż˝dzie to miaďż˝o
sens, jeďż˝li funkcja F ma skďż˝onnoďż˝ci ku takim rďż˝wnoďż˝ciom
F((A, B ..), K) = F( (B, A...), K) - a byďż˝ moďż˝e jest to w ogďż˝le
bez sensu, bo A i B (rďż˝ne kolumny) sďż˝ zupeďż˝nie rďż˝nych typďż˝w.
Tego nie wiem. Na razie zakďż˝adam, ďż˝e kolumny sďż˝ raczej rďż˝nych
typďż˝w, wartoďż˝ci nie moďż˝na miďż˝dzy nimi wymieniaďż˝.

Jak coďż˝ niejasne - pytaj ;)

Mariusz Marszałkowski

unread,

Oct 23, 2009, 12:27:23 PM10/23/09

On 23 Paź, 13:05, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:

> Trochę EOT, ale ... w jednym aspekcie natura ma przewagę nad komputerami:
> może dość swobodnie wykorzystywać siłę 'komputera molekularnego'.
> Kod genetyczny składa się z dwóch zestawów genów, do tego istnieje
> zjawisko duplikacji genów itp. Mutacja jednego z genów nie powoduje
> ucieczki poprzedniej wartości. Można by w przybliżeniu powiedzieć, że
> w każdej pozycji, każde lokum w genotypie może przyjmować
> RÓWNOCZEŚNIE kilka wartości. Trochę to też przypomina
> mechanikę kwantową ;). W dużym przybliżeniu mówiąc, natura liczy
> funkcję oceny na fenotypie jednocześnie dla bardzo wielu różnych
> kombinacji. U nas gen ma albo wartość A albo B i jeśli
> chcielibyśmy zasymulować naturę wprowadzajac dwa zestawy genów,
> musielibyśmy liczyć funkcję oceny wielokrotnie, dla różnych kombinacji
> genów dobieranych raz z jednego a raz z drugiego chromosomu. Przy
> długich genotypach złożoność obliczeniowa rośnie koszmarnie ...
> Natura zaś się tym nie martwi: wrzuca produkcję białka A, wrzuca
> równolegle produkcję białka B, a funkcją oceny zajmuje się 'komputer
> molekularny' - sprawdzi, jak oba te białka mają się do wszystkich innych
> białek, które są produkowane równolegle w otoczeniu, czy mają na siebie
> jakiś wpływ, czy nie. Mutując A w C nie traci A ;) Tak w dużym
> przybliżeniu ;)
Dobrze że to opisałeś, nie miałem pojęcia że istnieją takie mechanizmy
w
naturalnej ewolucji. Naiwne krzyżowanie cech, nawet na taką skalę jaką
jest cała planeta i miliardy lat czasu, wydaje się słabym pomysłem.

> >Hmmm... może zbudować wiele drzew decyzyjne metodą losowo/zachłanną,

> >następnie osobniki zainicjować węzłami z tych drzew i odpalić algorytm

> >genetyczny... nie wiem czy to ma jakikolwiek sens.
>

> Teraz się zastanawiam, jak Ty to zrobiłeś ;)

>
> Osobnikiem-fenotypem u Ciebie jest klasyfikator. Chromosomem

> jest liniowy zestaw cech, opisujący jednoznacznie klasyfikator. Np.
> lista reguł. Jak ty to właściwie robiłeś ? W jaki sposób upakowałeś
> drzewo decyzyjne w chromosom i w jaki sposób robisz krzyżowanie ?
> To jest sprawa kluczowa.
Kombinowałem bardzo różnie. Np. budowałem tablicę wszystkich
sensownych reguł. Taką tablicę traktowałem jak zbiór atomowych
reguł. Eksperymentowałem z prostymi regułami i z bardziej
skomplikowanymi:

Prosta reguła to np.: if( dane[nr_wiersza][nr_kolumny] operacja
wartość )
Operacja to porównanie typu: równy, różny, mniejszy, itd.
Np. mając 30 kolumn, w każdej kolumnie 50 różnych wartosci, możemy
zbudować
30x50=1500 sensownych reguł typu: if( dane[nr_wier][nr_kol] <=
wartość )

Bardziej rozbudowana reguła to np.: if( vmin <= dane[nr_wier][nr_kol]
<= vmax )
Dla 30 kolumn i 50 różnych wartości wychodzi 30x51x50/2=~40tys
sensownych
reguł.

Najbardziej rozbudowane reguły jakich próbowałem były takie:
if( vmin <= dane[nr_wier][nr_kol_1] operacja dane[nr_wier][nr_kol_2]
<= vmax )
gdzie operacja byla: dodawaniem, odejmowanie, albo mnożeniem.
Ten najbardziej skomplikowany wzór na budowę reguły dawał około 80mln
sensownych reguł, dla zbioru danych jak powyżej.

Takich atomowych reguł można użyć do wypełnienia węzłów w drzewie
decyzyjnym. Drzewo decyzyjne najczęściej budowałem w zwykłej
tablicy liniowej. Każdy element tablicy składał się z:
- reguły atomowej
- indeks tablicy gdy reguła pasuje do rekordu (gdy reguła odpala)
- indeks tablicy gdy reguła nie odpala
- numer klasy do jakiej należy rekord, jeśli element tablicy jest
liściem

Krzyżowania i mutacji dokonywałem na różnych reprezentacjach. Czasami
postępowałem po chamsku: genem było miejsce w tablicy reprezentującej
drzewo, a dopuszczalnymi allelami zbiór reguł atomowych, bądź iloczyn
kartezjański:
- reguł atomowych
- indeksów do węzłów potomnych gdy reguła odpala
- indeksów do węzłów potomnych gdy reguła nie odpala
- klas do jakich zostanie przypisany rekord gdy węzeł jest liściem

Na różne sposoby dodawałem finezji chamskiemu algorytmowi
genetycznemu:
1) Każdy osobnik miał swoją kopię (to chyba diploidalność/
poliploidalność), jeśli w
wyniku mutacji i krzyżowania nie dochodziło do zwiększenia funkcji
przystosowania,
to osobnik z pewnym prawdopodobieństwem zostawał całkowicie
odtwarzany
z kopii.
2) Reguły atomowe miały swój ranking. Jeśli w wyniku mutacji regula r1
została
zastąpiona regułą r2 i doszło do zwiększenia funkcji
przystosowania, to zwiększał
się ranking reguły r2. Reguły z większym rankingiem miały (dużo)
większe
prawdopodobieństwo wylosowania w następnych mutacjach
3) Budowałem drzewo decyzyjne tylko z jednej reguły, obliczałem
wartość funkcji
przystosowania dla takiego drzewa, a następnie nadawałem regułom
atomowym
początkowy ranking "proporcjonalnie" do wartości funkcji
przystosowania.
4) Wprowadzałem mutację "inteligentną", jeśli reguła przed mutacją
była na
zakresie vmin <= kolumna_x <= vmax, to po mutacji z dużym
prawdopodobieństwem
też dotyczyła kolumny_x, a zakres <vmin,vmax> nieznacznie się
rozszerzał lub
zawężał.

To tyle odnośnie kodowania chamskiego. Poza chamskim stosowałem też
coś co
nie wiem jak się nazywa, a sam nazwałem "systemem głosowania". Każdy
gen był ciągiem
bajtów, czyli wartości z przedziału <0,255>. W każdym genie, czyli w
ciągu
bajtów, były pod-ciągi bajtów. Wartości z każdego podciągu były
sumowane i w
ten sposób była ustalana "siła głosu". Przykładowo rekord składa się z
4-rech
kolumn. Pod-ciąg składa się z 10 bajtów. Więc część genu biorąca
udział w
głosowaniu za wyborem konkretnej kolumny to 4x10=40 bajtów.
Przykładowo
w wyniku zsumowania kolejnych 10-cio bajtowych podciągów wychodzą
wartości: 10,11,20,30.
Największa jest suma czwarta, więc zostanie wybrana kolumna czwarta.
Analogicznym
pod-ciągiem bajtów były zakodowane wszystkie cechy reguły: kolumny,
operacje
arytmetyczne, wartości przedziału <vmin,vmax>, itd. Dalej już nie
muszę
opisywać... z genów powstawały reguły, z reguł drzewa, dla drzew
funkcja
przystosowania, selekcja najlepiej przystosowanych, krzyrzowanie,
mutacja...

Czasami w "systemie głosowania" bajty głosujące na konkretną (jedną)
cechę reguły
rozrzucałem po całym osobniku. Np. bajty głosujące na kolumnę leżały
na losowych pozycjach:
13,34,67,86 w osobniku o długości 100 bajtów. Geny nie były ciągami od
N do N+10 przylegających
do siebie bajtów, ale były maskami bajtów z losowo wybranych pozycji.

> >Problem jest kombinatoryczny z cechami statystycznymi. Czasami

> >różnica jednego bitu powoduje że rekordy powinny przynależeć do
> >innych klas. A czasami kombinacja kilku bitów często się powtarza
> >w jednej klasie. Właśnie chciałbym badać funkcję F przy pomocy
> >klasyfikatora.
>

> Mówisz 'bitu'. Czy elementami rekordów/macierzy są pojedyncze bity ?
Reprezentacje danych w komputerze zawsze można przestawić jako
ciągi bitów. Ale wartości w kolumnach są niezbyt licznym podzbiorem
liczb całkowitych, np. o mocy równej 50.

Użyłem określenia bit, aby podkreślić, że czasami niewielka zmiana w
danych wejściowych może decydować o zmianie ich klasy, a czasami
nawet po istotnej zmianie rekord cały czas należy do tej samej klasy.
Więc dane reprezentują problem z pogranicza problemu kombinatorycznego
i
statystycznego. Liczę na wyłonienie tych statystycznych cech.

> Daj info, jak Ty skonstruowałeś chromosom i krzyżowanie, tymczasem
> ja tu coś wyeksponuję na 'dalszy ciąg':
> Napisałeś wcześniej:
>
> 3) Uwzględnij wszystkie kombinacje liści: K^(N+1)=KxK, razem
> VxCxRxKxK operacji
>

> 3) Wybierz maksymalną sumę sum częściowych dla kombinacji

> klas (liści), mamy Cx(RxK+VxLg(V)+VxK) operacji
>
> Co to znaczy 'kombinacji liści' ?
Liściem nazwałem węzeł który nie zawiera już żadnej reguły, zawiera
tylko numer klasy do której zostanie przypisany rekord.
Drzewo binarne z jedną regułą może zaklasyfikować rekord do jednej z
dwóch klas. Drzewo takie zawiera jeden węzeł z regułą decyzyjną i
dwa liście. Jeśli dopuszczalna ilość klas wynosi K, to pierwszy liść
może zawierać numer klasy od 1 do K. Niezależnie od wartości w
pierwszym liściu, drugi liść także może zawierać numer klasy od 1 do
K.
Daje to K^L wariacji dla L liści, powinienem do razu użyć określenia
wariacji
zamiast kombinacji :) Oczywiście niewielki jest praktyczny sens liści
wyprowadzonych z tego samego węzła i klasyfikujących do tej samej
klasy, można więc zamiast KxK dać Kx(K-1) w drzewie jedno-regułowym.

> W operacji krzyżowania dwóch drzew decyzyjnych widzę tu
> największe pole do popisu - np. przez takie zdefiniowanie krzyżowania,
> by modyfikowało decyzje nadając im różne priorytety (poprzez przestawianie
> węzłów decyzyjnych w górę/w dół drzewa i mieszania ich z decyzjami
> z drugiego drzewa).
Nie sprawdzałem jeszcze tego sposobu, ale czeka na swoją kolej.

> Reguły masz postaci
> "Upraszczając, warunki w węzłach drzewa ograniczmy do M_ij <= C_j,
> gdzie C_j jest jedną z wartości kolumny j."
> Nie bardzo kumam, co oznacza tu owe C_j. To wartość wylosowana ze
> wszystkich rekordów ? Rozumiem, że jest to po prostu jakiś mniej lub
> bardziej przypadkowo wygenerowany współczynnik ?
C_j to konkretna wartość z kolumny. Dajmy przykładową tabelę:
1 4 1 0 5
1 1 0 4 4
2 1 1 3 5
1 1 0 0 1
1 2 0 3 0
2 1 2 2 2
2 2 1 0 4
Kolumna pierwsza to numer klasy.
Kolumna druga to wartość funkcji celu F, jeśli klasyfikator T
na podstawie kolumn 3,4,5 przypisze rekord do dobrej
klasy (tej określonej w pierwszej kolumnie) to funkcja F
zwraca wartość z drugiej kolumny, jeśli klasyfikator T źle
przypisze klasę, to funkcja F zwraca np. wartość z drugiej
kolumny pomnożoną przez -1. Oczywiście klasyfikator "nie zna"
wartości z kolumny pierwszej i drugiej.

Na tym przykładzie widać, że reguła:
if( kolumna_3 < 1 ) then klasa 1
wybierze dokładnie te same rekordy co reguła:
if( kolumna_3 < 1.1 ) then klasa 1
Więc nie ma sensu testować obu reguł. Tylko dlatego
użyłem określenia C_j, aby podkreślić, że zbiór sensowych reguł
jest ograniczony przez ilość wartości w kolumnie j-tej.

Z ograniczonej ilości wartości w kolumnach także wynika wzór
na przyspieszenie dzięki sumom częściowym. W czasie liniowym
względem ilości rekordów można zbudować sumy częściowe funkcji F dla
wszystkich wartości pojawiających się w kolumnie. Następnie w czasie
liniowym
względem ilości wartości można przetestować wszystkie reguły typu:
mniejszy równy.
Więc ilość operacji wynosi ilość_rekordów + ilość_wartości. Bez sum
częściowych
ilość operacji wynosiłaby ilosc_rekordow*ilosc_wartosci.

> Czy w twoim wypadku z jednym węzłem, chromosom wygląda
> po prostu jak czwórka (P, I, K1, K2) - gdzie P to odpowiednik powyższego
> C_j (próg), I to numer branego pod uwagę elementu z rekordu a K1 i K2
> to klasy (liście) ?
> Mam tylko wątpliwości co do tego I 9czy je masz) - nie wiem dokładnie,
> jak to drzewo decyzyjne wybiera u Ciebie jedną z wartości (kolumnę)
> w wierszu.
Mam nadzieję że udało mi się to wyjaśnić powyżej.

> W każdym bądź razie ja bym szedł w kierunku takim, że drzewo zapisuję
> w postaci chromosomu jako zbiór par (P1,I1), (P2,I2), a na końcu liście
> K1, K2, ... Krzyżowanie i mutację bym zdefiniował jako wymianę i przesuwanie
> w ramach chromosomu cegiełek (par) (P,I) z tym, że bym uważał na to, by
> razem z wymianą między chromosomami reguł na ostatnim poziomie
> wymieniać też liście (dał bym zasadę 'liście należą do ostatniej reguły').
> Potem bym się zastanowił nad mutacjami związanymi z modyfikacją
> samych P i K. W przypadku P mamy w przybliżeniu liczby rzeczywiste, w
> przypadku
> K mamy jakiś zbiór klas, czyli liczby całkowite. Więc zadanie jest o tyle
> 'niebanalne', że mamy do czynienia po pierwsze z drzewem, po drugie
> mamy niejednorodne geny - inaczej trzeba postępować z progami, inaczej
> z liściami(klasami) - inne operatory mutacji itp.
No i rozmiar przestrzeni rozwiązań decyduje o niebanalności. Załóżmy
że
wybieramy jako regułę atomową tą najbardziej zaawansowaną z trzech
jakie przestawiłem na początku. Więc mamy około 80mln reguł
atomowych.
Załóżmy że drzewo ma mieć 10 węzłów wewnętrznych + 11 liści, problem
niech
ma 6 klas, a dane to 2mln rekordów w tabeli. Więc mamy około 100
cyfrową
liczbę rozwiązań.

Poza tym w algorytmie zachłannym (dzięki sztuczce z sumami
częściowymi)
można dość szybko generować jedno (albo nawet dwu) węzłowe optymalne
poddrzewa. Następnie w algorytmie zachłannym do rozwiązania włącza się
to optymalne poddrzewo, które najbardziej maksymalizuje rozwiązanie.
Takiej sztuczki w algorytmie genetycznym chyba nie da się zrobić,
przynajmniej
ja nie wiem jak.

> W każdym bądź razie, najpierw bym mutacje całkowicie porzucił i skupił
> się na krzyżowaniu, z generowaniem dużej populacji początkowej.
> Powinieneś dzięki temu uzyskać taki efekt, gdzie AG będzie budował
> ciągi decyzyjne i kombinował zarówno z wartościami progów, jak i z
> kolejnością decyzji (które podejmować wpierw), oraz ze znalezieniem
> najistotniejszych dla klasyfikacji kolumn - czyli będzie badał 'co jest
> sensowne i ważne z punktu widzenia F'.
>
> Jak będzie ta podstawa, to widzę mnóstwo możliwości dalszych
> modyfikacji operatorów - w zależności od oceny ich sensowności.
> Może warto wymieniać progi między regułami - będzie to miało
> sens, jeśli funkcja F ma skłonności ku takim równościom
> F((A, B ..), K) = F( (B, A...), K) - a być może jest to w ogóle
> bez sensu, bo A i B (różne kolumny) są zupełnie różnych typów.

Znaczenie niektórych kolumn jest bardzo podobne a innych zupełnie
różne. Fajnie by było, jakby algorytm genetyczny sam odkrył reguły
podobieństwa pomiędzy kolumnami i sam swoją pracę tak
sparametryzował,
aby szybciej podać lepsze rozwiązanie ;-) Może jeden algorytm
genetyczny
by dobierał parametry dla drugiego algorytmu genetycznego ;-)

> Tego nie wiem. Na razie zakładam, że kolumny są raczej różnych
> typów, wartości nie można między nimi wymieniać.
Wartości każdej kolumny należą do małego podzbioru liczb całkowitych.
Małego, czyli o liczności od 2 do około 100 elementów.

Pozdrawiam serdecznie

Filip Sielimowicz

unread,

Oct 26, 2009, 7:23:33 AM10/26/09

Uďż˝ytkownik "Mariusz Marszaďż˝kowski" <mmar...@gmail.com> napisaďż˝ w wiadomoďż˝ci

news:8056130c-9c4f-4b4e...@p9g2000vbl.googlegroups.com...
On 23 Paďż˝, 13:05, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:

>Dobrze ďż˝e to opisaďż˝eďż˝, nie miaďż˝em pojďż˝cia ďż˝e istniejďż˝ takie mechanizmy
>w naturalnej ewolucji. Naiwne krzyďż˝owanie cech, nawet na takďż˝ skalďż˝ jakďż˝
>jest caďż˝a planeta i miliardy lat czasu, wydaje siďż˝ sďż˝abym pomysďż˝em.

mechanizmy to trochďż˝ za duďż˝o powiedziane. po prostu duplikacja genďż˝w
i produkcja biaďż˝ek, ktďż˝re siďż˝ rozchodzďż˝ w komďż˝rce i albo coďż˝ zmieniajďż˝
(na gorsze lub lepsze) albo sďż˝ neutralne. Dopiero uszkodzenie/usuniďż˝cie
wszystkich genďż˝w (np. spotkanie siďż˝ genďż˝w recesywnych) powoduje, ďż˝e
coďż˝ co byďż˝o u rodzica, 'znika'.

>Kombinowaďż˝em bardzo rďż˝nie. Np. budowaďż˝em tablicďż˝ wszystkich
>sensownych reguďż˝. Takďż˝ tablicďż˝ traktowaďż˝em jak zbiďż˝r atomowych
>reguďż˝. Eksperymentowaďż˝em z prostymi reguďż˝ami i z bardziej
>skomplikowanymi:

Ok, widzďż˝, ďż˝e sporo juďż˝ siďż˝ namďż˝czyďż˝eďż˝ z tematem.
I nie byďż˝o ďż˝adnych ciekawych efektďż˝w ? badaďż˝eďż˝ zmiany w funkcji
przystosowania
(wykresy), tempo jej wzrostu ?

>Reprezentacje danych w komputerze zawsze moďż˝na przestawiďż˝ jako
>ciďż˝gi bitďż˝w. Ale wartoďż˝ci w kolumnach sďż˝ niezbyt licznym podzbiorem
>liczb caďż˝kowitych, np. o mocy rďż˝wnej 50.
>Uďż˝yďż˝em okreďż˝lenia bit, aby podkreďż˝liďż˝, ďż˝e czasami niewielka zmiana w
>danych wejďż˝ciowych moďż˝e decydowaďż˝ o zmianie ich klasy, a czasami
>nawet po istotnej zmianie rekord caďż˝y czas naleďż˝y do tej samej klasy.
>Wiďż˝c dane reprezentujďż˝ problem z pogranicza problemu kombinatorycznego
>i statystycznego. Liczďż˝ na wyďż˝onienie tych statystycznych cech.
Oki ... Pojďż˝cia bitu bym tu raczej jednak nie mieszaďż˝, jeďż˝li nie ma
wyraďż˝nego zwiďż˝zku miďż˝dzy problemem a bitowďż˝ reprezentacjďż˝ danych
to bym unikaďż˝ np. operatorďż˝w genetycznych, ktďż˝re coďż˝ tam mieszajďż˝ w
bitach liczb.

>> Co to znaczy 'kombinacji liďż˝ci' ?

>Liďż˝ciem nazwaďż˝em wďż˝zeďż˝ ktďż˝ry nie zawiera juďż˝ ďż˝adnej reguďż˝y, zawiera
>tylko numer klasy do ktďż˝rej zostanie przypisany rekord.
>Drzewo binarne z jednďż˝ reguďż˝ďż˝ moďż˝e zaklasyfikowaďż˝ rekord do jednej z

Oki, to byďż˝o dla mnie jasne juďż˝ wczeďż˝niej, pytaďż˝em o sďż˝owo 'kombinacji',
sugerowaďż˝o to, ďż˝e Twďż˝j algorytm w ramach krzyďż˝owania/mutacji skupia siďż˝
gďż˝ďż˝wnie na przestawianiu liďż˝ci miejscami, co w oderwaniu od reguďż˝
wydaje mi siďż˝ raczej sďż˝abym pomysďż˝em. Maďż˝o efektywnym.

>> W operacji krzyďż˝owania dwďż˝ch drzew decyzyjnych widzďż˝ tu
>> najwiďż˝ksze pole do popisu - np. przez takie zdefiniowanie krzyďż˝owania,
>> by modyfikowaďż˝o decyzje nadajďż˝c im rďż˝ne priorytety (poprzez
>> przestawianie

>> wďż˝zďż˝ďż˝w decyzyjnych w gďż˝rďż˝/w dďż˝ drzewa i mieszania ich z decyzjami
>> z drugiego drzewa).
>Nie sprawdzaďż˝em jeszcze tego sposobu, ale czeka na swojďż˝ kolej.

No, ja bym od tego chyba zaczďż˝ďż˝ ;) Jak mamy do czynienia z drzewami
to naturalne jest skonstruowanie takich operatorďż˝w, ktďż˝re majďż˝ ďż˝wiadomoďż˝ďż˝
tych drzew i np. przenoszďż˝ wďż˝zďż˝y, przepinajďż˝ gaďż˝ďż˝zie itp.

>> Reguďż˝y masz postaci
>> "Upraszczajďż˝c, warunki w wďż˝zďż˝ach drzewa ograniczmy do M_ij <= C_j,
>> gdzie C_j jest jednďż˝ z wartoďż˝ci kolumny j."
>> Nie bardzo kumam, co oznacza tu owe C_j. To wartoďż˝ďż˝ wylosowana ze

>> wszystkich rekordďż˝w ? Rozumiem, ďż˝e jest to po prostu jakiďż˝ mniej lub
>> bardziej przypadkowo wygenerowany wspďż˝czynnik ?
>C_j to konkretna wartoďż˝ďż˝ z kolumny. Dajmy przykďż˝adowďż˝ tabelďż˝:

>1 4 1 0 5

>...

>2 2 1 0 4
>Kolumna pierwsza to numer klasy.

>Kolumna druga to wartoďż˝ďż˝ funkcji celu F, jeďż˝li klasyfikator T

>na podstawie kolumn 3,4,5 przypisze rekord do dobrej

>klasy (tej okreďż˝lonej w pierwszej kolumnie) to funkcja F
>zwraca wartoďż˝ďż˝ z drugiej kolumny, jeďż˝li klasyfikator T ďż˝le
>przypisze klasďż˝, to funkcja F zwraca np. wartoďż˝ďż˝ z drugiej
>kolumny pomnoďż˝onďż˝ przez -1. Oczywiďż˝cie klasyfikator "nie zna"
>wartoďż˝ci z kolumny pierwszej i drugiej.

Oki, nie do koďż˝ca chwytam, ale po prostu nie bardzo mam
czas. Pozostanďż˝ na 'wyďż˝szym poziomie abstrakcji'.

>> Czy w twoim wypadku z jednym wďż˝zďż˝em, chromosom wyglďż˝da
>> po prostu jak czwďż˝rka (P, I, K1, K2) - gdzie P to odpowiednik powyďż˝szego
>> C_j (prďż˝g), I to numer branego pod uwagďż˝ elementu z rekordu a K1 i K2
>> to klasy (liďż˝cie) ?
>> Mam tylko wďż˝tpliwoďż˝ci co do tego I 9czy je masz) - nie wiem dokďż˝adnie,
>> jak to drzewo decyzyjne wybiera u Ciebie jednďż˝ z wartoďż˝ci (kolumnďż˝)
>> w wierszu.

>Mam nadziejďż˝ ďż˝e udaďż˝o mi siďż˝ to wyjaďż˝niďż˝ powyďż˝ej.
Ok.

>No i rozmiar przestrzeni rozwiďż˝zaďż˝ decyduje o niebanalnoďż˝ci. Zaďż˝ďż˝my
>ďż˝e wybieramy jako reguďż˝ďż˝ atomowďż˝ tďż˝ najbardziej zaawansowanďż˝ z trzech
>jakie przestawiďż˝em na poczďż˝tku. Wiďż˝c mamy okoďż˝o 80mln reguďż˝
>atomowych.
>Zaďż˝ďż˝my ďż˝e drzewo ma mieďż˝ 10 wďż˝zďż˝ďż˝w wewnďż˝trznych + 11 liďż˝ci, problem
>niech
>ma 6 klas, a dane to 2mln rekordďż˝w w tabeli. Wiďż˝c mamy okoďż˝o 100
>cyfrowďż˝
>liczbďż˝ rozwiďż˝zaďż˝.

Oki ;) Przestrzeďż˝ duďż˝a, ale ... To typowe ;) jaka jest przestrzeďż˝ rozwiďż˝zaďż˝
dla problemu komiwojaďż˝era ze 100 miastami ? A 1000 ? ;)

>Poza tym w algorytmie zachďż˝annym (dziďż˝ki sztuczce z sumami
>czďż˝ciowymi)
>moďż˝na doďż˝ďż˝ szybko generowaďż˝ jedno (albo nawet dwu) wďż˝zďż˝owe optymalne
>poddrzewa. Nastďż˝pnie w algorytmie zachďż˝annym do rozwiďż˝zania wďż˝ďż˝cza siďż˝
>to optymalne poddrzewo, ktďż˝re najbardziej maksymalizuje rozwiďż˝zanie.
>Takiej sztuczki w algorytmie genetycznym chyba nie da siďż˝ zrobiďż˝,

>przynajmniej
>ja nie wiem jak.

Z braku czasu nie wnikam ... Moďż˝e jeszcze podejdďż˝ do tematu.
Wydaje mi siďż˝, ďż˝e sam AG nie stawia problemu, to tylko kwestia
skomplikowania chromosomu, operatorďż˝w i funkcji oceny,
wbudowania w problem tej samej wiedzy, co w innych rozwiďż˝zaniach
analitycznych, a AG pozostawienie tylko kwesti zwiďż˝zanych
z przeszukiwaniem tego, czego juďż˝ nie umiemy uproďż˝ciďż˝.

>Znaczenie niektďż˝rych kolumn jest bardzo podobne a innych zupeďż˝nie
>rďż˝ne. Fajnie by byďż˝o, jakby algorytm genetyczny sam odkryďż˝ reguďż˝y
>podobieďż˝stwa pomiďż˝dzy kolumnami i sam swojďż˝ pracďż˝ tak
>sparametryzowaďż˝,
>aby szybciej podaďż˝ lepsze rozwiďż˝zanie ;-) Moďż˝e jeden algorytm
>genetyczny
>by dobieraďż˝ parametry dla drugiego algorytmu genetycznego ;-)

Wystarczy jeden. Rozbudowujemy chromosom o dodatkowe
(zresztďż˝ robiďż˝es sam jakieďż˝ kombinacje z gďż˝osowaniami itp)
pola, w ktďż˝rych np. zapisujemy informacje o 'kolumnach podobnych'
(np dodajemy miejsce na 6 par liczb) i wrzucamy to info jako
parametry wpďż˝ywajďż˝ce na dziaďż˝anie operatorďż˝w genetycznych
(decydujacych np. ktďż˝re wďż˝zďż˝y z ktďż˝rymi wymieniaďż˝, czy kopiowaďż˝
reguďż˝y). Nazwaďż˝bym je 'genami regulacyjnymi'. Geny regulacyjne
juďż˝ krzyzujesz i mutujesz standardowo, prosto (wymiana par liczb
miďż˝dzy osobnikami). Moďż˝na poprďż˝bowaďż˝.

Filip Sielimowicz

unread,

Oct 28, 2009, 7:06:54 AM10/28/09

I jak tam eksperymenta ?
Coďż˝ ciekawego udaďż˝o siďż˝ wyprodukowaďż˝ ?

Mariusz Marszałkowski

unread,

Oct 28, 2009, 8:18:56 AM10/28/09

On 28 Paź, 12:06, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:

> I jak tam eksperymenta ?

> Coś ciekawego udało się wyprodukować ?

Trochę chorowałem i nie zdołałem nic konkretnego zrobić przez
ostatnie dni. Ale w przeciągu 10 dni opiszę kolejne eksperymenty,
pomysły i rezultaty... bądź ich brak ;-)

Pozdrawiam serdecznie :)

Mariusz Marszałkowski

unread,

Nov 8, 2009, 8:28:56 AM11/8/09

On 26 Paź, 12:23, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
wrote:
> Użytkownik "Mariusz Marszałkowski" <mmars...@gmail.com> napisał w wiadomościnews:8056130c-9c4f-4b4e...@p9g2000vbl.googlegroups.com...
> On 23 Paź, 13:05, "Filip Sielimowicz" <sielim_tnij...@to.tez.wp.pl>
> wrote:
>
> >Dobrze że to opisałeś, nie miałem pojęcia że istnieją takie mechanizmy
> >w naturalnej ewolucji. Naiwne krzyżowanie cech, nawet na taką skalę jaką
> >jest cała planeta i miliardy lat czasu, wydaje się słabym pomysłem.
>
> mechanizmy to trochę za dużo powiedziane. po prostu duplikacja genów
> i produkcja białek, które się rozchodzą w komórce i albo coś zmieniają
> (na gorsze lub lepsze) albo są neutralne. Dopiero uszkodzenie/usunięcie
> wszystkich genów (np. spotkanie się genów recesywnych) powoduje, że
> coś co było u rodzica, 'znika'.
Nie mniej jednak bardzo interesujące, interesujące ponieważ wydaje się
że
błądzenie losowe nawet na taką skalę jaką jest cała planeta i 4
miliardy
lat to zdecydowanie za mało do stworzenia choćby takiego narządu jakim
jest oko.

> >Kombinowałem bardzo różnie. Np. budowałem tablicę wszystkich
> >sensownych reguł. Taką tablicę traktowałem jak zbiór atomowych

> >reguł. Eksperymentowałem z prostymi regułami i z bardziej
> >skomplikowanymi:
>
> Ok, widzę, że sporo już się namęczyłeś z tematem.
> I nie było żadnych ciekawych efektów ? badałeś zmiany w funkcji

> przystosowania
> (wykresy), tempo jej wzrostu ?

Właściwie to namęczyłem się duuużo więcej niż zdołałem opisać
w poprzednim poście. Właściwie od jakiś 10 lat od czasu do czasu
próbuję różne zadania rozwiązać przy pomocy algorytmu genetycznego.
Najwięcej eksperymentów (około 35 różnych programów) przeprowadziłem
na kostce rubika, algorytm (bardziej lub mniej podobny do algorytmu
genetycznego) miał za zadanie stworzyć program do układania
kostki rubika w małej ilości ruchów.

Czy były efekty? Cóż, takich o których warto wspominać nie było :)
Warto natomiast wspomnieć, że na wielu różnych zadaniach obserwowałem
podobną skuteczność trzech algorytmów, albo trzech grup algorytmów.
1) Najgorzej wypadała grupa algorytmów błądzenia losowego.
2) Niewiele lepiej wypadały różne odmiany algorytmu genetycznego
bazującego na krzyżowaniu. Z reguły im więcej "sprytnej" mutacji i
im mniej krzyżowania tym algorytm genetyczny miał większą
przewagę nad błądzeniem losowym.
3) Trzecia grupa algorytmów to algorytmy które moim zdaniem niczym
istotnym nie różnią się od algorytmu symulowanego wyżarzania.
Ilość
osobników w tych algorytmach jest ograniczona do jednego.
Krzyżowania
nie ma w ogóle, występuje tylko "sprytna" mutacja. Mutacja, a
więc
ten istotny krok z symulowanego wyżarzania "wylosuj nowe
rozwiązanie w
pobliżu starego". Jeśli nowe rozwiązanie jest gorzej przystosowane
do
starego, to z pewnym prawdopodobieństwem wróć do starego. Właśnie
te odmiany symulowanego wyżarzania za każdym razem biły na głowę
błądzenie losowe i algorytmy z krzyżowaniem.
4) Można wymienić jeszcze czwartą grupę algorytmów: jeśli dało się
zbudować
jakiś dobry algorytm zachłanny, albo dało się zastosować jakaś
sztuczkę
jak np. w ostatnim problemie z agregacją sum częściowych, to
oczywiście
algorytm zachłanny dawał jeszcze lepsze wyniki niż symulowane
wyżarzanie.
Ale algorytmy zachłanne też nie były pozbawione wad, np. mój
ostatni algorytm
zachłanny buduje ogromne drzewo decyzyjne (zamiast małego), co
często
kończy się dużo gorszym uogólnianiem na zbiorze testowym.

Powstaje pytanie dlaczego krzyżowanie dawało takie mizerne rezultaty?
Odpowiedzą
na to pytanie chyba jest inne pytanie: dlaczego z dwóch dobrych
osobników miałby
powstać z dużym prawdopodobieństwem trzeci lepszy? Nie dostrzegam w
ogólnym
przypadku żadnego powodu z którego poprzez skrzyżowanie zakodowanych
cech
mogłyby powstać lepsze cechy, dające większą wartość funkcji
przystosowania.

> Oki ... Pojęcia bitu bym tu raczej jednak nie mieszał, jeśli nie ma
> wyraźnego związku między problemem a bitową reprezentacją danych
> to bym unikał np. operatorów genetycznych, które coś tam mieszają w
> bitach liczb.
Na razie nie próbowałem ( w ostatnim problemie nie próbowałem )
operacji
na bitach. Niemniej jednak wydaje się, że operacje na bezpośredniej
reprezentacji
bitowej posiadają pewną zaletę. Załóżmy że osobnik składa się z
ciągu N bitów. Możemy stworzyć tablicę T o rozmiarze NxN par liczb
całkowitych. Następnie mutując bit i-ty, w wierszu i-tym tablicy T
agregujemy wpływ mutacji i-tego bitu na funkcje przystosowania, w
zależności od nie/ustawionych pozostałych bitów. W ten sposób,
po wielu mutacjach, zbudujemy statystykę (to chyba coś podobnego
do klasyfikatora bayesowskiego), jakie bity najbardziej lubią być
ustawione
w zależności od ustawienia pozostałych bitów. Jeśli osobnik składa
się z małej ilości bitów, a wywołanie funkcji przystosowania jest
bardzo
kosztowne, można pokusić się o tablicę trójwymiarową NxNxN, wtedy
zbudujemy statystykę jednego bitu, od pozostałych par bitów.
Jeśli nie napisałem zrozumiale, a zainteresowało Cię to, to pisz,
podam
przykład :)

> >> Co to znaczy 'kombinacji liści' ?

> >Liściem nazwałem węzeł który nie zawiera już żadnej reguły, zawiera
> >tylko numer klasy do której zostanie przypisany rekord.
> >Drzewo binarne z jedną regułą może zaklasyfikować rekord do jednej z
>
> Oki, to było dla mnie jasne już wcześniej, pytałem o słowo 'kombinacji',
> sugerowało to, że Twój algorytm w ramach krzyżowania/mutacji skupia się
> głównie na przestawianiu liści miejscami, co w oderwaniu od reguł
> wydaje mi się raczej słabym pomysłem. Mało efektywnym.

>
> >> W operacji krzyżowania dwóch drzew decyzyjnych widzę tu
> >> największe pole do popisu - np. przez takie zdefiniowanie krzyżowania,
> >> by modyfikowało decyzje nadając im różne priorytety (poprzez
> >> przestawianie

> >> węzłów decyzyjnych w górę/w dół drzewa i mieszania ich z decyzjami
> >> z drugiego drzewa).
> >Nie sprawdzałem jeszcze tego sposobu, ale czeka na swoją kolej.
>
> No, ja bym od tego chyba zaczął ;) Jak mamy do czynienia z drzewami
> to naturalne jest skonstruowanie takich operatorów, które mają świadomość
> tych drzew i np. przenoszą węzły, przepinają gałęzie itp.
Przymierzam się do tego pomysłu i zastanawiam jak skutecznie go
zaimplementować. Ostatnio drzewo decyzyjne, zastąpiłem grafem
decyzyjnym, bo
w sumie dlaczego jeden węzeł ma mieć tylko jednego rodzica? Drzewo
jest
jednocześnie trudniejsze w implementacji (trzeba dbać właśnie to aby
jeden
węzeł miał dokładnie jednego rodzica) i mniej wydajne. Graf realizuję
w taki
sposób:

#define IT (4)

int classify( const int param[] ) {
int i,next=0,clas;
for(it=0;it<IT;it++)
switch( next ) {
case 0: if( param[i01] operacja param[i02] porównanie stała0 ) next =
x01; else next = x02; clas = c0; break;
case 1: if( param[i11] operacja param[i12] porównanie stała1 ) next =
x11; else next = x12; clas = c1; break;
case 2: if( param[i21] operacja param[i22] porównanie stała2 ) next =
x21; else next = x22; clas = c2; break;
......................
case N: if( param[iN1] operacja param[iN2] porównanie stałaN ) next =
xN1; else next = xN2; clas = cN; break;
}
return clas;
}

"operacja" to: dodawanie, mnożenie lub odejmowanie
"porównanie" to: równy, różny, mniejszy lub równy, większy lub równy

Algorytm budujący taki graf ma za zadanie znaleźć wszystkie parametry:
- operacja
- porównanie
- zmienne: i, x, stała, c

Używam algorytmu bazującego na symulowanym wyżarzaniu, jeśli ktoś
jest zainteresowany, mogę udostępnić źródła tego programu i
przykładowe
dane. Mogę także udostępnić źródła do budowania drzewa decyzyjnego
dla tych samych danych, jeśli ktoś jest zainteresowany, to proszę o
info.

> >> Reguły masz postaci
> >> "Upraszczając, warunki w węzłach drzewa ograniczmy do M_ij <= C_j,
> >> gdzie C_j jest jedną z wartości kolumny j."
> >> Nie bardzo kumam, co oznacza tu owe C_j. To wartość wylosowana ze
> >> wszystkich rekordów ? Rozumiem, że jest to po prostu jakiś mniej lub
> >> bardziej przypadkowo wygenerowany współczynnik ?
> >C_j to konkretna wartość z kolumny. Dajmy przykładową tabelę:

> >1 4 1 0 5
> >...
> >2 2 1 0 4
> >Kolumna pierwsza to numer klasy.

> >Kolumna druga to wartość funkcji celu F, jeśli klasyfikator T

> >na podstawie kolumn 3,4,5 przypisze rekord do dobrej

> >klasy (tej określonej w pierwszej kolumnie) to funkcja F
> >zwraca wartość z drugiej kolumny, jeśli klasyfikator T źle
> >przypisze klasę, to funkcja F zwraca np. wartość z drugiej
> >kolumny pomnożoną przez -1. Oczywiście klasyfikator "nie zna"

> >wartości z kolumny pierwszej i drugiej.
>
> Oki, nie do końca chwytam, ale po prostu nie bardzo mam
> czas. Pozostanę na 'wyższym poziomie abstrakcji'.
Oki, to w sumie były szczegóły, możemy je pominąć :)

> >No i rozmiar przestrzeni rozwiązań decyduje o niebanalności. Załóżmy
> >że wybieramy jako regułę atomową tą najbardziej zaawansowaną z trzech
> >jakie przestawiłem na początku. Więc mamy około 80mln reguł
> >atomowych.

> >Załóżmy że drzewo ma mieć 10 węzłów wewnętrznych + 11 liści, problem
> >niech

> >ma 6 klas, a dane to 2mln rekordów w tabeli. Więc mamy około 100
> >cyfrową
> >liczbę rozwiązań.
>

> Oki ;) Przestrzeń duża, ale ... To typowe ;) jaka jest przestrzeń rozwiązań
> dla problemu komiwojażera ze 100 miastami ? A 1000 ? ;)
Coś pomiędzy silnia 100 a silna 1000 ;-) Ciekawy problem, chętnie bym
zobaczył o
ile gorszy wynik podaje algorytm genetyczny od algorytmu dokładnego
dla problemu
komiwojażera.

> >Poza tym w algorytmie zachłannym (dzięki sztuczce z sumami
> >częściowymi)
> >można dość szybko generować jedno (albo nawet dwu) węzłowe optymalne
> >poddrzewa. Następnie w algorytmie zachłannym do rozwiązania włącza się
> >to optymalne poddrzewo, które najbardziej maksymalizuje rozwiązanie.

> >Takiej sztuczki w algorytmie genetycznym chyba nie da się zrobić,

> >przynajmniej
> >ja nie wiem jak.
>

> Z braku czasu nie wnikam ... Może jeszcze podejdę do tematu.
> Wydaje mi się, że sam AG nie stawia problemu, to tylko kwestia
> skomplikowania chromosomu, operatorów i funkcji oceny,
> wbudowania w problem tej samej wiedzy, co w innych rozwiązaniach
> analitycznych, a AG pozostawienie tylko kwesti związanych
> z przeszukiwaniem tego, czego już nie umiemy uprościć.

Dokładnie o to chodzi. Zaimplementować wszystko co się da,
zaimplementować całą znaną wiedzę, a tam gdzie nic nie wiadomo,
to zastosować AG. Niestety to może być bardzo trudne, np.
cały czas nie wiem jak przyspieszyć algorytm genetyczny dzięki
owym sumom częściowym.

> >Znaczenie niektórych kolumn jest bardzo podobne a innych zupełnie
> >różne. Fajnie by było, jakby algorytm genetyczny sam odkrył reguły
> >podobieństwa pomiędzy kolumnami i sam swoją pracę tak
> >sparametryzował,
> >aby szybciej podać lepsze rozwiązanie ;-) Może jeden algorytm
> >genetyczny

> >by dobierał parametry dla drugiego algorytmu genetycznego ;-)

>
> Wystarczy jeden. Rozbudowujemy chromosom o dodatkowe

> (zresztą robiłes sam jakieś kombinacje z głosowaniami itp)
> pola, w których np. zapisujemy informacje o 'kolumnach podobnych'

> (np dodajemy miejsce na 6 par liczb) i wrzucamy to info jako

> parametry wpływające na działanie operatorów genetycznych
> (decydujacych np. które węzły z którymi wymieniać, czy kopiować
> reguły). Nazwałbym je 'genami regulacyjnymi'. Geny regulacyjne
> już krzyzujesz i mutujesz standardowo, prosto (wymiana par liczb
> między osobnikami). Można popróbować.
Dobra idea, efekt taki sam jak dwóch algorytmów genetycznych, a
reprezentacja znacznie prostsza. Zapamiętam to sobie :)

Pozdrawiam serdecznie
Sorry że tak późno odpisuję, ale trochę chorowałem i nie miałem
czasu, a nie chciałem odpowiadać bez zastanowienia :)

0 new messages