znacie jakiś program, który przeanalizuje mi wskazane drzewo katalogów i
wysupła pliki tekstowe o potencjalnie podobnej zawartości? Chodzi o kod
źródłowy w językach typu C++ albo PHP. Musiało by to być odporne na
jakieś drobne zmiany typu rozjechane kodowanie polskich znaków albo
cośtam przesunięte, albo jakiś drobny napis zmieniony.
Wiem, że pewnie pod uniksami sobie to można jakoś napisać z użyciem
diffa, ale niestety za cienki jestem.
--
Przemysław Adam Śmiejek
Może w google wpisywać kolejne frazy?
Pozdrawiam
Dobry spos�b na analiz� drzewa katalog�w...
--
Grzegorz Niemirowski
http://www.grzegorz.net/
OE PowerTool i Outlook Express: http://www.grzegorz.net/oe/
Uptime: 1 day, 1 hours, 40 minutes and 22 seconds
Program nie, ale http://en.wikipedia.org/wiki/Levenshtein_distance
może pomóc.
W dniu 2010-01-27 15:21, Michaďż˝ 'Khorne' Rzechonek pisze:
> On 24 Sty, 16:03, Przemys�aw Adam �miejek <niec...@spamu.pl> wrote:
>> znacie jaki� program, kt�ry przeanalizuje mi wskazane drzewo katalog�w i
>> wysup�a pliki tekstowe o potencjalnie podobnej zawarto�ci? Chodzi o kod
>> �r�d�owy w j�zykach typu C++ albo PHP. Musia�o by to by� odporne na
>> jakie� drobne zmiany typu rozjechane kodowanie polskich znak�w albo
>> co�tam przesuni�te, albo jaki� drobny napis zmieniony.
>
> Program nie, ale http://en.wikipedia.org/wiki/Levenshtein_distance
> mo�e pom�c.
Chyba �le sformu�owa�em problem :D
Chodzi o to, �e mam drzewko katalog�w a w nich pliki z kodem w j�zyku
C++ albo PHP. I potrzebuj� narz�dzia, kt�re znajdzie pliki o zbli�onych
kodach �r�d�owych. Takie zbli�enia s� wykrywane przez r�ne systemy
zarz�dzania wersjami, tylko tam jest �atwiej, bo maj� pliki konkretne
nazwami. A potrzebne mi rozwi�zanie musia�o by por�wnywa� ka�dy z ka�dym
i je�li liczba r�nic jest epsilonowa, to zawo�a�, �e to jest plagiat.
--
Przemys�aw Adam �miejek
W dniu 2010-01-29 10:07, proglem pisze:
> adres?
Adidasa
--
Przemysław Adam Śmiejek