Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

polskie znaki w adresie URL

2,405 views
Skip to first unread message

pikny zenon

unread,
Aug 23, 2010, 3:49:35 PM8/23/10
to
Czytałem o tzw. "przyjaznych linkach" i się trochę zdziwiłem, bo
niektórzy piszą, żeby nie likwidować polskich znaków (chodzi oczywiście
o to co po slashu a nie o DNS).

Sprawdziłem i nie działa.
A jeśli jakoś powinno, to wolałbym mieć chyba

http://domena.pl/żółć.html
niż
http://domena.pl/zolc.html.


To jak to jest z tymi polskimi znakami w URL-u?

Vax

unread,
Aug 23, 2010, 5:59:07 PM8/23/10
to
W dniu 2010-08-23 21:49, pikny zenon pisze:

> Sprawdziłem i nie działa.

ale co nie działa?
Niby IE lubi je zakodować (choć w obrębie serwisu zachowuje
się raczej przyzwoicie), ale jedną linijką kodu można go przekonać,
żeby nie cudował.

> A jeśli jakoś powinno, to wolałbym mieć chyba
>
> http://domena.pl/żółć.html
> niż
> http://domena.pl/zolc.html.
>
> To jak to jest z tymi polskimi znakami w URL-u?

Ja tam używam. Jeżeli URL ma dawać "bonus do pozycjonowania"
to chyba naturalne, że ma wzmocnić słowo żółte a nie zolte
i łaska a nie laska.

v.

pikny zenon

unread,
Aug 23, 2010, 6:27:00 PM8/23/10
to
W dniu 2010-08-23 23:59, Vax pisze:

> W dniu 2010-08-23 21:49, pikny zenon pisze:
>
>> Sprawdziłem i nie działa.
>
> ale co nie działa?


Wrzuciłem na serwer plik 'ą.html' i nie mogę go otworzyć z poziomu
przeglądarki (wpisując 'domena/ą.html').

Jak mu zmienię nazwę na 'a.html' to działa.

Vax

unread,
Aug 23, 2010, 6:35:50 PM8/23/10
to
W dniu 2010-08-24 00:27, pikny zenon pisze:

>>> Sprawdziłem i nie działa.
>>
>> ale co nie działa?
>
> Wrzuciłem na serwer plik 'ą.html' i nie mogę go otworzyć z poziomu
> przeglądarki (wpisując 'domena/ą.html').
>
> Jak mu zmienię nazwę na 'a.html' to działa.

Mylisz pojęcia ;)
I żebyś jeszcze wiedział, o co naprawdę serwer poprosiła przeglądarka...

v.

porneL

unread,
Aug 23, 2010, 7:07:14 PM8/23/10
to
On Mon, 23 Aug 2010 20:49:35 +0100, pikny zenon <zenek-...@gazeta.pl>
wrote:

> Czytałem o tzw. "przyjaznych linkach" i się trochę zdziwiłem, bo
> niektórzy piszą, żeby nie likwidować polskich znaków (chodzi oczywiście
> o to co po slashu a nie o DNS).
>
> Sprawdziłem i nie działa.
> A jeśli jakoś powinno, to wolałbym mieć chyba
>

> http://domena.pl/ż%F3łć.html


> niż
> http://domena.pl/zolc.html.
>
>
> To jak to jest z tymi polskimi znakami w URL-u?

W URL-ach jedynym słusznym kodowaniem jest UTF-8 zakodowane przez
urlencode: %C5%BC%C3%B3%C5%82%C4%87.html

Zapomnij o przestarzałym ISO.

Druga sprawa, to kodowanie znaków używane przez system plików na serwerze
i sposób interpretacji tego przez serwer. Z tym może być różnie...

--
http://pornel.net
this.author = new Geek("porneL");

pikny zenon

unread,
Aug 23, 2010, 8:20:15 PM8/23/10
to
W dniu 2010-08-24 00:35, Vax pisze:

> Mylisz pojęcia ;)
> I żebyś jeszcze wiedział, o co naprawdę serwer poprosiła przeglądarka...

Możesz rozwinąć. Wyjaśnić, czemu nie działa.
Specjalnie przetestowałem prosty przykład.

'domena/ą.html' tu u mnie poprawny URL do tego pliku. Gdzie się zaczyna
krzaczyć?


pikny zenon

unread,
Aug 23, 2010, 8:26:49 PM8/23/10
to
W dniu 2010-08-24 01:07, porneL pisze:

> Zapomnij o przestarzałym ISO.

Serwer stoi w zewn. hostingu.
Do przeglądarek (kilka sprawdziłem) wpisuję po prostu adres do strony,
która jest na faktycznie serwerze WWW i jest zapisana jako plik z
polskim znakiem. To gdzie ja niby decyduję o jakimkolwiek kodowaniu?
Nie mówimy przecież o treści strony. Bo nie łapię tego przykładu z ISO.

pikny zenon

unread,
Aug 23, 2010, 9:06:37 PM8/23/10
to
W dniu 2010-08-24 01:07, porneL pisze:

>> http://domena.pl/ż%F3łć.html

Tylko mi nawet nie mówcie, że współczesne przeglądarki w ogóle nie
akceptują polskich znaków wpisywanych bezpośrednio do paska adresu,
tylko trzeba to tymi procentami kodować.

Bo jeśli tak, to co to ma wspólnego z przyjaznym linkiem, który ktoś
może chcieć wpisać z głowy i niekoniecznie jest Wami.

pikny zenon

unread,
Aug 23, 2010, 10:50:49 PM8/23/10
to
W dniu 2010-08-24 03:06, pikny zenon pisze:

> Tylko mi nawet nie mówcie, że współczesne przeglądarki w ogóle nie
> akceptują polskich znaków wpisywanych bezpośrednio do paska adresu,
> tylko trzeba to tymi procentami kodować.

Dobra, działają normalnie polskie litery z altem.
Na tym sprawdzałem:
http://pl.wikipedia.org/wiki/Masło

i też tak chce mieć, tylko u mnie jest na końcu po prostu .html
(a tu pewnie jakiś php albo mod_rewrite przetwarza po drodze).

Vax

unread,
Aug 24, 2010, 10:59:18 AM8/24/10
to
W dniu 2010-08-24 02:20, pikny zenon pisze:

przeglądarka wysyła zapytanie w kodowaniu i do serwera niekoniecznie
dociera to, co widzisz w pasku adresu.

Rozwijać można by długo, ale ja urle i tak przepuszczam via .htaccess
do (najczęściej) PHP, który mi np. z bazy wyciąga co trzeba, zaś
z serwerem gada w jego języku (bez polskich znaków, bo przy migracji
to proszenie się o problemy) - i do tego to, co biorę z serwera
nie zależy wprost od tego, co ktoś w linka raczył wpisać :)

Polskie znaki w url są ok, zagadnienia serwerowe musisz sam zwalczyć
(lecz nie oczukuj, że to, co zadziała w jednym miejscu, sprawdzi się
w drugim).

v.

porneL

unread,
Aug 24, 2010, 7:37:24 PM8/24/10
to
On Tue, 24 Aug 2010 01:26:49 +0100, pikny zenon <zenek-...@gazeta.pl>
wrote:

>> Zapomnij o przestarzałym ISO.


>
> Serwer stoi w zewn. hostingu.
> Do przeglądarek (kilka sprawdziłem) wpisuję po prostu adres do strony,
> która jest na faktycznie serwerze WWW i jest zapisana jako plik z
> polskim znakiem. To gdzie ja niby decyduję o jakimkolwiek kodowaniu?

Decydujesz podając link na swojej stronie. Ściągawka:

href="ó.html" ← to jest zawsze błędne. Efektem jest loteria kodowaniowa.
href="&oacute;.html" ← to jest zawsze błędne. Efekt taki sam, tylko
zwiększa się liczba błędnych kombinacji, jakie dostaniesz.
href="%F3.html" ← ISO. Dopuszczalne i zazwyczaj działa, ale nie wiadomo o
jaki znak ci chodzi (URL-e [a dokładniej IRI-e] z góry zakładają UTF-8, a
to nie jest prawidłowe UTF-8).
href="%C3%B3.html" ← UTF-8. Zalecana wersja, oznaczająca link do ó.html.

Niezależnie od wersji, znaki spoza ASCII i tak zostaną przekręcone przez
część botów, linkujących stron, itp.

Adresy wklepane ręcznie w przeglądarce (bez %XX) będą zakodowane w UTF-8
(z wyjątkiem pewnych trybów kompadebilności IE). Przeglądarki niekiedy
pokazują za-url-kodowane sekwencje UTF-8 jako znaki (tzn. do serwera idzie
%C3%B3, ale użytkownik na ekranie widzi ó).

No i to wszystko tyczy się tylko znaków w ścieżce i query string. Domeny
mają zupełnie inne kodowanie...

Taki Sobie Ktos

unread,
Aug 25, 2010, 9:25:14 AM8/25/10
to
Biorac pod uwage, ze i tak nie wszystkie przegladarki to "lykna" lepiej
chyba uzywac tradycyjnych czcionek, choc o polskich znakach gdzieniegdzie
slyszalem i to nawet chyba w adresach DNS. Swego czasu gdzies tez nawet
czytalem o pierwszej... arabskiej domenie!

Pozdrawiam, M.

"Vax" <ma...@zepsul.sie> wrote in message
news:i4ur5h$a12$1...@mx1.internetia.pl...


>W dniu 2010-08-23 21:49, pikny zenon pisze:
>

>> Sprawdzilem i nie dziala.
>
> ale co nie dziala?
> Niby IE lubi je zakodowac (choc w obrebie serwisu zachowuje
> sie raczej przyzwoicie), ale jedna linijka kodu mozna go przekonac,
> zeby nie cudowal.
>
>> A jesli jakos powinno, to wolalbym miec chyba
>>
>> http://domena.pl/zólc.html
>> niz


>> http://domena.pl/zolc.html.
>>
>> To jak to jest z tymi polskimi znakami w URL-u?
>

> Ja tam uzywam. Jezeli URL ma dawac "bonus do pozycjonowania"
> to chyba naturalne, ze ma wzmocnic slowo zólte a nie zolte
> i laska a nie laska.
>
> v.


Vax

unread,
Aug 25, 2010, 11:20:09 AM8/25/10
to
no pewnie, ze lepiej nie uzywac polskich czcionek wcale,
zwlaszcza na usenecie i odpowiadac nad nieprzycietym cytatem
i wrotka.


W dniu 2010-08-25 15:25, Taki Sobie Ktos pisze:


> Biorac pod uwage, ze i tak nie wszystkie przegladarki to "lykna" lepiej
> chyba uzywac tradycyjnych czcionek, choc o polskich znakach gdzieniegdzie
> slyszalem i to nawet chyba w adresach DNS. Swego czasu gdzies tez nawet
> czytalem o pierwszej... arabskiej domenie!

Nie, jednak przytnę i będę normalny.
Napisz mi, która mianowicie przeglądarka "nie łyknie".
Znam pewną, która w określonych okolicznościach przerabia
link na kodowany, ale pomijając fakt, że to wyłącznie kwestia
"estetyki" w pasku adresu, to jeszcze "fix" na takie zachowanie
zajmuje jedną linijkę kodu, zaś reszta nawigacji w witrynie
(poprzez polskich linków klikanie) odbywa się prawidłowo i bez
wyzwalania wzmiankowanego "fixa".
A taki google linki te indeksuje prawidłowo, chwaląc sobie
nadto (i odpowiednio doceniając) ich zgodność np. z frazami kluczowymi.

v.

Mateusz Papiernik

unread,
Aug 25, 2010, 12:56:52 PM8/25/10
to
W dniu 2010-08-24 04:50, pikny zenon pisze:

> (a tu pewnie jakiś php albo mod_rewrite przetwarza po drodze).

i to jest klucz do problemu.


--
Mateusz Papiernik
ma...@maticomp.net, http://www.maticomp.net
"One man can make a difference" - Wilton Knight

porneL

unread,
Aug 25, 2010, 6:33:20 PM8/25/10
to
On Wed, 25 Aug 2010 14:25:14 +0100, Taki Sobie Ktos
<maveri...@interia.pl> wrote:

> Biorac pod uwage, ze i tak nie wszystkie przegladarki to "lykna"

Kodowanie urlencode w ścieżkach łykają wszystkie przeglądarki od
pradawnych czasów.

Polskie znaki w domenach (IDN) to inna sprawa. W niezakodowanej postaci
działają tylko w nowych przeglądarkach, ale w postaci punycode są w pełni
kompatybilne wstecz (tylko wyglądają głupio w starych przeglądarkach).

> lepiej chyba uzywac tradycyjnych czcionek,

Znaki to nie czcionki. Polskie znaki w URL mogą działać nawet, jak ktoś
nie ma odpowiedniego fontu (bo czcionkami to się strzela z procy ;)

0 new messages