Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

php, linki z nazwami a $_GET, SEO

14 views
Skip to first unread message

Marcin Debowski

unread,
Nov 15, 2023, 11:59:44 PM11/15/23
to
Próbuję optymalizować strone pod wymagania googla. Przewija się sugestia
aby nazwy w url były (pełno)tekstowe raczej niż typu /?id=1, które mam
obecnie. Pytania:

(1) czy ma to faktyczny jakiś znaczący wpływ na pozycjonowanie?

(2) jeśli tak, czy wystarczy dać np. /?id=matkalenina, czy też to musi
być goła /matkalenina -> przykłady googla sugerują to ostatnie

(3) jeśli matkalenina musi być goła to jak to najlepiej zrobić, żeby tę
matkę lenina dostawać podobnie jak argument po "?"?

--
Marcin

Mateusz Viste

unread,
Nov 16, 2023, 5:06:47 AM11/16/23
to
dn. Thu, 16 Nov 2023 04:59:41 GMT, Marcin Debowski napisał:
> Próbuję optymalizować strone pod wymagania googla. Przewija się
> sugestia aby nazwy w url były (pełno)tekstowe raczej niż typu /?id=1,
> które mam obecnie. Pytania:
>
> (1) czy ma to faktyczny jakiś znaczący wpływ na pozycjonowanie?

Amatorsko administruję kilkoma stronami www. Te z URL-ami typu
"?id=123" są równie dobrze indeksowane, co te z fikuśniejszymi URL-ami.
Istotne natomiast jest, aby adres był kanoniczny/unikalny, oraz aby
zawartość strony była odpowiedniej jakości, a także aby linki do stron
były łatwe do znalezienia.

> (3) jeśli matkalenina musi być goła to jak to najlepiej zrobić, żeby
> tę matkę lenina dostawać podobnie jak argument po "?"?

W Apache służy do tego rozszerzenie mod_rewrite. Można np. ustawić w
.htaccess coś takiego:

RewriteEngine On
RewriteRule "^([0-9]+)" "?id=$1" [PT]

Powyższy regex łapie wyłącznie identyfikatory numeryczne. Dla innych
należy go odpowiednio dostosować.

Mateusz

Marcin Debowski

unread,
Nov 16, 2023, 8:38:55 PM11/16/23
to
On 2023-11-16, Mateusz Viste <mat...@x.invalid> wrote:
> dn. Thu, 16 Nov 2023 04:59:41 GMT, Marcin Debowski napisał:
>> Próbuję optymalizować strone pod wymagania googla. Przewija się
>> sugestia aby nazwy w url były (pełno)tekstowe raczej niż typu /?id=1,
>> które mam obecnie. Pytania:
>>
>> (1) czy ma to faktyczny jakiś znaczący wpływ na pozycjonowanie?
>
> Amatorsko administruję kilkoma stronami www. Te z URL-ami typu
> "?id=123" są równie dobrze indeksowane, co te z fikuśniejszymi URL-ami.

Indeksuje, ale czy nie obniża pozycji?

> Istotne natomiast jest, aby adres był kanoniczny/unikalny, oraz aby
> zawartość strony była odpowiedniej jakości, a także aby linki do stron
> były łatwe do znalezienia.
>
>> (3) jeśli matkalenina musi być goła to jak to najlepiej zrobić, żeby
>> tę matkę lenina dostawać podobnie jak argument po "?"?
>
> W Apache służy do tego rozszerzenie mod_rewrite. Można np. ustawić w
> .htaccess coś takiego:
>
> RewriteEngine On
> RewriteRule "^([0-9]+)" "?id=$1" [PT]
>
> Powyższy regex łapie wyłącznie identyfikatory numeryczne. Dla innych
> należy go odpowiednio dostosować.

Rozumiem, że w powyższym żądanie typu (przykład) /79 będzie
przekształcone do ?id=79?

W sumie jako takich numerycznych nie potrzebuję, a jedynie unikatowych,
bo tekstowe mnie też zadawalają. W tej chwili baza sql jest odpytywana
po indeksie, ale nic nie stoi na przeszkodzie aby dodac kolumne,
zmapować nazwy i wołać rekord po nazwie.

Jakos tak?:

RewriteRule "^([A-Za-z\-_])+" "?id=$1" [PT]

Tam jest potrzebny "escape" przy trzecim "-"?

Dzięki.

--
Marcin

Mateusz Viste

unread,
Nov 17, 2023, 3:24:48 AM11/17/23
to
dn. Fri, 17 Nov 2023 01:38:51 GMT, Marcin Debowski napisał:
> > Amatorsko administruję kilkoma stronami www. Te z URL-ami typu
> > "?id=123" są równie dobrze indeksowane, co te z fikuśniejszymi
> > URL-ami.
>
> Indeksuje, ale czy nie obniża pozycji?

Dobre pytanie, w sumie to nie wiem. Tematyka tych moich stron jest
na tyle niszowa, że tak czy inaczej jestem na pierwszym miejscu więc
trudno mi określić jak to mogłoby wyglądać przy konkurencji.

> > RewriteEngine On
> > RewriteRule "^([0-9]+)" "?id=$1" [PT]
> >
> > Powyższy regex łapie wyłącznie identyfikatory numeryczne. Dla innych
> > należy go odpowiednio dostosować.
>
> Rozumiem, że w powyższym żądanie typu (przykład) /79 będzie
> przekształcone do ?id=79?

Dokładnie tak. Podobnej regułki używam np. tutaj:
https://ulwarre.pl/forum/

Wątki na forum dostępne są pod linkami typu /forum/xyz, ale po
przejściu przez MOD_REWRITE moje PHP dostaje tak naprawdę zapytania w
postaci /forum/?thread=xyz (zresztą obie formy działają publicznie).

Oczywiście równie dobrze możesz użyć słów zamiast numerycznych
wartości. Jak używam numerycznych tylko dlatego, że łatwo jest je
zabezpieczyć. Wystarczy argument przepuścić przez intval() i już mam
gwarancję, że nikt mi tu żadnego sqla czy innega dziadostwa nie
wstrzyknie. Słowa też można zabezpieczyć, ale potrzeba nieco więcej
uwagi.

Możesz też użyć kilku reguł naraz, np. żeby przekierować zapytania do
innego pliku php w zależności od pierwszej litery słowa, czy tam innego
dyskryminatora.

> Jakos tak?:
>
> RewriteRule "^([A-Za-z\-_])+" "?id=$1" [PT]
>
> Tam jest potrzebny "escape" przy trzecim "-"?

Do testowania regexów możesz użyć tego fajnego narzędzia:
https://www.regexpal.com/

Twoja regułka na oko wygląda dobrze, tylko uważaj na skutki uboczne.
Np. jeśli będziesz chciał opublikować później jakiś prawilny plik typu
"mojastrona.pl/plik_do_pobrania", to ten wpadnie w RewriteRule i
zostanie przetłumaczony na "?id=plik_do_pobrania". Warto od startu
pomyśleć nad jakąś nomenklaturą, żeby później nic nie miało szans się
pomieszać.

Mateusz

Marcin Debowski

unread,
Nov 18, 2023, 8:27:23 PM11/18/23
to
On 2023-11-17, Mateusz Viste <mat...@x.invalid> wrote:
> dn. Fri, 17 Nov 2023 01:38:51 GMT, Marcin Debowski napisał:
>> > Amatorsko administruję kilkoma stronami www. Te z URL-ami typu
>> > "?id=123" są równie dobrze indeksowane, co te z fikuśniejszymi
>> > URL-ami.
>>
>> Indeksuje, ale czy nie obniża pozycji?
>
> Dobre pytanie, w sumie to nie wiem. Tematyka tych moich stron jest
> na tyle niszowa, że tak czy inaczej jestem na pierwszym miejscu więc
> trudno mi określić jak to mogłoby wyglądać przy konkurencji.

Mnie właśnie zastanawiają perrory googla ntt no i to, że jak patrzysz na
różne strony, to jednak praktycznie wszystkie mają przynajmnien wstawki
wyrazowe w adresach. Te co się specjalizują w seo to zwykle wszystko
mają wyrazowo.

>> > RewriteEngine On
>> > RewriteRule "^([0-9]+)" "?id=$1" [PT]
>> >
>> > Powyższy regex łapie wyłącznie identyfikatory numeryczne. Dla innych
>> > należy go odpowiednio dostosować.
>>
>> Rozumiem, że w powyższym żądanie typu (przykład) /79 będzie
>> przekształcone do ?id=79?
>
> Dokładnie tak. Podobnej regułki używam np. tutaj:
> https://ulwarre.pl/forum/
>
> Wątki na forum dostępne są pod linkami typu /forum/xyz, ale po
> przejściu przez MOD_REWRITE moje PHP dostaje tak naprawdę zapytania w
> postaci /forum/?thread=xyz (zresztą obie formy działają publicznie).

Nb. nie da się jakoś bez GET, dając REWRITE na twardo w konfiguracji z
przekierowaniem do jednego pliku (np. index.php) bez żadnych parametrów
a potem analizować po $_SERVER['REQUEST_URI'] czy to będzie wtedy
wskazywać zawsze /index.php?

> Oczywiście równie dobrze możesz użyć słów zamiast numerycznych
> wartości. Jak używam numerycznych tylko dlatego, że łatwo jest je
> zabezpieczyć. Wystarczy argument przepuścić przez intval() i już mam
> gwarancję, że nikt mi tu żadnego sqla czy innega dziadostwa nie
> wstrzyknie. Słowa też można zabezpieczyć, ale potrzeba nieco więcej
> uwagi.

Racja.

> Możesz też użyć kilku reguł naraz, np. żeby przekierować zapytania do
> innego pliku php w zależności od pierwszej litery słowa, czy tam innego
> dyskryminatora.
>
>> Jakos tak?:
>>
>> RewriteRule "^([A-Za-z\-_])+" "?id=$1" [PT]
>>
>> Tam jest potrzebny "escape" przy trzecim "-"?
>
> Do testowania regexów możesz użyć tego fajnego narzędzia:
> https://www.regexpal.com/

A dzięki. SKorzystam.

> Twoja regułka na oko wygląda dobrze, tylko uważaj na skutki uboczne.
> Np. jeśli będziesz chciał opublikować później jakiś prawilny plik typu
> "mojastrona.pl/plik_do_pobrania", to ten wpadnie w RewriteRule i
> zostanie przetłumaczony na "?id=plik_do_pobrania". Warto od startu
> pomyśleć nad jakąś nomenklaturą, żeby później nic nie miało szans się
> pomieszać.

Tam powinno być trochę więcej, bo np. "?id=" powinny przechodzić bez
modyfikacji. Ale też można to zrobić już na poziomie php. Co pasuje to
pasuje, dalej sprawdzenie czy nie ?id="?id=", reszta przekierowana do np.
?id=0.

--
Marcin

Mateusz Viste

unread,
Nov 19, 2023, 2:22:00 PM11/19/23
to
dn. Sun, 19 Nov 2023 01:27:17 GMT, Marcin Debowski napisał:
> Nb. nie da się jakoś bez GET, dając REWRITE na twardo w konfiguracji
> z przekierowaniem do jednego pliku (np. index.php) bez żadnych
> parametrów a potem analizować po $_SERVER['REQUEST_URI'] czy to
> będzie wtedy wskazywać zawsze /index.php?

Można, jasne - nikt nie broni. :)
Sposób działania ten sam: MOD_REWRITE. Pewnie coś takiego starczy:

RewriteRule ".*" "/index.php" [PT]

$_SERVER['REQUEST_URI'] powinien zawierać oryginalny (niezmieniony) URL
o który pyta klient. Alternatywnie możesz zwyczajnie podać oryginalny
URL swojemu PHP, tj. to ".*" powyżej traktować jak argument.
Dokumentacja zawiera zresztą dokładnie taki przykład:

https://httpd.apache.org/docs/2.4/rewrite/flags.html

(szukaj pod flagą "LAST")

Idąc w takie rozwiązanie szybko zaczniesz odkrywać koło na nowo.
Np. każdy obrazek będziesz musiał wyszukiwać sam, wykrywać MIME,
budować wirtualne linki, itd. Jeśli to, co budujesz jest jakkolwiek
rozbudowane, to takie podejście jest doskonałym sposobem na zapewnienie
sobie zajęcia na lata.

Kiedyś poszedłem w podobnym kierunku, skończyło się na tym, że
napisałem od zera własny serwer HTTP żeby mieć nad wszystkim 100%
kontroli. Fajna zabawa na samotne wieczory z komputerem, ale dziś już
bym się na to nie pisał.

Mateusz

0 new messages