Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

alasivut googlessa

0 views
Skip to first unread message

yonez

unread,
Jul 18, 2008, 3:33:58 AM7/18/08
to
miten tai milläperusteella joillekkin sivustoille google luettelee
hakutuloksen alla alasivut, esim jos googleen kirjotat sanan kawasaki niin
hakutuloksen alla luetellaan eri mallit. Tuleeko tuo toiminto
automaattisesti vai onko siihen joku temppu olemassa.

- yonez


Jori Mantysalo

unread,
Jul 21, 2008, 6:54:22 AM7/21/08
to
yonez <joun...@gmail.com> kirjoitti:

Tulee automaattisesti. Eroakirkosta.fi:n osalle tuo ilmestyi jo
ainakin vuosi sitten. Ainakin EK:n osalta tuo näyttää noin suunnilleen
sivuston osiot, ei kuitenkaan siinä järjestyksessä tai täsmälleen ne,
jotka ovat sivuston navigointipalkissa pääosioina. Päättelen, että Google
ei yritäkään parsia sivun ulkoasua eikä suoraan edes sivuston sisäistä
linkkirakennetta, vaan käyttää linkkirakennetta ja ilmeisesti muilta
sivuilta osoittavia linkkejä tuohon kuvaukseensa.

--
"Mutta senhän takia Mäntysalo juuri olikin värvätty kokouksen
puhtaaksikirjoitustehtäviin: hänen tajunnanahtaudestaan ja
perehtymättömyydestään voisi olla enemmän vahinkoa jos hän oikeasti
yrittäisi esimerkiksin arvioida jotakin tai johtaa jotakin." -- KS

Jukka K. Korpela

unread,
Jul 24, 2008, 9:54:55 AM7/24/08
to
Scripsit Jori Mantysalo:

> yonez <joun...@gmail.com> kirjoitti:
>
>> miten tai milläperusteella joillekkin sivustoille google luettelee
>> hakutuloksen alla alasivut, esim jos googleen kirjotat sanan
>> kawasaki niin hakutuloksen alla luetellaan eri mallit. Tuleeko tuo
>> toiminto automaattisesti vai onko siihen joku temppu olemassa.
>
> Tulee automaattisesti.

Niin Google itsekin kertoo:
http://www.google.com/support/webmasters/bin/answer.py?answer=47334&topic=8523
Sanakäänteet ovat sellaisia, että rivien välistä voi aika helposti ja
varmasti lukea: "Me ei kerrota yksityiskohtia, koska urvelot ja häiriköt
kuitenkin yrittäisivät väärinkäyttää tietoja huijausyrityksiinsä, joista
olisi meille ja käyttäjille liikaa riesaa."

Google käyttää nimitystä "Sitelinks", suomeksi "sivustolinkit".
Ilmauksena se on aika mitäänsanomaton, mutta siitä lienee jo muodostunut
jonkinlainen käsite termeineen.

> Eroakirkosta.fi:n osalle tuo ilmestyi jo ainakin vuosi sitten.

Onnittelut. On vaikea sanoa, millaisesta arvonnasta on kyse ja missä
määrin asia riippuu sivuston rakenteesta ja laadusta, mutta joka
tapauksessa on hyvä, että on saanut sivustolinkit. Luulenpa, että niitä
osittain jopa pidetään itsessään osoituksena sivuston laadusta.

> Ainakin EK:n osalta tuo näyttää noin suunnilleen
> sivuston osiot, ei kuitenkaan siinä järjestyksessä tai täsmälleen ne,
> jotka ovat sivuston navigointipalkissa pääosioina. Päättelen, että
> Google ei yritäkään parsia sivun ulkoasua eikä suoraan edes sivuston
> sisäistä linkkirakennetta, vaan käyttää linkkirakennetta ja
> ilmeisesti muilta sivuilta osoittavia linkkejä tuohon kuvaukseensa.

Eräänlaisen kilpailijanne Evl.fi:n sivustolinkeissä on mm. "Miksi kuulun
kirkkoon", vaikka tällaista linkkiä ei pääsivulla ole (ainakaan nyt)
lainkaan. Muutenkin havainnot tukevat arvioitasi. Ehkä Google pitää
lähtökohtana pääsivun linkkejä, mutta tätä informaatiota se varmaan
täydentää ja muuntaa eri perusteilla. Uskottavampaa kuitenkin taitaa
olla, että pääsivu ei ole erikoisasemassa

Lisäveikkauksena esitän arvelun, että Google myös laskee, miten usein
sivuston jollekin sivulle mennään Googlen hakutulosten kautta. Jos
tällaisia sivuja on paljon, Google luullakseni arvioi jakaumaa: jos
pienehkö sivujen joukko nousee jakaumasta esille selvästi, niin Google
rakentaa sivustolinkit.

Spekulaation selitystä: Jos siis Googlen hakutulosten kautta mennään
jonkin sivuston sivuihin aika tasaisesti tai jos jakaumasta nousee vain
pari sivua esiin, niin sivustolinkkejä ei tule. Sen sijaan ne
ilmestyvät, jos esiin nousee noin puoli tusinaa sivuja, joille mennään
selvästi useammin kuin muille. Tässä on oma kaunis logiikkaansa.

Toisaalta muiden sivustojen linkit voivat myös olla olennaisia, ehkä
yhtä tärkeitä. Ne kuitenkin saattavat helpommin sisältää huijausta (ns.
linkkifarmeja). Tosin nyt taitaa jo olla liikkeellä hakuhuijareita,
jotka panevat robotin tekemään tiheästi Google-hakuja siten, että
halutun sivuston sivuja tulee tuloksiin ja niitä "klikataan" (eli
robotti seuraa linkkiä, vain jotta sivun status Googlen silmissä
nousisi).

Mahdollisesti yksi olennainen kysymys on, onko sivustolla oma
verkkotunnus (domain), siis tyyppiä http://www.foobar.example oleva
osoite vastakohtana tyyppiä http://www.foobar.example/jokinpolku/
olevalle. Ainakaan ei nyt tule mieleen sivustoa, jolla olisi
sivustolinkit ilman, että sillä on omaa verkkotunnusta. Hm...
pitäisiköhän nähdä vaivaa...

No, minäkään en (vielä) osaa selittää kaikkea enkä esimerkiksi osaa
arvailla, miksi Helsingin yliopistolla ei ole sivustolinkkejä, ei
myöskään Helsingin kaupungilla eikä monella muulla isolla (ja
isosivustoisella) kaupungilla.

--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/

Antti Penttala

unread,
Jul 25, 2008, 3:59:51 AM7/25/08
to
Jori Mantysalo <jm5...@uta.fi> wrote:

> Ainakin EK:n osalta tuo näyttää noin suunnilleen
> sivuston osiot, ei kuitenkaan siinä järjestyksessä tai täsmälleen ne,
> jotka ovat sivuston navigointipalkissa pääosioina. Päättelen, että
> Google ei yritäkään parsia sivun ulkoasua eikä suoraan edes sivuston
> sisäistä linkkirakennetta, vaan käyttää linkkirakennetta ja ilmeisesti
> muilta sivuilta osoittavia linkkejä tuohon kuvaukseensa.

Minulla on samanlaisia havaintoja. Työpaikan sivut uusittiin keväällä.
Rakenne muuttui hieman ja linkkien pääte muuttui .html -> .php. Vanhoista
.html-päätteisistä osoitteista on uudelleenohjaus uusille sivuille.

Googlen alasivulinkit ovat osittain päivittyneet sivuston sisäisiä linkkejä
vastaaviksi, mutta ensimmäinen niistä osoittaa edelleen vanhaan .html-
päätteiseen osoitteeseen, johon webissä on muilla sivuilla paljon linkkejä.
(Kyseessä siis Google-haku Finnpanel ja ensimmäinen alasivulinkki
Tuloksia.)

Antti

Jori Mantysalo

unread,
Jul 25, 2008, 6:15:18 AM7/25/08
to
Jukka K. Korpela <jkor...@cs.tut.fi> kirjoitti:

>>> miten tai milläperusteella joillekkin sivustoille google luettelee
>>> hakutuloksen alla alasivut

>> Tulee automaattisesti.

> Niin Google itsekin kertoo:
> http://www.google.com/support/webmasters/bin/answer.py?answer=47334&topic=8523
> Sanakäänteet ovat sellaisia, että rivien välistä voi aika helposti ja
> varmasti lukea: "Me ei kerrota yksityiskohtia, koska urvelot ja häiriköt
> kuitenkin yrittäisivät väärinkäyttää tietoja huijausyrityksiinsä, joista
> olisi meille ja käyttäjille liikaa riesaa."

Linkki ei toiminut. "Sitelinks" -haulla se löytyi.

Tuo on kyllä tosin arvattavissa. Googlen työ olisi kertaluokkaa
helpompaa ellei olisi linkkispammereita ym.

>> Eroakirkosta.fi:n osalle tuo ilmestyi jo ainakin vuosi sitten.

> Onnittelut. On vaikea sanoa, millaisesta arvonnasta on kyse ja missä
> määrin asia riippuu sivuston rakenteesta ja laadusta, mutta joka
> tapauksessa on hyvä, että on saanut sivustolinkit. Luulenpa, että niitä
> osittain jopa pidetään itsessään osoituksena sivuston laadusta.

Voi olla. Itse en ole oikein oppinut niitä käyttämään.

Näyttäisi siltä, että sitelinks ei ole tarkoitettukaan oikeastaan
*haun* helpottamiseen, vaan se ikäänkuin antaa jo tiivistelmän
sivustosta. Jos nimittäin hakee "eroakirkosta", niin nuo tulevat,
mutta jos hakee "kirkollisvero", niin eivät.

Jotenkin tuntuu siltä, että tuolle olisi tarvetta vain hyvin
*huonoilla* sivustoilla: jos esim. "huolto" -linkkiä ei vekottimen
valmistajan sivulla selvästi ole, niin sitten tuo Googlen ominaisuus
auttaa.

Toisaalta voisi ajatella, että nimenomaan "kirkollisvero" -haussa
Google voisi arvata että erolomakkeelle kävijä varsinaisesti on
menossa.

> Lisäveikkauksena esitän arvelun, että Google myös laskee, miten usein
> sivuston jollekin sivulle mennään Googlen hakutulosten kautta.

Onko Googlella todella tätä tietoa käytettävissään? Se olisi kyllä
erittäin hyödyllistä, mutta yksityisyyden suoja vaarantuisi oikein
reippaasti.

Ainakin normaalissa Googlen tulossivussa on vain normaaleja linkkejä
malliin uta.fi eikä google.fi/seuraalinkkia.php?sivu=uta.fi. Mutta
ehkä selain lähettää tietoa, jos siinä on joku Googlen lisäpalikka.

> No, minäkään en (vielä) osaa selittää kaikkea enkä esimerkiksi osaa
> arvailla, miksi Helsingin yliopistolla ei ole sivustolinkkejä, ei
> myöskään Helsingin kaupungilla eikä monella muulla isolla (ja
> isosivustoisella) kaupungilla.

Espoo, Vantaa ja Tampere ainakin ovat saaneet linkit.

Epäilen, että Helsinki.fi sisältää yliopiston ja kaupungin, ja tämän
vuoksi ei näytetä alasivuja, koska niitä olisi vain kaksi.

Jukka K. Korpela

unread,
Jul 25, 2008, 6:58:53 AM7/25/08
to
Scripsit Jori Mantysalo:

> Näyttäisi siltä, että sitelinks ei ole tarkoitettukaan oikeastaan
> *haun* helpottamiseen, vaan se ikäänkuin antaa jo tiivistelmän
> sivustosta.

Tiivistelmän sivustosta, vastakohtana tiivistelmälle pelkästä sivusta?
Kenties. Mutta ne ovat linkkejä, ja uskon, että ne on tarkoitettu
ensisijassa pikalinkeiksi. Erityisen selvä esimerkki: haku
helsinki-vantaa tuottaa tietyn lentoaseman sivun, ja siellä on
pikalinkit

Saapuvat lennot
Lähtevät lennot
In English
Pysäköinti Matkalle lähtö
Aikataulujen haku
Koko lista
Bussit


jotka uskoakseni tarjoavat oikotien yli 90 %:lle ihmisistä, jotka
etsivät kyseisen sivuston löytääkseen sieltä käytännön tietoa omiin
tarpeisiinsa. Näin he voivat ohittaa suhteellisen raskaan ja ehkä
sekavankin pääsivun (tässä tapauksessa sellaisen, jolla fonttikoko
ja -väri on kärpäsenkakkatasoa ja tämän vakuudeksi sivulla lyllertää
ympäriinsä jokin lutikka vai mikä leppäpirkko se lienee). Tässä tietoa
etsivä ihminen voittaa, Google saa ansaitut aplodit ja sivuston
tekijät... no jaa.

> Jos nimittäin hakee "eroakirkosta", niin nuo tulevat,
> mutta jos hakee "kirkollisvero", niin eivät.

Kyse on nähdäkseni siitä, onko sivuston _pääsivu_ osumien alkupäässä.

> Jotenkin tuntuu siltä, että tuolle olisi tarvetta vain hyvin
> *huonoilla* sivustoilla: jos esim. "huolto" -linkkiä ei vekottimen
> valmistajan sivulla selvästi ole, niin sitten tuo Googlen ominaisuus
> auttaa.

Kieltämättä "sivustolinkit" auttavat silloin, kun sivuston usein
käytetyt sivut ovat hankalasti löydettävissä sivuston omalla
navigoinnilla.

>> Lisäveikkauksena esitän arvelun, että Google myös laskee, miten usein
>> sivuston jollekin sivulle mennään Googlen hakutulosten kautta.
>
> Onko Googlella todella tätä tietoa käytettävissään? Se olisi kyllä
> erittäin hyödyllistä, mutta yksityisyyden suoja vaarantuisi oikein
> reippaasti.

Olen ollut ymmärtävinäni, että erilaisten Google toolbarien ja muiden
vastaavien härpäkkeiden perusideaan kuuluu, että Google saa tietoa
paitsi siitä, mitä ihmiset hakevat, myös siitä, mitä he tekevät
hakutuloksilla. Tässä on tietysti mahtavasti potentiaalia tiedon
hyödyntämiseen eri tavoilla.

> Ainakin normaalissa Googlen tulossivussa on vain normaaleja linkkejä
> malliin uta.fi eikä google.fi/seuraalinkkia.php?sivu=uta.fi. Mutta
> ehkä selain lähettää tietoa, jos siinä on joku Googlen lisäpalikka.

En enää tiedä mikä on normaalia ja mikä ei, mutta tavanomaisen
näköisessä tulossivussa linkit näyttävät sisältävän
onmousedown-määritteen, jossa suositetaan jokin kohtalaisen tehokkaasti
obfuskoitu JavaScript-koodin läjä.

> Espoo, Vantaa ja Tampere ainakin ovat saaneet linkit.

Hämmentävää... kun käytin englanninkielistä Googlea, sain tampere-haulla
seuraavan osuman (toisena listassa):

Tampere- [ Translate this page ]Yleistä tietoa kaupungista ja sen
tapahtumista, karttoja ja aikatauluja sekä Web-kamera.

www.tampere.fi/ - 24k - Cached - Similar pages - Note this


Sen sijaan suomenkielisellä Googlella haetussa osumassa on
sivustolinkit.

> Epäilen, että Helsinki.fi sisältää yliopiston ja kaupungin, ja tämän
> vuoksi ei näytetä alasivuja, koska niitä olisi vain kaksi.

Voi olla, että pseudoportaalisekoilu sotkee tätäkin asiaa, mutta
ymmärtääkseni Googlen sivustolinkit eivät rajoitu "osiotasolle" (eikä
Google ehkä edes osioita tunnista), vaan mikä hyvänsä sivu voi päästä
sivustolinkkeihin, jos se on tarpeeksi suosittu. Olisi siis
odotettavissa, että www.helsinki.fi:ssä olisi muutama yliopiston
sivuihin viittaava sivustolinkki ja muutama kaupungin sivuihin
viittaava.

Www.hel.fi on puhtaasti kaupungin sivusto, mutta eipä sielläkään ole
sivustolinkkejä.

Jori Mantysalo

unread,
Jul 25, 2008, 9:03:47 AM7/25/08
to
Jukka K. Korpela <jkor...@cs.tut.fi> kirjoitti:

>> Näyttäisi siltä, että sitelinks ei ole tarkoitettukaan oikeastaan


>> *haun* helpottamiseen, vaan se ikäänkuin antaa jo tiivistelmän
>> sivustosta.

> Tiivistelmän sivustosta, vastakohtana tiivistelmälle pelkästä sivusta?
> Kenties. Mutta ne ovat linkkejä, ja uskon, että ne on tarkoitettu
> ensisijassa pikalinkeiksi.

Tavallaan sama asia: molemmissa tapauksissa tieto löytyy nopeammin
kuin koko data läpi käymällä. (Google 2.0 kai sitten tekee itse
sivun tekstistäkin tiivistelmän. :=) )

>> Jos nimittäin hakee "eroakirkosta", niin nuo tulevat,
>> mutta jos hakee "kirkollisvero", niin eivät.

> Kyse on nähdäkseni siitä, onko sivuston _pääsivu_ osumien alkupäässä.

Totta joo, "kirkosta eroaminen" tuo sivustolinkit. Mutta tällöin
siis Googlella todella on käytössä käsite 'pääsivu'.

>>> Lisäveikkauksena esitän arvelun, että Google myös laskee, miten usein
>>> sivuston jollekin sivulle mennään Googlen hakutulosten kautta.
>>
>> Onko Googlella todella tätä tietoa käytettävissään?

>> Ainakin normaalissa Googlen tulossivussa on vain normaaleja linkkejä


>> malliin uta.fi eikä google.fi/seuraalinkkia.php?sivu=uta.fi. Mutta
>> ehkä selain lähettää tietoa, jos siinä on joku Googlen lisäpalikka.

> En enää tiedä mikä on normaalia ja mikä ei, mutta tavanomaisen
> näköisessä tulossivussa linkit näyttävät sisältävän
> onmousedown-määritteen, jossa suositetaan jokin kohtalaisen tehokkaasti
> obfuskoitu JavaScript-koodin läjä.

Ahaa, katsoin vain minne linkki osoittaa. Enpä ole katsonutkaan vuosiin
miltä Googlen tulossivu koodina näyttää.

Tuon ja Google Toolbarin ym. lisäksi Google voi saada hieman tietoa
myös Google Analytics -työkalusta. Silloinhan Google saa jopa selville
sen, minne surffailija sivustolla päätyy, vaikka tällä ei olisi
selaimessa lisäosia. Tämä ei kuitenkaan selitä eroakirkosta.fi
-juttua, koska EK:lla ei ole GA käytössä. (Eikä tule - ei ole varaa
pieneenkään luottamusta vähentävään asiaan.)

Melkein pelottavaa. Tuohon lisäksi gmail ja Google Maps, GoogleDocs
yms, ja huomioidaan paljonko tallennustilaa firmalla on, niin
monenkohan vuoden surffailuhistoria, meilit, pikaviestit ja muukin
data tuolta voi löytyä?

Jukka K. Korpela

unread,
Jul 25, 2008, 2:22:02 PM7/25/08
to
Scripsit Jori Mantysalo:

> Totta joo, "kirkosta eroaminen" tuo sivustolinkit. Mutta tällöin
> siis Googlella todella on käytössä käsite 'pääsivu'.

Käytössä kai siinä mielessä, että se esittää sivustolinkkejä vain
silloin, kun löytyneen sivun osoite on muotoa http://www.example.com
ilman polkuosaa. Näin siis arvelen, kuten aiemmin mainitsin, ilman sen
kummempaa evidenssiä kuin että muunlaisia ei ole sattunut silmiin.

> Melkein pelottavaa. Tuohon lisäksi gmail ja Google Maps, GoogleDocs
> yms, ja huomioidaan paljonko tallennustilaa firmalla on, niin
> monenkohan vuoden surffailuhistoria, meilit, pikaviestit ja muukin
> data tuolta voi löytyä?

Niinpä. Näennäisen triviaali data (sellaistahan meidän meilimme sun muut
enimmäkseen ovat vähänkin kauempaa katsottuna) saakin suuren merkityksen
ja (taloudellisenkin) arvon, kun sitä on paljon ja sitä voi käsitellä
tehokkaasti.

Huomattava merkitys on jo sillä, että - Googlesta yms. ihan
riippumatta - normaali sivustokohtainen hakutoiminto voidaan tehdä
sellaiseksi, että kaikki haut (ja niiden tuloksellisuus) tallennetaan
tietokantaan. Sieltä voidaan sitten louhia vaikka mitä,
yksinkertaisimmillaan esimerkiksi tietoa siitä, miten ihmisen oikeasti
etsivät, ja tämän perusteella sitten voidaan parantaa sivustoa. Tämä
tosin on työlästä ja tuottaa vain parempaa palvelua, ei rahaa. :-)

0 new messages