Schemi di metadati nelle pagine web

51 views
Skip to first unread message

Andrea Zanni

unread,
Mar 1, 2018, 6:22:37 AM3/1/18
to spaghett...@googlegroups.com
Ciao a tutti,
ho un dubbio che vorrei sottoporvi. Una breve premessa per il contesto.

Nell'ambito del mio lavoro, mi capita di fare formazione per bibliotecari: spiegare Internet Archive & Wikisource, Openrefine (nuovo corso di quest'anno), e anche open data.
La lezione sugli open data è semplice: gli spiego semplicemente il significato di parole come open data, Creative Commons, LOD, ecc.

E gli spiego schemi di metadati diversi da quelli che conoscono: Dublin Core e Schema.org (i bibliotecari hanno schemi complicatissimi come MARC, che usano solo loro). Glieli spiego proprio perchè il bibliotecario vive di dati in un silos la cui architettura/uso/funzione/formato è vecchia di almeno trent'anni...

E andrebbe tutto bene se non che l'altro giorno parlavo con un professionista che fa siti per lavoro e mi spiegava che non usava nè Dublin Core nè Schema.org da millenni, che adesso è tutto SEO puro (non che abbia capito cosa intendesse).
Per cui mi ha fatto venire il dubbio che non esista più nessuno schema, nelle buone pratiche di un dev, per fare una pagina web un minimo strutturata.

Che ne pensate, aveva ragione lui e sono rimasto indietro io? Voi scrapatori folli come fate? Opengraph di FB è forse un esempio migliore?

Grazie,

Andrea  

Donato De Ieso

unread,
Mar 1, 2018, 6:52:40 AM3/1/18
to Spaghetti Open Data
Ciao Andrea,
sviluppo web dal 1998, anche se adesso sono molto di più in APP, AI, AR, machine learning ecc.

Chi ti ha dato queste informazioni purtroppo non è ben informato. Schema org ad esempio così come i rich text  sono super utilizzati e super indicizzati!
Opengraph di FB è molto utile per la parte di article da condivisione.

andy

unread,
Mar 1, 2018, 7:14:51 AM3/1/18
to spaghett...@googlegroups.com
schema.org è un riferimento importante.

E poi gli esperti SEO dovrebbero leggere questo https://developers.google.com/search/docs/guides/ 

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo https://groups.google.com/group/spaghettiopendata.
Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/spaghettiopendata/aef34791-3106-479c-8dcb-2b9d478bc83e%40googlegroups.com.
Per altre opzioni visita https://groups.google.com/d/optout.
--

______
Scusami per la brevità, ti sto scrivendo dal cellulare.

website: https://medium.com/tantotanto
38° 7' 48" N, 13° 21' 9" E EPSG:4326

Alfredo Serafini

unread,
Mar 1, 2018, 8:32:37 AM3/1/18
to Spaghetti Open Data
quoto Andrea ed aggiungo che anzi con HTML5 viene interpretata la semantica dei vari blocchi (article/section/header etc...) e i microformati (schemaorg, dublincore, etc) sono generalmente usati tramite opportuni attributi data etc
tra l'altro google proprio allo scopo di interpretare (ed indicizzare) meglio questo tipo di metadati nella propria knowledge base ha acquisito tempo fa freebase...



Il giorno giovedì 1 marzo 2018 12:22:37 UTC+1, Andrea Zanni ha scritto:

Matteo Brunati

unread,
Mar 3, 2018, 1:30:32 PM3/3/18
to Spaghetti Open Data


Il giorno giovedì 1 marzo 2018 12:22:37 UTC+1, Andrea Zanni ha scritto:
Ciao Andrea, 
su questo potrei scrivere ore :) Se ne avessi tempo. 

Mai come oggi sono tanto importanti i dati strutturati e i metadati. 

Quando dici:

E gli spiego schemi di metadati diversi da quelli che conoscono: Dublin Core e Schema.org (i bibliotecari hanno schemi complicatissimi come MARC, che usano solo loro). Glieli spiego proprio perchè il bibliotecario vive di dati in un silos la cui architettura/uso/funzione/formato è vecchia di almeno trent'anni...
E andrebbe tutto bene se non che l'altro giorno parlavo con un professionista che fa siti per lavoro e mi spiegava che non usava nè Dublin Core nè Schema.org da millenni, che adesso è tutto SEO puro (non che abbia capito cosa intendesse). 
Per cui mi ha fatto venire il dubbio che non esista più nessuno schema, nelle buone pratiche di un dev, per fare una pagina web un minimo strutturata.
 
Che ne pensate, aveva ragione lui e sono rimasto indietro io? Voi scrapatori folli come fate? Opengraph di FB è forse un esempio migliore?

Primo: gli esseri umani sono pigri, gli sviluppatori ancora di più e chi pubblica i contenuti forse non è da meno. Fornire metadati di qualità nel web è quasi come affrontare una delle fatiche di Ercole. Un lavoro infinito, che in piccole parti si può fare, ma nel grande Web non si può dare per scontato. Avrebbe alzato di troppo la barriera all'ingresso. Non mi sembra certo che i metadati - e schema.org - siano in crisi, anche se è un po' che non entro nel dettaglio. Sono un livello di infrastruttura da addetti ai lavori. Alcune idee dei volumi qui: http://webdatacommons.org/structureddata/

Secondo: lo sviluppatore e chi progetta e gestisce la struttura - anche semantica - di una pagina web non dovrebbero essere la stessa persona, sono ruoli e competenze diverse. Almeno in un mondo ideale. In ogni caso, essere attenti ai metadati e alla struttura della pagina non mi pare sia qualcosa da mettere in secondo piano:
Searchscape è uno dei miei riferimenti quando cerco aggiornamenti veloci, molto bello. I metadati sono importanti anche per la rielaborazione del contenuto in forme più granulari: l'anteprima nei social (che usano le Twitter Cards o i metadati dell'OpenGraph di Facebook), una scheda nella SERP di Google visibile sono dal dispositivo mobile, etc... Ricondurre l'investimento nella cura dei metadati solo alla SEO è rischioso. 

Terzo: i dati strutturati hanno adottato modelli e formati che provengono da molti mondi, anche dai LOD. L'OpenGraph usa RDF (è un sottoinsieme del modello RDF e usa una sintassi RDFa del tutto valida).

SEO e dati strutturati: Google ha evitato di rendere esplicito il legame causa effetto (se il tuo metadato è così, allora il contenuto lo mostrerò colà) soprattutto per abusi spam e di posizionamento, immagino. Troppo facile far emergere le informazioni corrette, ancor più facile abusarne. Almeno per i rich snippets.
Non dimenticarsi, poi, che il knowledge graph di Google (alla base dei vari assistenti vocali e interfacce varie di accesso) si arricchisce con i dati strutturati che gli diamo in pasto - 27/11/2017
Qualcosa che avevo sfiorato in un post del 2015[1]: Google che fornisce direttamente risposte alle nostre intenzioni di ricerca, rompendo il legame tradizionale tra risultato della pagina nelle SERP e ruolo di intermediazione del motore. Le fornisce sempre più in maniera diretta, specie dai fatti alla wikidata. Pagheremo gli snippets? Pagheremo le card informative? Probabile. Forse è questo che rende così complesso dare un valore esplicito ai metadati, no? Per la SEO tradizionale almeno.

Comunque più metadati (espressi secondo vocabolari condivisi) e struttura ha un contenuto web, maggiore è il suo grado di accessibilità, sia perché diventa più facile da trovare (è più indicizzabile), che per visualizzarlo in forme più o meno sintetiche. Anche da attori terzi, come assistenti vocali tipo Amazon Echo e simili.

A proposito di metadati e bibliotecari, questo l'avevi visto?

matt

Andrea Zanni

unread,
Mar 7, 2018, 4:02:33 AM3/7/18
to spaghett...@googlegroups.com
Grazie mille a tutti delle risposte,
mi rincuorate :-)

Continuerò dunque a parlare di dati strutturati ai bibliotecari,
e mi studierò anche i mille riferimenti che mi avete dato.
Grazie davvero.

Andrea


--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopendata+unsubscribe@googlegroups.com.

Visita questo gruppo all'indirizzo https://groups.google.com/group/spaghettiopendata.
Reply all
Reply to author
Forward
0 new messages