Ses NYC Secondo Giorno: Sitemap Autodiscovery
Questo secondo giorno di sessioni non ha portato con sé niente di davvero innovativo purtroppo, se non per alcuni approfondimenti legati ad un tema di rilievo: “Sitemap Autodiscovery“.
I Signori del Search (a cui si è aggiunto Ask) hanno implementato la possibilità di specificare la location della propria sitemap nel robots.txt, come descritto su Sitemaps.org.
A parte questa novità (comunque molto interessante) le sessioni dedicate a Web Analytics & Measuring Success, Duplicate Content Issues e SEO through Blogs & Feeds non hanno rappresentato nulla di davvero nuovo.
Molto interessante invece la sessione Robots.txt Summit, dove i rappresentanti dei principali motori di ricerca hanno chiesto al pubblico suggerimenti su come (finalmente) migliorare un protocollo che, se non sbaglio, è più o meno tale e quale dal ‘94. Alcuni casi buffi di utilizzo improprio (Google riporta addirittura 75mila file contenenti jpeg!!!) …e molti suggerimenti su come implementare il protocollo di esclusione, anche alla luce di questioni più recenti quali, ad esempio, il contenuto duplicato o l’occupazione di banda e l’impatto sugli accessi al server delle attività di crawling.
Se questo articolo ti è piaciuto forse ti potrebbe interessare abbonarti al Feed per tenere questo blog sotto controllo! Se non sai cos'è o come si usa il feed leggi qui!






la stringa da inserire nel file Robots.txt per indicare agli spider la locazione del file sitemap.xml è:
[Sitemap: < http://www.example.com/sitemap.xml >]