Le vie del SEO: Sitemap.xml e robot.txt


18 febbraio 2011 15 Commenti seo, web marketing

Continua la rubrica le Vie del SEO con un altro nuovo articolo dove parleremo della fondamentale importanza delle sitemap e dei robot.txt nella scalata alla SERP.

Per questa lezione ho pure realizzato un piccolo video introduttivo ;)

1) L’importanza della SiteMap.xml

Sicuramente se avreste cercato sul web, vi sarebbe capitato più volte di sentire parlare della sitemap.xml, ma non avrete mai approfondito cosa fosse e/o a cosa servisse.

Allora questo file è di estrema importanza nella scalata della SERP ed è nient’altro che un mappa di tutte le pagina presenti all’interno di un sito web.

Il suo scopo è quello di non far perdere neanche una pagina ai motori di ricerca durante i setacciamenti che fanno giornalmente gli spider.

La sintassi di una sitemap.xml è la seguente:

1
2
3
4
5
6
7
8
9
<!--l version="1.0" encoding="UTF-8-->
<div>

http://www.ebug.it/
2010-02-17
daily

</div>
1

Cosa dobbiamo ricordarci:

1) Dichiarare sempre l’ultima data di modifica della pagina;
2) Il periodo di aggiornamento di tale pagina;
3) La priorità della pagina ( va da 0.1 a 1 , la uno è solo la homepage);

Se possedeste un numero esoso di pagine da segnalare vi consiglierei alcuni ottimi servizi online per la creazione automatica di sitemap.xml finite:

- Per chi non possiede CMS http://www.xml-sitemaps.com/
- Per chi utilizza WordPress http://wordpress.org/extend/plugins/google-sitemap-generator/

2) La super importanza dei robot.txt

I robot.txt sono un altro elemento fondamentale per l’indicizzazione nei motori di ricerca, anche se fanno qualcosa che non vi immaginereste mai.

I robot.txt servono a dire ai motori di ricerca di non indicizzare nella SERP alcune determinate directory. Ma qual è la motivazione di inserire tale file?

Immaginiamo di possedere un’area privata con accesso a un pannello di controllo, per evitare di far indicizzare tale pagina e tale cartella usiamo i robot txt.

Qua vediamo il codice per realizzare un robot.txt:

1
2
3
4
5
User-agent: *

# possiamo pure inserire i commenti :D

Disallow: /cms/

In questo modo abbiamo detto ai tutti gli spider di qualsiasi motore di ricerca di non intercettare e indicizzare i file presenti all’interno della cartella cms. Semplice, no?

Ovviamente possiamo pure decidere quale spider far intercettare una cartella.

Qua trovate una piccola lista di tutti spider e come chiamarli:

Nome spider Motore di ricerca
googlebot Google
fast Fast – Alltheweb
slurp Inktomi – Yahoo!
scooter Altavista
mercator Altavista
ia_archiver Alexa – Internet Archive


Nel prossimo articolo cominceremo a parlare di tutte quelle tecniche che non dovete utilizzare per evitare di essere penalizzati dai motori di ricerca e quindi essere defalcati dalla SERP

Indice degli articoli di: Le vie del SEO

1. Le vie del Seo: Introduzione al SEO
2. Le vie del Seo: Chi è il SEO Specialist
3. Le vie del Seo: Motori di Ricerca, Directory e Spider
4. Le vie del SEO: Nome dominio e contenuti
5. Le vie del SEO: La Scelta della Keywords
6. Le vie del SEO: Ottimizzazione lato codice ( prima parte )
7. Le vie del SEO: Ottimizzazione lato codice ( seconda parte )
8. Le vie del SEO: Sitemap.xml e Robot.txt

9. Le vie del SEO: Tecniche Penalizzanti
10. Le vie del SEO: Landing Page e Network di siti internet
11. Le vie del SEO: Link Out-bound e Link Popularity
12. Le vie del SEO: Risorse Utili per i SEO  Specialist




Potresti trovare interessante anche

motori di ricerca, directory e spider le_vie_del_seo_introduzione ottimizzazione lato codice le vie del seo Il link out-bound e il link-popularity per le Vie del Seo
Pubblicato in seo, web marketing |



Iscriviti alla newsletter

Vuoi ricevere ogni articolo che pubblico direttamente sulla tua mail ? Vuoi evitare di perdere qualsiasi articolo pubblico ? Registrati alla mia newsletter in un click.

Inserisci il tuo indirizzo mail:

15 commenti per Le vie del SEO: Sitemap.xml e robot.txt

Bravo mbare ;D

@Carmine ahahahahahah un commento stranamente siculo

E vai così, bella compà!

Grandissimo articolo…
:)
Devo giusto approfondire quest’aspetto del web design :)

@Amerigo & @Cifra WM Grazie


Nicolas Gutierrez

19 febbraio 2011 alle 00:49

Nessuno dei due file descritti in questo articolo permettono alle pagine di entrare nella SERP, dato che quest’ultima è una pagina generata dai motori di ricerca in risposta ad una determinata parola chiave.
Il file sitemap.xml permette al motore di ricerca di aggiungere le pagina al suo indice… cosa ben diversa.
… e poi non è robot.txt ma robots.txt
 

@Nicolas Gutierrez non ti permettono di salire la SERP ma ti aggevolano…. come?

Allora immaginati se la sitemap fosse opzionale… cosa faresti? Non la inseriresti…. ma invece la inserisci ciò vuol dire che non influisce sulla scalata alla SERP in maniera diretta, ma indiretta.

Le vie del SEO sono un percoso informativo su tutte le nozioni base che servono per ottimizzare il proprio sito web.

Io stesso ti posso testimoniare che se cerchi di ottimizzare un sito internet senza Sitemap.xml il risultato non è lo stesso… quindi si può dire che la Sitemap in maniera indiretta influenza la scalata. ( ps se guardi il video lo dico e se leggi più su scrivo questo:

“Il suo scopo è quello di non far perdere neanche una pagina ai motori di ricerca durante i setacciamenti che fanno giornalmente gli spider.”

)

Beh ho dimenticato una esse in robot per questo me ne scuso, ma per il resto ne sono fermamente convito di quello che ho detto più su :D

Grazie per il commento ;)

@Nicolas Gutierrez
Per esperienza personale, la sitemap è fondamentale per far entrare determinate pagine/contenuti nella SERP, soprattutto nel caso di pagine con keywords e contenuti molto inflazionati… O quando ti trovi per le mani siti bannati/etc da google
Non so invece quanto ne influenzi la posizione all’interno della SERP sinceramente..

@Marco Tonet grazie per il commento ;)

Comunque come ho detto prima influenza il tutto in maniera indiretta :D

Forse non ci siamo capiti, comunque, Buona giornata!

@Nicolas ;) Buona Giornata pure a te :D

[...] lato codice ( prima parte ) 7. Le vie del SEO: Ottimizzazione lato codice ( seconda parte ) 8. Le vie del SEO: Sitemap.xml e Robot.txt 9. Le vie del SEO: Tecniche Penalizzanti 10. Le vie del SEO: Landing Page e Network di siti [...]

articoli interessanti, ora non mi rimane che mettere in pratica il tutto.
un consiglio, nell’indice articoli direi di evidenziare aggiungendo un tag <b> sull’articolo che si sta leggendo, così da non scorrere in su fino alla testata pagina.
per il resto, :thumbUp.

@andyzzy ottimo consiglio, provvedo subito a fare quello che mi hai consigliato ;)

se ne hai altri non esitare :D

Da sottolineare il fatto che il file robots.txt è sì utile per le cartelle/file di sistema, ma è fondamentale principalmente per evitare penalizzazioni da parte di Google.
Si pensi a tutti i contenuti duplicati che emergono cliccando su ogni tag degli articoli (soprattutto per coloro che ne usano molti) o a chi inserisce articoli in molteplici categorie.
In questi, ma anche altri casi, il robots.txt diventa una necessità per evitare spiacevoli conseguenze derivanti da un SEO non attento nella stesura dei contenuti.

Lascia un Commento