URL, caratteri speciali: cosa evitare nell’indirizzo web?

Ci sono una serie di elementi importanti da rispettare quando si scrive un URL ottimizzato per la SEO. Ad esempio? Ci sono dei caratteri speciali che possono causare problemi.

Ci sono caratteri speciali in un URL che dovresti evitare? Sì, è consigliabile usare solo i caratteri ASCII. Vale a dire quelli che rientrano nello standard americano per lo scambio di informazioni che comprende 127 elementi. Ciò che non rientra in questa lista dovrebbe essere codificato dal simbolo % e seguito da elementi alfanumerici.

caratteri speciali URL
Quali sono i simboli non ammessi?

Ad esempio, lo spazio viene rappresentato in un URL con %20 e in un’ottica di ottimizzazione SEO dell’URL – compreso il suo miglioramento in termini di user experience – è meglio evitare questa condizione. Di conseguenza è utile sempre usare solo i caratteri ammessi in URL che comprendono numeri, lettere e trattini.

Perché esistono caratteri non validi nell’URL?

Esistono caratteri non ammessi quando digiti il permalink di una pagina web o un articolo del blog? Sì perché l’URL deve essere tradotto in un formato che può essere usato su Internet.

Questo avviene attraverso i caratteri ASCII che fanno da base a ISO-8859-1 (HTML 4.01) che UTF-8 (HTML5).

Un URL non può contenere caratteri che invalidano la sua correttezza. Quindi un indirizzo web non può includere, ad esempio, uno spazio. Bisogna usare un trattino (alto o basso, meglio il primo):

www.esempio.it/questo-non-mi-piace/
www.esempio.it/questo%20non%20mi%piace/

E questo vale anche con le lettere accentate. In questi casi, e così per tutti i caratteri speciali non ammessi, tutto si sostituisce con % e caratteri alfanumerici.

Ecco perché si conferma la buona regola del vecchio webmaster suggerisce di evitare caratteri speciali nell’URL come accenti, apostrofi, spazi vuoti, caratteri speciali.

Da leggere: qual è la lunghezza ideale di un URL?

Ma con WordPress non c’è bisogno di questo

Su WordPress il problema non si presenta perché questo CMS è in grado di adeguare automaticamente i caratteri speciali nell’URL in segni compatibili con lo standard successivo all’ASCII, vale a dire UTF-8. Questo però non significa ignorare il problema: sempre meglio rispettare la regola del niente caratteri speciali nell’URL.

John Mueller said Google handles it find when these URLs are in your XML sitemap file or normal links but when they discover the links via HTML, it can be confusing for them.

John Mueller

Per Mueller è consigliabile evitare caratteri speciali come virgole, punti e virgola, due punti, spazi, virgolette. Google gestisce il problema quando gli URL si trovano nel file della sitemap o nei permalink, ma i link HTML possono creare confusione.

Quali sono i caratteri ammessi in un URL?

Tutti i numeri da 0-9, le lettere maiuscole e minuscole da a-z. Insomma, i caratteri alfanumerici sono considerati validi insieme ai trattini alti e bassi. Altre soluzioni invece hanno bisogno di una codifica se non hanno uno scopo specifico.

ElementoCarattere
Alfanumericoabc (…) xyz ABC (…) XYZ 0 1 2 3 4 5 6 7 8 9
Unreserved– _. ~
Reserved! * ‘(); : @ & = + $, /? % # []

I caratteri consentiti in un URI, ma che non hanno uno scopo, vengono definiti non riservati. Questi includono trattino, punto, trattino basso e tilde. I riservati, invece, devono avere un significato altrimenti hanno bisogno di codifica.

Quali sono, invece i caratteri non ammessi?

Sono da evitare tutti quelli che non hanno una codifica chiara. In primo luogo abbiamo i caratteri riservati, vale a dire quelli che devono essere codificati solo quando non vengono utilizzati per gli scopi definiti a monte. Ad esempio:

Caratteri riservatiCodifica
;%3b
(%28
)%29
/%2f
?%3f
:%3a
#%23
*%2a
@%40
=%3d
[%5b
]%5d
&%26

Poi ci sono gli unsafe character, caratteri non sicuri che comprendono lo spazio ma anche alcuni elementi di punteggiatura come " < > % { } | \ ^ `. Tutto questo, insieme alla virgola, all’apostrofo e all’accento può essere evitato.

Caratteri non sicuriCodifica
Space%20
%22
<%3C
>%3E
#%23
%%25
|%7C

Gli URL devono contare solo su un sottoinsieme di caratteri ASCII: i simboli alfanumerici e alcuni elementi riservati da utilizzare come caratteri di controllo all’interno degli URL. Tipo cancelletto per le ancore e ? per una query di ricerca.

%E2%80%8E nell’URL. Cosa significa?

Altri caratteri speciali nell’URL. Ma in questo caso si trovano nei link e generano pagine che non esistono. Quindi errori 404. Motivo? Tutto ciò nasce dalla cattiva abitudine di fare copia e incolla da Word sull’editor del blog. Cosa succede?

Ti tiri dietro anche la formattazione con relativa codifica del comando fine riga. Per risolvere il problema copia il codice su un text edit, pulisci dalla vecchia formattazione e incolla di nuovo nell’editor: sarà scomparsa l’URL con %E2%80%8E. Attenzione, quindi, a come viene inserito lo spazio HTML.

URL e cancelletto, quando vanno insieme?

Forse da qualche parte hai visto anche URL spezzati da simboli speciali come il cancelletto (#) ma in questi casi non è un problema: rappresentano delle ancore.

www.esempio.it/questo-non-mi-piace/#questo-ancora-meno/

Quindi permettono al browser di effettuare un salto di pagina e raggiungere un punto specifico. Si inseriscono, ad esempio, per creare un menu interno.

Da leggere: come scegliere un dominio di primo livello

SEO e UX: ammessi caratteri speciali URL?

Considero di puntare sui consigli lasciati da Matt Cutts in questo video abbastanza vecchio che però è ancora valido: non usare i caratteri speciali negli URL.

Elimina i caratteri speciali URL.

Non conviene, non è utile e non dà risultati. Anzi, può causare problemi in alcuni casi e rendere gli indirizzi meno adatti alla SEO e all’user experience (UX).

Lo stesso discorso vale per l’uso delle lettere maiuscole negli URL: tutto diventa più difficile. Quindi, il consiglio è questo: usa lettere minuscole e caratteri semplici. Niente simboli speciali, punteggiatura, parole con accento. Sei d’accordo?

Riccardo Esposito
Sono un web writer freelance. Mi occupo di scrittura online dal 2009, mi sono specializzato nella stesura di piani editoriali per blog aziendali. Ho scritto 3 libri dedicati al mondo del blogging e della scrittura online.

RISPONDI AL COMMENTO

Please enter your comment!
Please enter your name here