Quali sono i caratteri speciali URL non ammessi che devi evitare?

Di Riccardo Esposito | Pubblicato il - Aggiornato il

Negli URL (Uniform Resource Locator), esistono caratteri speciali che devono essere evitati o codificati per garantire che tutto funzioni e non si verifichino errori di interpretazione da parte del browser dell’utente o del server.


Ci sono caratteri speciali in un URL da evitare? Sì, usa solo caratteri ASCII dello standard americano per lo scambio di informazioni che comprende 127 elementi. Ciò che non rientra in questa lista è codificato dal simbolo % e seguito da elementi alfanumerici.

caratteri speciali URL
Quali sono i simboli non ammessi?

Ad esempio, lo spazio viene rappresentato in un URL con %20 e in un’ottica di ottimizzazione SEO dell’URL – compreso il suo miglioramento in termini di user experience – è meglio evitare questa condizione. Di conseguenza è utile sempre usare solo i caratteri ammessi in URL che comprendono numeri, lettere e trattini.

Perché esistono caratteri non validi nell’URL?

Esistono caratteri non ammessi nei permalink di una pagina web o un articolo del blog? Sì, l’URL deve essere tradotto in un formato che può essere usato su Internet. Questo avviene con i caratteri ASCII di base a ISO-8859-1 (HTML 4.01) che UTF-8 (HTML5).

Un URL non può contenere caratteri che invalidano la sua correttezza. Quindi un indirizzo web non può includere, ad esempio, uno spazio. Bisogna usare un trattino alto:

www.esempio.it/questo-non-mi-piace/
www.esempio.it/questo%20non%20mi%piace/

E questo vale anche con le lettere accentate. In questi casi, e così per tutti i caratteri speciali non ammessi, tutto si sostituisce con % e caratteri alfanumerici.

Ecco perché si conferma la buona regola del vecchio webmaster suggerisce di evitare caratteri speciali nell’URL come accenti, apostrofi, spazi vuoti, caratteri speciali.

Meglio usare trattino alto o basso?

Conviene usare underscore (_) o dash (-) nell’URL? Secondo Google è meglio utilizzare il trattino alto al posto di quello basso. In questo caso non è una questione di simboli speciali ma di uso pratico, ma anche di leggibilità degli indirizzi internet.

Il motivo per cui conviene utilizzare la lineetta al posto del trattino basso: anche se i motori di ricerca hanno fatto notevoli passi avanti nella comprensione dei testi, il trattino alto ha il chiaro compito di separare le keyword. Se vuoi creare un URL ottimizzata al massimo conviene utilizzare questo elemento (-) per separare le parole chiave. Al tempo stesso, Google sconsiglia di scrivere indirizzi composti da keyword senza spazi.

Caratteri speciali URL su WordPress

Con WordPress il problema non si presenta perché questo CMS è in grado di adeguare automaticamente i caratteri speciali nell’URL in segni compatibili con lo standard successivo all’ASCII, vale a dire UTF-8. Questo però non significa ignorare il problema: sempre meglio rispettare la regola del niente caratteri speciali nell’URL.

John Mueller said Google handles it find when these URLs are in your XML sitemap file or normal links but when they discover the links via HTML, it can be confusing for them.

John Mueller

Per Mueller è consigliabile evitare caratteri speciali come virgole, punti e virgola, due punti, spazi, virgolette. Google gestisce il problema quando gli URL si trovano nel file della sitemap o nei permalink, ma i link HTML possono creare confusione.

Quali sono i caratteri ammessi in un URL?

Tutti i numeri da 0-9, le lettere maiuscole e minuscole da a-z. Insomma, i caratteri alfanumerici sono considerati validi insieme ai trattini alti e bassi. Altre soluzioni invece hanno bisogno di una codifica se non hanno uno scopo specifico.

ElementoCarattere
Alfanumericoabc (…) xyz ABC (…) XYZ 0 1 2 3 4 5 6 7 8 9
Unreserved– _. ~
Reserved! * ‘(); : @ & = + $, /? % # []

I caratteri consentiti in un URI, ma che non hanno uno scopo, vengono definiti non riservati. Questi includono trattino, punto, trattino basso e tilde. I riservati, invece, devono avere un significato altrimenti hanno bisogno di codifica.

Quali sono, invece i caratteri non ammessi?

Sono da evitare tutti quelli che non hanno una codifica chiara. In primo luogo abbiamo i caratteri riservati, vale a dire quelli che devono essere codificati solo quando non vengono utilizzati per gli scopi definiti a monte. Ad esempio:

Caratteri riservatiCodifica
;%3b
(%28
)%29
/%2f
?%3f
:%3a
#%23
*%2a
@%40
=%3d
[%5b
]%5d
&%26

Poi ci sono gli unsafe character, caratteri non sicuri che comprendono lo spazio ma anche alcuni elementi di punteggiatura come " < > % { } | \ ^ `. Tutto questo, insieme alla virgola, all’apostrofo e all’accento può essere evitato.

Caratteri non sicuriCodifica
Space%20
%22
<%3C
>%3E
#%23
%%25
|%7C

Gli URL devono contare solo su un sottoinsieme di caratteri ASCII: i simboli alfanumerici e alcuni elementi riservati da utilizzare come caratteri di controllo all’interno degli URL. Tipo cancelletto per le ancore e ? per una query di ricerca.

%E2%80%8E nell’URL. Cosa significa?

Altri caratteri speciali nell’URL. Ma in questo caso si trovano nei link e generano pagine che non esistono. Quindi errori 404. Motivo? Tutto ciò nasce dalla cattiva abitudine di fare copia e incolla da Word sull’editor del blog. Cosa succede?

Ti tiri dietro la formattazione con codifica del comando fine riga. Per risolvere copia il codice su un text edit, pulisci e incolla di nuovo nell’editor: sarà scomparsa l’URL con %E2%80%8E. Attenzione a come viene inserito lo spazio HTML.

URL e cancelletto, quando vanno insieme?

Forse da qualche parte hai visto anche URL spezzati da simboli speciali come il cancelletto (#) ma in questi casi non è un problema: rappresentano delle ancore.

www.esempio.it/questo-non-mi-piace/#questo-ancora-meno/

Quindi permettono al browser di effettuare un salto di pagina e raggiungere un punto specifico. Si inseriscono, ad esempio, per creare un menu interno.

Da leggere: come scegliere un dominio di primo livello

SEO e UX: ammessi caratteri speciali URL?

Considero di puntare sui consigli lasciati da Matt Cutts in questo video abbastanza vecchio che però è ancora valido: non usare i caratteri speciali negli URL.

Elimina i caratteri speciali URL.

Non conviene, non è utile e non dà risultati. Anzi, può causare problemi in alcuni casi e rendere gli indirizzi meno adatti alla SEO e all’user experience (UX).

Lo stesso discorso vale per l’uso delle lettere maiuscole negli URL: tutto diventa più difficile. Quindi, il consiglio è questo: usa lettere minuscole e caratteri semplici. Niente simboli speciali, punteggiatura, parole con accento. Sei d’accordo?

Riccardo Esposito

Sono un web writer freelance. Mi occupo di scrittura online dal 2009, mi sono specializzato nella stesura di piani editoriali per blog aziendali. Ho scritto 3 libri dedicati al mondo del blogging e della scrittura online (bio di Riccardo Esposito).

Categoria: Guide per webmaster

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto