Liste des entités HTML utiles en français

Voir le W3C pour une présentation complète des entités.

La norme ISO 8859-1, jeu de caractères officiel de l'HTML 2.0 et 3.2, définit les caractères de code entre 32 et 127 inclus, et entre 160 et 255 inclus.
Le jeu de caractère CP-1252 (codepage 1252, ie. jeu de caractères "Ansi" Windows) est un sur-ensemble de cette norme, en définissant des caractères de code 128 à 159.
Les machines Unix utilisent le jeu de caractères Latin-1 (autrement dit, ISO 8859-1 strict), les machines Macintosh utilisent MacRoman.

En théorie, on peut inclure directement dans un document HTML tous les caractères ISO 8859-1 tel quel. En pratique, tous les caractères de ce jeu peuvent ne pas être disponibles sur toutes les plateformes : la plus part des browsers Mac restituent mal les caractères 166, 178, 179, 185, 188, 189, 190, 208, 215, 221, 222, 240, 253, and 254.
De plus, si le document doit être diffusés autrement que via HTTP (par exemple par FTP en mode texte), certains caractères peuvent être convertis ou mangés par le mécanisme de transport (surtout en protocole 7 bits).

HTML 4.0 introduit des entités pour les caractères figurant dans CP-1252 qui ne sont pas dans les jeux d'entités de HTMLlat1 or HTMLsymbol.

Je ne liste pas dans le tableau les voyelles accentuées, elles sont simplement obtenues par "&<caractère minuscule ou majuscule><caractère diacritique>;".
Le caractère diacritique est "grave" (è), "acute" (é), "uml" (ë), "circ" (ê) et "cecil" (ç). Pour mémoire, il y a aussi "tilde" (ã) et "ring" (å).
Je ne liste pas non plus "AElig" (Æ) et "aelig" (æ).
Et je donne pour mémoire les quatre copains pour inclure des caractère HTML réservés : "quot" ("), "amp" (&), "lt" (<) et "gt" (>). À noter que "quot" est rarement utilisé, en pratique l'usage de ce caractère directement dans HTML est bien toléré.

Pour ceux qui se posent la question, 'ÿ' (et sa majuscule) n'est utilisé en français que dans des noms propres : la ville de l'Haÿ-les-Roses, la rue des Cloÿs à Paris, etc.
Et comme chacun sait, 'ù' n'est utilisé que dans "où".

&ent;&#nnn;entnnnDescription8 bits
Windows
Numéro
CP-1252
Standard characters (HTMLlat1)ISO 8859-1 / Latin-1
§§sect167section sign, U+00A7 ISOnum0167
©©copy169copyright sign, U+00A9 ISOnum0169
««laquo171left-pointing double angle quotation mark = left pointing guillemet, U+00AB ISOnum0171
®®reg174registered trade mark sign, U+00AE ISOnum0174
°°deg176degree sign, U+00B0 ISOnum0176
²²sup2178superscript [digit] two = squared, U+00B2 ISOnum0178
³³sup3179superscript [digit] three = cubed, U+00B3 ISOnum0179
para182pilcrow sign = paragraph sign, U+00B6 ISOnum0182
»»raquo187right-pointing double angle quotation mark = right pointing guillemet, U+00BB ISOnum0187
ÿÿyuml255latin small letter y with diaeresis, U+00FF ISOlat10255
Special characters (HTMLspecial)Latin Extended-A
ŒŒOElig338latin capital ligature OE, U+0152 ISOlat20140
œœoelig339latin small ligature oe, U+0153 ISOlat20156
ŸŸYuml376latin capital letter Y with diaeresis, U+0178 ISOlat20159
Special characters (HTMLspecial)General Punctuation
ndash8211en dash, U+2013 ISOpub0150
mdash8212em dash, U+2014 ISOpub0151
lsquo8216left single quotation mark, U+2018 ISOnum0145
rsquo8217right single quotation mark, U+2019 ISOnum0146
ldquo8220left double quotation mark, U+201C ISOnum0147
rdquo8221right double quotation mark, U+201D ISOnum0148
dagger8224dagger, U+2020 ISOpub0134
Dagger8225double dagger, U+2021 ISOpub0135
permil8225per mille sign, U+2030 ISOtech0137
euro8364euro sign, U+20AC0128

Tests sur browsers

Si pas OK, les littérales sont affichés littéralement (on voit par exemple &OElig;), sauf exceptions.
Si pas OK, les numériques sont remplacées par un carré sous MS IE, et un point d'interrogation sous NS Nav.
Enfin, les caractères Ansi sont toujours correctement affichés sous Windows et MacOS, pas sous Unix.

Microsoft Internet Explorer

[Win 4.0 & 5.0] Tout OK
[Mac 4.0 & 4.5] Tout numérique OK, seules les littérales dont les numéros sont <= à 255 sont OK, Yuml -> ÿ.
[Win 3.0] Littérales <= 255 OK, Yuml -> ÿ. Numérique <= 255 OK, OElig -> R, oelig -> S, Yuml -> ÿ, le reste affiché avec des carrés.
[Win 2.0] Seule yuml est OK, le reste est comme 3.0

Netscape Navigator

[Win 4.5] Tout numérique OK, seules les littérales dont les numéros sont <= à 255 sont OK
[Mac 4.03 & 4.5 & 4.72] Littérales <= 255 OK. Numérique tout OK.
[Unix SCO 3.03] Littérales <= 255 OK. Numérique <= 255 OK, les autres affichés "?". Ansi <= 255 OK, le reste est vide.
[Mac 2.02] Littérales : seule yuml est OK. Numérique <= 255 OK, les autres affichés "?".

Oh, pour mmoire, je mets quand mme les accents franais :

	&agrave;
	&acirc;
	&eacute;
	&egrave;
	&ecirc;
	&euml;
	&icirc;
	&iuml;
	&ocirc;
	&ouml;
	&ugrave;
	&ucirc;
	&yuml;
	&Agrave;
	&Acirc;
	&Eacute;
	&Egrave;
	&Ecirc;
	&Euml;
	&Icirc;
	&Iuml;
	&Ocirc;
	&Ouml;
	&Ugrave;
	&Ucirc;
	&ccedil;
	&Ccedil;
	&Yuml;
	&aelig;
	&AElig;