Prije uvođenja HTML5, postavljanje kodiranja znakova na dokument s elementom zahtijevalo je da napišete pomalo opširan redak koji se vidi dolje. Ovo su elementi meta skupa ako ste na svojoj web stranici koristili HTML4:
Ono što je važno primijetiti u ovom kodu su navodnici koje vidite oko sadržaj atribut: sadržaj ="tekst / html; charset = iso-8859-1". Kao i svi HTML atributi, ovi navodnici definiraju vrijednost atributa, što znači da je cijeli niz tekst / html; charset = iso-8959-1 je sadržaj ovog elementa. Ovo je pravi HTML i tako je trebao biti napisan ovaj niz. Također je nezgrapan dugo i ružno! To također nije nešto čega biste se vjerojatno sjećali od vrha glave!
U većini slučajeva web programeri morali bi kopirati i zalijepiti ovaj kôd s jedne web lokacije na bilo koju novu koju su razvijali jer je pisanje ispočetka tražilo puno.
HTML5 izrezuje dodatni "materijal"
HTML5 ne samo da je dodao neke nove elemente u jezik, već je i uvelike pojednostavio sintaksu HTML-a, uključujući element Meta Charset. Pomoću HTML5 možete dodati kodiranje znakova s mnogo lakšom sintaksom za
META element koji vidite dolje:Usporedite tu pojednostavljenu sintaksu sa onom što smo napisali na početku ovog članka, starom sintaksom koja se koristi za HTML4, i vidjet ćete koliko je lakše pisati i pamtiti HTML5 verziju. Umjesto da trebate kopirati i zalijepiti ovo s postojeće web lokacije na bilo koju novu na kojoj ste radili, ovo je apsolutno nešto čega biste se, kao prednji web programer, mogli sjetiti. Ta ušteda vremena možda neće biti velika, ali kad uzmete u obzir ostala sintaksna područja koja su HTML5 pojednostavila, uštede se zbrajaju!
Uvijek uključi kodiranje znakova
Uvijek biste trebali uključiti kodiranje znakova za svoje web stranice, čak i ako ih nikada ne namjeravate koristiti posebni znakovi. Ako ne uključite kodiranje znakova, vaša web lokacija postaje ranjiva na napad skriptiranjem na više web lokacija pomoću UTF-7.
U ovom scenariju napadač vidi da na vašoj web lokaciji nije definirano kodiranje znakova, pa vara preglednik da pomisli da je kodiranje znakova stranice UTF-7. Dalje, napadač ubacuje skripte kodirane UTF-7 na web stranicu i vaše je mjesto hakirano. To je problematično za sve uključene, od vaše tvrtke do posjetitelja. Dobra vijest je da je jednostavan problem koji treba izbjeći - svakako dodajte kodiranje znakova na sve svoje web stranice.
Gdje dodati kodiranje znakova
Kodiranje znakova za web stranicu trebalo bi biti prvi redak HTML-a
element. To osigurava da preglednik zna što je kodiranje znakova prije nego što učini bilo što drugo na stranici, osim da utvrdi tip dokumenta i prepozna da je riječ o HTML stranici. Vaš HTML trebao bi glasiti:
...
Korištenje HTTP zaglavlja za dodatnu sigurnost
Također možete odrediti kodiranje znakova u HTTP zaglavljima. Ovo je još sigurnije od dodavanja na HTML stranicu, ali trebali biste imati pristup konfiguracijama poslužitelja ili .htaccess datoteke, što znači da ćete možda trebati surađivati s pružateljem usluge hostinga na vašoj web lokaciji da biste stekli ovu vrstu pristupa ili ih trebate unijeti vas. Pristup je ovdje izazov. Sama promjena je jednostavna, pa bi svaki pružatelj usluge hostinga trebao s promjenom moći izvršiti ovu promjenu umjesto vas.
Ako koristite Apači, možete postaviti zadani skup znakova za cijelu web stranicu dodavanjem: AddDefaultCharset UTF-8 do svog korijena .htaccess datoteka. Zadani skup znakova Apachea je ISO-8859-1.