ถ้าหน้าเว๊บที่เราเขียนเป็นภาษาไทย ควรมีการกำหนดชุดอักษรไทยไว้ในเอกสารต้นฉบับด้วย
ชุดอักขระที่สามารถแสดงได้ทั้งภาษาไทยและภาษาอังกฤษเช่น windows-874, iso-8859-11, TIS620 แต่ระยะหลัง ๆ นิยมใช้ชุดอักขระ UTF-8 ซึ่งรองรับหลายภาษารวมทั้งไทยและอังกฤษ จึงนิยมใช้แบบนี้มากขึ้นเพราะใช้ชุดอักขระนี้เพียงแบบเดียวสามารถแสดงได้หลายภาษา แต่จำเป็นต้องเขียนด้วย editor ที่รองรับการเข้ารหัสแบบ UTF-8 ด้วย ซึ่ง Editor รุ่นใหม่มักรองรับกันแล้วรวมทั้ง Notepad ด้วย
หน้านี้ใช้ แท็ก meta เพื่อบอกเบราว์เซอร์ว่าต้องการแสดงผลด้วยอักษรไทย โดยบอกให้เบราว์เซอร์ใช้ชุดอักขระ windows-874 ซึ่งเป็นชุดอักษรไทย-อังกฤษ ถ้าไม่บอกว่าให้เบราว์เซอร์ใช้ชุดอักษรใด เบราว์เซอร์อาจไม่แสดงผลเป็นภาษาไทย ผู้ใช้จะต้องกำหนด Encoding ที่เบราว์เซอร์เองซึ่งยุ่งยากสำหรับผู้ใช้ โดยเฉพาะอย่างยิ่งกับผู้ใช้ที่ไม่รู้วิธีการเปลี่ยน character encoding
ควร View Source แล้วสังเกตุการใช้แท็ก meta ซึ่งใส่ไว้ในส่วนหัวของเว็บหน้านี้
<meta http-equiv="Content-Type" content="text/html; charset=TIS620" />
ตัวอย่างนี้ยังเป็นแบบเก่าอยู่ พอมาถึงยุค HTML5 การบอกภาษาทำได้สั้นกว่าเดิม ตามตัวอย่างต่อไปนี้
<!DOCTYPE HTML> <html lang="th"> <head> <meta charset="UTF-8"> <title>HTML5</title> </head> <body> ภาษาไทยปน English </body> </html>