Chúng ta biết rằng thường một văn bản được chia ra thành mấy đoạn, mỗi đoạn gồm có mấy câu, mấy câu lại gồm một số chữ tạo nên. Có thể nói văn bản được tạo thành bởi một dãy gồm các kí hiệu như chữ, dấu ngắt câu, khoảng trống, xuống dòng, chuyển đoạn. Trong máy tính, chúng ta gọi những kí hiệu như vậy là kí tự (văn bản), gọi những bài văn như vậy là văn bản. Có thể thấy rằng văn bản có hai đặc điểm cơ bản: (1) Thứ nhất, văn bản do các kí tự văn bản tạo nên. (2) Thứ hai, kí tự trong văn bản được sắp xếp thành một dãy từ đầu đến cuối, bởi vậy ta nói văn bản có cấu trúc tuyến tính. Vì thế mà chúng ta khi đọc sách, đọc bài văn thì thường là đọc từ trái sang phải, từ trên xuống dưới, từ đầu đến cuối.
Siêu văn bản là loại văn bản được viết theo quy tắc ngôn ngữ thuộc tiêu thức siêu văn bản. Ngôn ngữ tiêu thức siêu văn bản đã được Tổ chức nghiên cứu hạt nhân nguyên tử Châu âu (CERN) tại Giơnevơ Thụy Sĩ sáng tạo ra thành công vào cuối thập niên 80, đầu thập niên 90. So với những văn bản thông thường thì siêu văn bản được mở rộng từ hai đặc điểm cơ bản đã kể trên.
- Trước hết, trong siêu văn bản có thể bố trí một số "siêu liên kết" (hyperlink), ở mỗi siêu liên kết có thể đánh dấu một siêu văn bản khác. Nếu bạn từng đọc văn học cổ điển thì chắc sẽ biết loại văn chương này có chú giải bằng hình thức 1, [2] cho những câu chữ khó hiểu. Rồi ở cuối bản văn sẽ có chú giải tương ứng. Siêu liên kết cũng tựa như loại chú giải này. Nhưng chú giải trong văn bản chỉ có một tầng, vì rằng trong chú giải sẽ không có chú giải nữa. Thế nhưng, siêu văn bản do siêu liên kết đánh dấu còn có thể chứa siêu liên kết nữa. Chúng lại có thể đánh dấu siêu văn bản khác nữa. Và thế là thông qua từng siêu liên kết, ta có thể đọc được từng siêu văn bản. Ví dụ khi bạn đọc bài báo tin tức thể thao nước ngoài, nếu trong văn bản nhắc tới Giải bóng rổ nhà nghề Mĩ NBA thì sẽ thấy có một siêu liên kết, vậy bạn có thể xem thêm văn bản giới thiệu Giải Bóng rổ NBA. Và thế là bạn lại có thể từng bước đọc những bài viết về đội Chicago Bulls, về siêu sao bóng rổ Maike Gioocđan. Lại nữa, văn kiện siêu văn bản mà siêu liên kết đánh dấu không nhất định nằm trong máy tính tại đây, mà có thể là bất kể chỗ nào trong mạng máy tính sở tại. Bởi vậy, siêu văn bản giống như một cái cây mà không có cấu trúc tuyến tính.
- Thứ hai, những cái có thể nối tiếp của siêu liên kết trong siêu văn bản thì ngoài văn bản ra còn có các thông tin multimedia như âm thanh, tranh ảnh, hoạt hình, đoạn phim. Bởi vậy, khi bạn lướt qua siêu văn bản thì có thể nghe thấy âm nhạc, xem thấy tranh ảnh, bản vẽ, thậm chí còn có thể xem được phim ảnh và VCD, thật tuyệt làm sao.
Văn kiện siêu văn bản là văn kiện văn bản có cách thức đặc biệt, thường phải dùng phần mềm chuyên môn mới sử dụng được.