1.1 Lịch sử của HTML
Ngày nay, hầu hết mọi người đều sử dụng Internet. Đọc bài báo, sử dụng trình duyệt, theo liên kết. Và chỉ một số ít trong số họ tự hỏi Internet được phát minh ra khi nào và bởi ai?
Nó vẫn phụ thuộc vào những gì bạn gọi là Internet. Thông thường, giáo dân có nghĩa là một điều, và kỹ thuật viên có nghĩa là một điều khác. Mạng máy tính kết nối các trung tâm dữ liệu lớn nhất thế giới đã được tạo ra từ những năm 70. Nhưng Internet mà một người bình thường có thể truy cập (trình duyệt, liên kết, tất cả các loại trang) được phát minh bởi một người vào đầu những năm 90 . Và nó đã như thế này...
Vào đầu những năm 1990, người Anh Tim Berners-Lee đã phát minh ra Internet. Tuy nhiên, mặc dù, những gì anh ấy đã phát minh ra được gọi đúng hơn là Web:, World Wide Web
anh ấy là www
, anh ấy cũng là World Wide Web. Vâng, một người đàn ông đã phát minh ra World Wide Web.
Từ năm 1986-1991, ông làm việc tại Trung tâm Nghiên cứu CERN (tại Geneva, Thụy Sĩ) về tiêu chuẩn tài liệu khoa học mới. Bạn thấy đấy, theo thông lệ, các nhà khoa học sẽ xuất bản các bài báo khoa học dưới dạng các bài báo, và ở cuối các bài báo có ghi danh sách các tài liệu đã sử dụng. Nói cách khác, tri thức khoa học là một danh sách các bài báo có liên kết với nhau.
Nhân tiện, Wikipedia hiện đại rất giống với cách người tạo ra nó nhìn thấy World Wide Web : các bài báo khoa học có liên kết với nhau, danh sách các nguồn và tài liệu được sử dụng. Và nếu Tim may mắn, thì web vẫn sẽ như thế này. Nhưng trên đường đến một tương lai tươi sáng hơn, thế giới đã rẽ nhầm ở đâu đó :)
Web dựa trên ba công nghệ:
HTML-page
, chứa văn bản, hình ảnh và liên kết đến các trang khácHTML-pages.
- • Một trình duyệt hiển thị
HTML-page
thân thiện với con người nhất. - • Giao thức
http
- một tiêu chuẩn để các máy chủ web giao tiếp với các trình duyệt và với nhau.
Tim Berners-Lee không phát minh ra những thứ này nhiều như ông đã tiêu chuẩn hóa chúng. HTML
- được tạo ra trên cơ sở tiêu chuẩn SGML
. Thẻ cũng được mượn từ đó. Nhưng trình duyệt web đầu tiên trên thế giới được gọi là WorldWideWeb
Tim đã tự viết và trở lại vào năm 1990.
1.2 HTML không phải là ngôn ngữ lập trình
HTML
nó không phải là một ngôn ngữ lập trình và chưa bao giờ. Đừng bao giờ nói thế. Ngay cả khi bạn sẽ viết sơ yếu lý lịch, đừng bao giờ chỉ ra HTML
trong phần ngôn ngữ lập trình, chỉ trong phần Công cụ (công nghệ). Sẽ là một sai lầm nghiêm trọng nếu viết trong sơ yếu lý lịch của bạn rằng bạn biết một ngôn ngữ lập trình HTML
. Tại sao?
Và vấn đề là HTML
nó là một ngôn ngữ đánh dấu cho các tài liệu. Nếu chúng ta đơn giản hóa nó rất nhiều, thì HTML-document
nó là một văn bản (tài liệu) có chèn hình ảnh, bảng biểu, liên kết, v.v.
Giả sử bạn muốn viết một bài báo sẽ:
- Tên bài viết (title).
- Bài viết chính nó, bao gồm một đoạn văn.
- Hình ảnh.
- Một số câu quan trọng bạn muốn in đậm.
- Ở giữa bài viết, cung cấp một liên kết đến một số thông tin hữu ích.
Đây là cách tài liệu này sẽ trông như thế nào trong trình duyệt:
mèo nhà
Từ quan điểm phân loại khoa học, mèo nhà là động vật có vú thuộc họ mèo của bộ ăn thịt. Thông thường, mèo nhà được coi là một phân loài của mèo rừng, tuy nhiên, theo quan điểm của phân loại sinh học hiện đại (2017), mèo nhà là một loài sinh học riêng biệt .
Khá tốt, phải không? Và tiêu chuẩn HTML
cho phép bạn làm cho tài liệu này có thể đọc được cho cả người và máy tính. Đây là những gì nó trông giống như trong HTML-standard
:
<h1> Mèo nhà </h1>
Từ quan điểm phân loại khoa học, mèo nhà là <a href=”/”> động vật có vú </a> thuộc họ mèo của bộ ăn thịt. Thông thường, mèo nhà được coi là một phân loài của mèo rừng, tuy nhiên, theo quan điểm của phân loại sinh học hiện đại (2017), mèo nhà <b> là một loài sinh học </b> riêng biệt .
<img src=”cat.jpg”>
Các thẻ đặc biệt đã được thêm vào văn bản của bài viết (được đánh dấu bằng màu đỏ ), cả người và máy tính (trình duyệt) đều hiểu được. Trình duyệt có thể hiển thị bài viết đẹp mắt cho người đọc và tác giả của bài báo có thể dễ dàng chỉnh sửa nó.
1.3 Sự xuất hiện của giao thức HTTP
Chữ viết tắt HTML
là viết tắt của Hyper Text Markup Language
Ngôn ngữ đánh dấu tài liệu siêu văn bản. Siêu văn bản là một tài liệu bao gồm các trang liên kết với nhau. Nó là gì http
?
HTTP
là viết tắt của Hyper Text Transfer Protocol
Hypertext Transfer Protocol (tiêu chuẩn). http
hoặc https
bạn có thể thấy trên thanh địa chỉ của trình duyệt nếu bạn cố sao chép liên kết đến trang đang mở.
Một liên kết trang điển hình trông như thế này:
http://google.com/logo.jpg
Ở phần đầu của liên kết là tên của giao thức, theo sau là dấu hai chấm và hai dấu gạch chéo về phía trước. Tim Bernes-Lee đã từng nói trong một cuộc phỏng vấn của mình rằng nếu anh ấy biết rằng giao thức này http
sẽ trở nên phổ biến như vậy, thì anh ấy đã nghĩ ra một thứ gì đó ngắn hơn. (xét cho cùng, hầu hết tất cả các liên kết trên thế giới đều bắt đầu bằng từ http://
hoặc https://
)
Hãy quay trở lại trình duyệt. Khi một trình duyệt yêu cầu html-page
, nó sẽ gửi một tệp văn bản (yêu cầu) đến máy chủ và nhận lại một tệp văn bản khác (phản hồi). Chế độ hoạt động này được gọi là client-server.
Đầu tiên là các dòng có thông tin chính, sau đó là thông tin dịch vụ. Dòng đầu tiên của truy vấn văn bản được cung cấp bởi mẫu:
MethodURI HTTP/Version
Trang cá nhân của người dùng CodeGym được cung cấp bởi liên kết
https://codegym.cc/me
http-request
trình duyệt cho nó trông như thế này:
GET /me HTTP/1.0
Host: codegym.cc
Như một phản hồi, máy chủ rất có thể sẽ gửi
HTTP/1.0 200 OK
<html>page text...
Dòng đầu tiên trong văn bản phản hồi là phiên bản giao thức http và trạng thái phản hồi (200, OK) . Sau đó, xuất hiện một dòng trống và sau đó chỉ ở dạng văn bản xuất hiện dòng html-page
mà trình duyệt yêu cầu. Mọi thứ rất đơn giản :)
GO TO FULL VERSION