iNET Academy

Search Engine hoạt động như thế nào ?

Tác giả | Ngày đăng: | xếp hạng 4.5 | 547 bài đánh giá
Search Engine hoạt động như thế nào ? Bạn vào Google tìm kiếm. Và chỉ chưa đầy 1 giây, Search Engine đã trả về cho bạn hàng chục ngàn kết quả . Làm thế nào mà Google có thể làm được điều này ? Search Engine hoạt động như thế nào ?

Google hoạt động dựa trên mạng lưới hàng ngàn máy tính nên có thể nhanh chóng thực hiện nhiều xử lý song song. Google thực hiện tìm kiếm dựa trên ba thành phần :

Cơ chế hoạt động của Search Engine

1.     Googebot, Web Crawler của Google

Googlebot là một robot của Google, tìm và lấy các trang trên các web, đưa chúng vào chỉ mục của Google (indexer). Có thể tưởng tượng nó giống như một con nhện nhỏ. Nó sẽ bò vào website của bạn, đi theo các liên kết đến các page khác trong website để lập bản đồ, gửi một bản nội dung bằng html về máy chủ của Google. Từ nội dung mà Google bot gửi về, google sẽ có thuật toán đánh giá các nội dung để biết website của bạn mạnh về từ khóa nào và nội dung gì.

Google bot, Web Crawl hoạt động như thế nào

Google bot sẽ quay lại website của bạn theo chu kỳ, chu kỳ này dài hay ngắn tùy thuộc vào việc website của bạn có được tối ưu, cập nhật nội dung thường xuyên, có được chia sẻ rộng rãi hay không .

Google tìm các trang web theo hai cách: thông qua địa chỉ URL và qua việc tìm kiếm các link trên web.

2.     Google Indexer

Sau khi Googlebot tải về toàn bộ các trang được tìm thấy, những trang này được lưu trữ trong cơ sở dữ liệu của chỉ mục Google (hay nói cách khác là được Google Index). Cơ sở dữ liệu được sắp xếp theo thứ tự bảng chữ cái các cụm từ tìm kiếm, mỗi mục sẽ lưu một danh sách các tài liệu có chứa từ tìm kiếm này và vị trí nó xuất hiện trong văn bản. Nhờ đó, cấu trúc của dữ liệu cho phép truy cập nhanh chóng các tài liệu có chứa các truy vấn của người dùng.
Để cải thiện hiệu suất tìm kiếm, Google sẽ bỏ qua (không index) những từ gọi là “stop words” (the, is, on, or, of, how, why, as well as cũng như những chữ số 1 chữ số và một số chữ cái đơn). Google  cũng bỏ qua các dấu chấm câu và các khoảng để dấu cách quá lớn, cũng như chuyển tất cả các chữ cái về dạng viết thường.

3.     Bộ xử lý truy vấn của Google

Bộ xử lý truy vấn bao gồm giao diện người dùng (box tìm kiếm trên trang chủ Google), “bộ máy” đánh giá mức độ liên quan giữa truy vấn và các dữ liệu, văn bản, và hiển thị kết quả tìm kiếm.
PageRank (Những người làm SEO thường rất quan tâm tới vấn đề này) – hệ thống xếp hạng các trang web của Google góp phần rất quan trọng việc đánh giá của Google. Một trang có PageRank cao hơn được coi là quan trọng hơn và có nhiều khả năng được hiển thị ở vị trí cao hơn các trang PageRank thấp. Google dựa trên rất nhiều yếu tố để đưa ra chỉ số PageRank và quyết định những tài liệu nào liên quan đến truy vấn, bao gồm cả sự phổ biến của trang, vị trí và số lượng các từ tìm kiếm trong trang, và mức độ liên quan đến các từ tìm kiếm trên trang.

Lịch khai giảng khóa học: Khóa học SEO Master
Lớp học Bắt đầu Kết thúc Địa điểm
Thứ 4, 14/12/2016, 18h00 Thứ 6, 30/12/2016, 21h30 iNET Hà Nội