Home / Tự Học Seo / Phần 1.1: Cơ chế hoạt động của Search Engine

Phần 1.1: Cơ chế hoạt động của Search Engine

Khi bạn cần tìm kiếm 1 thứ gì đó trên google, thì chỉ vài giây sau, Search Engine đưa về cho bạn hàng chục ngàn kết quả như bận mong muốn, vậy cơ chế Google làm điều này như thế nào, và cách thứ hoặt động của nó ra sau ?

Google là 1 công cụ hoạt động đưa trên màng lười đa tầng nhiều máy tính, nên có thể xữ lý và truy xuất dữ liệu 1 cách nhanh chóng, Công cụ googke thực hiên tìm kiếm đựa trên 3 yếu tốt chính

Cơ chế hoạt động của Search Engine

1. Googebot, Web Crawler của Google (Hay còn gọi là bọ google)

Google Bot (Bọ google) là 1 công cụ robot của google, bọ google đi lấy các kết quả bài viết viết trên website, và chúng sẽ đưa ra các chỉ mục của google gọi là  (indexer). chúng ta có thể tưởng tượng nó như 1 con nhện nhỏ, nó sẽ bò vào từng website của các webmaster đi theo các liên kết truy cập từng trang của 1 website để lập 1 bảng đồ hay còn gọi là sitemaps, gửi bảng đồ này lên thành 1 nội dung bằng file HTML về máy chủ của Google, từ file nội dung này Google sẽ có 1 thuật toán để đánh giá các nội dung bài viết của từng website của bạn nói về gì và cho từ khóa gì để có thể xếp hàng website của bạn,

co-che-hoat-dong-cua-bo-google

Google bot, Web Crawl hoạt động như thế nào

bọ google sẽ quay lại website của bạn theo 1 chu kỳ nhất định, số lần bọ google quay lại website của bạn nó phù thuộc vào website của bạn có tối ưu thân thiện với Google không, nội dung website bạn có cập nhật thường xuyên, và có được chia sẽ rộng rãi và nhiều người biết đến để truy cập vào website của bạn

Bọ Google tìm các trang web theo hai cách: thông qua địa chỉ URL và qua việc tìm kiếm các link trên web.

2. Google Indexer

Khi bọ google thực hiện lệnh tải file về nhứng trang được tìm thấy, các trang này sẽ được lưu vào chỉ mục của google (Hay còn gọi là google index), cơ sở dữ liệu này được sắp sếp theo các cùm từ tìm tìm kiếm,, mỗi mục sẽ lưu một danh sách các tài liệu có chứa từ tìm kiếm này và vị trí nó xuất hiện trong văn bản. Nhờ đó, cấu trúc của dữ liệu cho phép truy cập nhanh chóng các tài liệu có chứa các truy vấn của người dùng.
Để cải thiện hiệu suất tìm kiếm, Google sẽ bỏ qua (không index) những từ gọi là “stop words” (the, is, on, or, of, how, why, as well as cũng như những chữ số 1 chữ số và một số chữ cái đơn). Google cũng bỏ qua các dấu chấm câu và các khoảng để dấu cách quá lớn, cũng như chuyển tất cả các chữ cái về dạng viết thường.

bọ-google

3. Bộ xử lý truy vấn của Google

Bộ xử lý truy vấn bao gồm giao diện người dùng (box tìm kiếm trên trang chủ Google), “bộ máy” đánh giá mức độ liên quan giữa truy vấn và các dữ liệu, văn bản, và hiển thị kết quả tìm kiếm.
PageRank (Những người làm SEO thường rất quan tâm tới vấn đề này) – hệ thống xếp hạng các trang web của Google góp phần rất quan trọng việc đánh giá của Google. Một trang có PageRank cao hơn được coi là quan trọng hơn và có nhiều khả năng được hiển thị ở vị trí cao hơn các trang PageRank thấp. Google dựa trên rất nhiều yếu tố để đưa ra chỉ số PageRank và quyết định những tài liệu nào liên quan đến truy vấn, bao gồm cả sự phổ biến của trang, vị trí và số lượng các từ tìm kiếm trong trang, và mức độ liên quan đến các từ tìm kiếm trên trang.

Facebook Comments

About admin

Check Also

Rút gọn link – thủ thuật SEO Website hiệu quả nhất 2021

  Rút gọn link là một thuật ngữ khá quen thuộc, chắc hẳn bạn đã ...

Leave a Reply

Your email address will not be published.