Công cụ tìm kiếm có một danh sách ngắn các hoạt động quan trọng, cho phép họ cung cấp kết quả tìm kiếm web có liên quan, khi người dùng sử dụng hệ thống của họ để tìm kiếm thông tin. Các thuật ngữ chuyên ngành xin được phép không dịch ra để không làm lệch ý nghĩa ban đầu.
Crawling the Web
Search engines sẽ chạy những chương trình tự động đặc biệc được gọi là “bots” hoặc “spiders”,những chương trình này sử dụng cấu trúc hyperlink của website để “crawl” các page và document. Theo ước lượng thì hiện tại trên thế giới có khoảng 20 tỉ trang web nhưng không phải search engine crawl toàn bộ mà chỉ từ 8 đến 10 tỉ trang mà thôi.
Indexing Documents
Một trang web sau khi được crawl thì nội dung của nó được “indexed” và được lưu trữ trong một database khổng lồ của search engines. “Index” ở đây ta có thể tạm dịch là chỉ mục (dạng như danh mục). Các index này được quản lý rất chặc chẽ để mỗi khi có 1 request đến thì trong hàng tỉ document, nó biết chọn lọc ra cái nào cần thiết và hiển thị còn hiển thị như thế nào tớ sẽ trình bày ở phần sau.
Processing Queries
Khi 1 request tìm kiếm thông tin được đưa đến search engines, search engines sẽ lấy kết quả từ các index của tất cả document phù hợp. Một kết quả được xác định và so sánh nếu 1 từ hoặc 1 cụm từ được tìm thấy trên trang và được định nghĩa xác thực bởi người dùng.
Ví dụ:
Khi bạn search từ thu thuat wordpress thì sẽ được kết quả như sau: 463.000 cho thu thuat wordpress. (0,06 giây)
Nhưng khi bạn search cụm từ ( “thu thuat wordpress” ) thì kết quả khác hẳn: 84.600 cho “thu thuat wordpress”. (0,06 giây)
Vì sao lại như vậy ? Với lần search đầu tiên, search engines cho ra các trang có chứa các từ đơn lẻ “thu” “thuat” “wordpress”. Còn với lần search thứ 2 nó sẽ tìm ra những trang nào có chứa nguyên cả cụm từ “thu thuat wordpress”.
Để có thể có được các kết quả tốt hơn khi tìm kiếm, bạn có thể tham khảo thêm ở link sau.
[note]Ranking Results[/note]
Một khi search engines xác định được kết quả nào trả về cho truy vấn nào, lúc này 1 thuật toán của engines sẽ được thực thi và tính toán từ các kết quả tìm được, để xác định kết quả nào phù hợp nhất đối với mỗi truy vấn. Sau đó, các kết quả sẽ được phân loại, nhưng người dùng vẫn có thể thay đổi cách phân loại này tùy theo mục đích của mình.
mèo Tom(chủ xị)
Sicula(biên tập viên)
Các bài viết cùng chủ đề:


Bài viết rất cơ bạn nhưng không phải ai cũng biết đó, cám ơn nhiều!
.-= Tinh´s last blog ..AdNet Giới Thiệu Định Dạng Quảng Cáo Mới: Widget Ads =-.
:twisted: hi đầu tuần gặp được pác comment chắc hên cả tuần. Đang ngâm cái bài Widget Ads của pác tính thử vận may xem sao :yell:
.-= Mèo Tom´s last blog ..Firefox SEO Addon =-.
em hay search không có dấu ” ….” . Một phần vì cho nhanh với lại các kết quả mình tìm kiếm đều mang tính phổ biến nên không nhất thiết phải dùng “…”
cái bên trên chỉ là minh họa cho phương thức truy vấn thôi chứ ko phải hướng dẫn cách truy vấn trên google