Các tài liệu bị rò rỉ tiết lộ cách Google Tìm kiếm đang sử dụng hoặc đã sử dụng các lượt nhấp, liên kết, nội dung, thực thể, dữ liệu Chrome, … để tiến hành xếp hạng nội dung.
Một loạt tài liệu Google bị rò rỉ đã cho chúng ta những cái nhìn chưa từng có về bên trong của Google Tìm kiếm và tiết lộ một số yếu tố đóng vai trò quan trọng nhất mà Google sử dụng để tiến hành xếp hạng cho nội dung. Những yếu tố này dường như mâu thuẫn với số tuyên bố từ nhiều nhân viên của Google Tìm kiếm được đưa ra trong hai thập kỷ qua.
Vào đầu tháng 5 này, hàng nghìn tài liệu nội bộ bị rò rỉ, và nó dường như đến từ Kho API Nội dung nội bộ của Google, đã được chia sẻ với Rand Fishkin, người đồng sáng lập SparkToro.
Rand viết: “Nhiều yếu tố xếp hạng trong tài liệu nội bộ bị rò rỉ mâu thuẫn trực tiếp với các tuyên bố công khai của nhân viên Google Tìm kiếm trong nhiều năm qua, đặc biệt là việc Google liên tục phủ nhận rằng tín hiệu người dùng tập trung vào lượt nhấp được sử dụng, phủ nhận rằng các tên miền phụ luôn được xem xét riêng biệt trong bảng xếp hạng, phủ nhận rằng hộp cát cho các trang web mới hơn… hay phủ nhận rằng tuổi của miền được thu thập hoặc xem xét.”
Tại sao chúng ta quan tâm.
Sự rò rỉ này cho chúng ta cái nhìn chưa từng có về cách hoạt động của thuật toán xếp hạng của Google, điều này đóng vai trò quan trọng và rất có giá trị đối với những người làm SEO. Đây có thể sẽ là một trong những câu chuyện lớn nhất ở trong lịch sử SEO và Google Tìm kiếm.
Vào năm 2023, chúng ta đã có được những cái nhìn chưa từng có về các yếu tố xếp hạng của Yandex Search thông qua một vụ rò rỉ. Nó đã trở thành là một trong những câu chuyện lớn và được quan tâm nhất trong năm đó.
Có gì bên trong các tài liệu rò rỉ.
Dưới đây là những gì chúng ta biết về các tài liệu bị rò rỉ từ Fishkin và King:
– Hiện tại: Tài liệu cho biết thông tin này là chính xác tính đến tháng 3.
– Tính năng xếp hạng: 2.596 mô-đun được thể hiện trong tài liệu API với 14.014 thuộc tính.
– Trọng số: Các tài liệu không chỉ rõ bất kỳ tính năng xếp hạng nào được tính trọng số như thế nào. Nó chỉ chỉ ra là chúng có tồn tại.
– Twiddlers: Đây là những chức năng sắp xếp lại “có thể điều chỉnh điểm truy xuất thông tin của một tài liệu hoặc thay đổi thứ hạng của một tài liệu”, theo King.
– Giảm hạng: Nội dung trên trang có thể bị giảm hạng vì nhiều lý do, chẳng hạn như:
- Một liên kết không phù hợp với trang web mục tiêu.
- Tín hiệu SERP cho thấy người dùng không hài lòng.
- Đánh giá sản phẩm
- Vị trí
- Tên miền khớp chính xác
- Khiêu dâm
– Lịch sử thay đổi: Google dường như sẽ tiến hành giữ một bản sao của mọi phiên bản của mọi trang mà nó từng lập chỉ mục. Nó có nghĩa là Google có thể “ghi nhớ” mọi thay đổi từng được thực hiện ở trên một trang. Tuy nhiên, Google sẽ chỉ sử dụng 20 thay đổi cuối cùng của URL khi tiến hành phân tích liên kết.
Trên X, Aleyda Solis có một bản tóm tắt một phần vụ rò rỉ:
– Có các tính năng xếp hạng 14K và hơn thế nữa trong tài liệu
– Google có một tính năng mà họ tính toán có tên là “siteAuthority”
– Navboost có một mô-đun cụ thể hoàn toàn tập trung vào các tín hiệu nhấp chuột đại diện cho người dùng với tư cách là người bỏ phiếu, và các nhấp chuột của họ sẽ được lưu trữ dưới dạng phiếu bầu của họ.
– Google tiến hành lưu trữ kết quả nào có lượt nhấp dài nhất trong phiên.
– Google có một thuộc tính tên là hostingAge được sử dụng đặc biệt để “xử lý thư rác mới trong hộp cát trong thời gian phân phát”.
– Một trong những mô-đun liên quan đến điểm chất lượng trang có thước đo lượt xem cấp trang web từ Chrome.
Liên kết quan trọng.
Tài liệu rò rỉ này xác nhận rằng tính đa dạng và mức độ liên quan của các liên kết vẫn là chìa khóa. Và PageRank vẫn còn tồn tại rất nhiều ở trong các tính năng xếp hạng của Google.
Tuy nhiên, điều này không chứng minh rằng người phát ngôn của Google đã nói dối về việc các liên kết không phải là “yếu tố xếp hạng top 3” hoặc các liên kết có vai trò ít quan trọng hơn đối với việc xếp hạng . Bởi, chúng ta không có thông tin về tính trọng số của yếu tố liên kết.
Số nhấp chuột thành công đóng vai trò rất quan trọng.
Các yếu tố rò rỉ chỉ ra rõ ràng rằng, bạn cần phải tiếp tục tạo ra nội dung và trải nghiệm người dùng tuyệt vời, nếu bạn muốn có các xếp hạng tốt. Google sử dụng nhiều phép đo khác nhau, bao gồm như: badClicks, goodClicks, LastLongestClicks và unsquashedClicks.
Ngoài ra, các tài liệu dài hơn có thể sẽ bị cắt bớt, trong khi nội dung ngắn hơn sẽ nhận được điểm (từ 0-512) dựa trên tính nguyên gốc. Điểm cũng được tính cho các nội dung Your Money Your Life, như: sức khỏe và tin tức.
Như King đã nói:
“Bạn cần thúc đẩy nhiều nhấp chuột thành công hơn bằng cách sử dụng nhóm truy vấn rộng hơn và kiếm được nhiều liên kết đa dạng hơn, nếu bạn muốn tiếp tục đạt được xếp hạng. Việc tập trung vào việc thúc đẩy lưu lượng truy cập chất lượng hơn để mang lại trải nghiệm người dùng tốt hơn, từ đó sẽ gửi tín hiệu tới Google rằng trang Web của bạn xứng đáng để được xếp hạng.”
Các tài liệu và lời khai từ phiên tòa chống độc quyền giữa Hoa Kỳ và Google đã xác nhận rằng Google đang sử dụng số lần nhấp chuột vào trong xếp hạng.
Vấn đề thương hiệu.
Bài học rút ra lớn nhất của Fishkin từ vụ rò rỉ là thương hiệu quan trọng hơn bất cứ điều gì khác:
“Nếu có một lời khuyên chung mà tôi dành cho các nhà tiếp thị đang tìm cách để cải thiện rộng rãi thứ hạng tìm kiếm không phải trả tiền và lưu lượng truy cập của họ thì đó chính là: ‘Xây dựng một thương hiệu đáng chú ý, phổ biến, được công nhận rộng rãi ở trong không gian của bạn, bên ngoài các tìm kiếm của Google.'”
Các thực thể quan trọng.
Google tiến hành lưu trữ thông tin tác giả liên quan đến nội dung và cố gắng xác định xem một thực thể có phải là tác giả của tài liệu hay không.
SiteAuthority: Google sử dụng thứ gọi là “siteAuthority”.
– Google đã cho chúng ta biết điều tương tự đã tồn tại vào năm 2011, sau khi bản cập nhật Panda của họ ra mắt. Google tuyên bố công khai rằng “nội dung chất lượng thấp trên một phần của trang web có thể ảnh hưởng lớn đến xếp hạng của toàn bộ trang web”.
– Tuy nhiên, Google đã phủ nhận việc có điểm thẩm quyền trang web trong những năm kể từ đó.
Dữ liệu Chrome.
Mô-đun có tên ChromeInTotal cho biết rằng, Google sử dụng dữ liệu từ trình duyệt Chrome để tiến hành xếp hạng tìm kiếm.
Danh sách trắng.
Một số mô-đun cho biết Google đưa một số tên miền nhất định liên quan đến bầu cử và COVID vào danh sách trắng – isElectionAuthority và isCovidLocalAuthority. Mặc dù từ lâu chúng ta đã biết Google (và Bing) có “danh sách ngoại lệ” khi “các thuật toán cụ thể vô tình tác động đến các trang web”.
Các bài báo.
Bí mật từ thuật toán: Tài liệu kỹ thuật nội bộ của Google Tìm kiếm đã bị King rò rỉ trên iPullRank (https://ipullrank.com/google-algo-leak)
Một nguồn ẩn danh đã chia sẻ hàng nghìn tài liệu API tìm kiếm của Google bị rò rỉ với tôi; Mọi người làm SEO nên xem chúng bởi Fishkin trên SparkToro (https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/)
Bài viết được dịch tại SEL và đăng tải duy nhất lên SEOMxh.com
Nguồn: https://searchengineland.com/google-search-document-leak-ranking-442617