8 kỹ thuật SEO On-page nâng cao bạn nên biết (Phần 2)

Thảo luận trong 'SEO Onpage - Tối Ưu Website' bắt đầu bởi SEOMxh, 19/3/15.

  1. SEOMxh

    SEOMxh Administrator

    Bài viết:
    765
    Đã thích:
    2,352
    Nối tiếp phần 1 trong chuỗi bài về Kỹ thuật tối ưu hóa On-page nâng cao, Phần 2 sẽ được tiếp tục với 3 phương pháp đồng thời cũng là 3 vấn đề mà mọi người sẽ cùng nhau thảo luận dưới đây.

    3. Nội dung trùng lặp

    Giải thích chung: Có thể nói, nếu website có nội dung lặp ở mức độ thường cho đến thấp thì khả năng bị các thuật toán tấn công là hiếm khi xảy ra (nếu bạn không cố tình sao chép nội dung từ người khác). Thường thì các website có nội dung lặp cực kỳ lớn (cố ý vi phạm) thì khi đó họ mới trở thành nạn nhân của các thuật toán hình phạt. Nhìn chung, đôi khi việc trùng lặp nội dung ở mức thấp không đủ căn cứ để xử phạt, trừ trường hợp Google nhận ra ý định lừa đảo đằng sau nội dung trùng lặp đó nhằm 'đánh lừa' các công cụ tìm kiếm.

    Tuy nhiên, một khi có sự xuất hiện của nội dung trùng lặp trong website, thì cho dù là vô tình, nó vẫn sẽ dẫn đến hệ lụy là làm mất đi giá trị của website và cả nội dung trong website đó, và trong hầu hết tất cả trường hợp, chúng ta đều không nhận ra những nội dung đó bị lặp nên không kịp thời đưa ra hướng giải quyết vấn đề.

    Trên trang kết quả tìm kiếm của Google có đến 10 trang và hầu như mọi người chỉ tìm kiếm thông tin ở trang đầu vì họ nghĩ đây là những kết quả đáng tin và xuất sắc nhất. Vậy nên Google sẽ làm tất cả nhừng gì trong khả năng để không phụ sự tin tưởng đó của người dùng. Và họ đã bắt đầu đưa ra hàng loạt các thuật toán (bộ lọc) để tiến hành điều tra tất cả các trường hợp vi phạm có liên quan đến lặp nội dung tuyệt đối hoặc lặp nội dung tương tự.

    Vậy vấn đề ở đây là gì?

    Việc lặp nội dung hoặc nội dung tương tự khiến cho website của bạn gia tăng số lượng nội dung không đáng có, và làm cho nó phải làm việc vất vả hơn để duy trì lượng thông tin mà đáng nhẽ ra sẽ chỉ có phân nửa. Trên thực tế, thì một trang lặp hoàn toàn có thể leo lên đầu bảng xếp hạng dựa vào những nỗ lực tối ưu hóa các yếu tố xếp hạng khác; tuy nhiên những nỗ lực này sẽ là quá lớn về mặt thời gian và tiền bạc trong khi chúng ta hoàn toàn có thể giải quyết được nó theo cách nhẹ nhàng hơn.

    Hướng giải quyết
    : Chúng tôi sẽ đi vào từng trường hợp cụ thể và đưa ra giải pháp sau đó

    Lỗi 1: URL của website chính được đặt theo nhiều cách.


    Ví dụ như hình bên dưới: có hoặc không có www., không hoặc không có hậu tố index.php, …Tất cả những phiên bản tưởng chừng khác nhau này lại đều dẫn đến trang chủ của bạn và chúng đều được index bởi Google.

    [​IMG]

    Giải pháp: Đầu tiên, chèn các dòng sau đây vào file .htaccess (Thay thế “doamin” bằng tên website của bạn; thay thể “html” bằng “php” nếu nó liên quan):
    Mã:
    RewriteEngine On
    RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php
    RewriteRule ^index\.php$ / [L,R=301]
    RewriteCond %{HTTP_HOST} ^www\.domain\.com$ [NC]
    RewriteRule ^(.*)$ http://domain.com/$1 [L,R=301]

    Sau đó, xác định ưu tiên cho một loại địa chỉ trên Google Webmaster Tools (có hoặc không có www)


    [​IMG]

    Lỗi 2: Phiên bản thường và phiên bản bảo mật: http/ https

    Giải pháp: Khi chuyển từ chế độ hiển thị trang bình thường (http) sang bảo mật dạng https thì chèn dòng code dưới đây cho file .htaccess (thay thế “domain” bằng tên địa chỉ website của bạn):

    Mã:
    RewriteEngine on
    RewriteCond %{SERVER_PORT} !^443$
    RewriteRule ^(.*)$ http://www.domain.com/$1 [NC,R=301,L]
    Lỗi 3: Lặp tiêu đề và mô tả trang

    Google đánh giá yếu tố này rất quan trọng thế nên bạn cần phải chú trọng nhiều về tiêu đề và mô tả trang cho website của mình.

    Giải quyết: Nhìn vào hình ảnh bên dưới bạn sẽ làm như sau: Truy cập vào GWT, loại bỏ hiện tượng lặp thẻ mô tả (Duplicate Meta Descriptions) và lặp thẻ tiêu đề (Duplicate Title Tags) và khi đã hoàn thành, đừng quên kiểm tra một số các tùy chọn thêm khác bên dưới.

    [​IMG]

    Lỗi 4: Các trang liên kết nội bộ với các thông số

    Rất nhiều site sử dụng các phiên bản URL khác nhau để theo dõi và phân tích số liệu. Thêm vào đó, có những lý do khác nhau dẫn đến việc các trang có thể xuất hiện các URL khác nhau, trong khi tất cả đều dẫn đến cùng một trang. Trong những trường hợp này, Google đã nhanh chóng đi trước và cho chúng ta một công cụ hữu ích và tiện dụng trong GWT.

    [​IMG]

    Việc sử dụng công cụ này sẽ giúp bạn điều chỉnh lại dữ liệu báo cáo mà Google sẽ dùng nó để đánh giá website của bạn được tốt hơn và tránh được tình trang lặp về số liệu. Chúng ta cũng nên làm điều này sớm vì sau khi index này Google sẽ mất khoảng thời gian lâu mới có thể loại bỏ được các số liệu bị lặp.

    Ngoài ra còn một số cách khác cho bạn:
    • Sử dụng các công cụ kiểm tra nội dung lặp thường xuyên như CopyScape hoặc check bằng tay.
    • Giảm số lượng các trang tương tự nhau về mặt nội dung bằng cách thống nhất nó lại thành một bài hoàn chỉnh. Và khi đã loại trang cũ thì cũng đừng quên redirect nó về trang cuối cùng mà bạn đã sửa.
    • Sử dụng thẻ rel=”canonical” khi bạn cần xác định một trang nội bộ giống y hệt một trang khác. Xem mẫu code dưới đây:

    Mã:
    <link href=”http://www.example.com/canonical-version-of-page/” rel=”canonical” />
    4. Tốc độ tải trang

    Giải thích chung: Trong mắt Google việc gia tăng trải nghiệm cho người dùng cũng đồng nghĩa với việc gia tăng khả năng tiếp cận thông tin – giúp người dùng tìm thấy chính xác những gì họ muốn càng nhanh càng tốt. Thời gian chuyển giao giữa các lượt tìm kiếm càng ít thì càng tốt.

    Vấn đề ở đây là: Có nhiều cách khác nhau để các công cụ tìm kiếm có thể đánh giá chính xác trải nghiệm của người dùng trên website đó là dựa vào tốc độ tải trang trên PC và Mobile. Một trang web có tốc độ tải trang chậm một mặt khiến cho tỷ lệ Bounce Rate tăng cao, mặt khác sẽ là đối tượng bị xử phạt của Google. Chúng ta đều biết tốc độ tải trang cũng được xếp vào là một trong những yếu tố xếp hạng được Matt Cutts thông báo hồi đầu năm 2011, và trải qua vài năm thì chúng tôi có thể khẳng định chắc chắn rằng tầm quan trọng của tốc độ tải trang sẽ ngày càng tăng lên. Giờ đây, khi bạn khi bạn cải thiện được tốc độ tải trang là gần như bạn đã cải thiện được thứ hạng cho website của mình.

    Hướng giải quyết: Đầu tiên, đánh giá tình trạng hiện tại của trang web. Khuyến khích nên sử dụng các công cụ của Google vì các thống kê sẽ sát sao hơn và đó cũng chính là số liệu mà họ đang dùng để khảo sát website của bạn. Ví dụ dưới đây sử dụng 2 công cụ để có được đánh giá bao quát cho vấn đề và đưa ra hướng giải quyết dễ dàng hơn:

    PageSpeed Insights sẽ tính điểm các site dựa vào tốc độ tải trang, từ 0 (chậm nhất) cho đến 100 (nhanh nhất). Google cũng có điểm của riêng mình là 99, và chúng tôi khuyến nghị các trang nên đạt từ 70 trở lên. Cố gắng giảm lược các điểm vào vàng đi.

    [​IMG]

    Sau khi xong phần kiểm tra, bạn cũng sẽ nhận được lời kiến nghị thay đổi phù hợp để nâng cao số điểm.

    GTmetrix sẽ giúp bạn có được một cái nhìn tổng quát hơn và đưa ra những yếu tố, nguyên nhân khiến tốc độ tải trang bị ảnh hưởng trong khi ở PageSpeed Insight thì rất sơ sài. Nhìn vào tab Yslow. Thu về dữ liệu ở thẻ “timeline”:

    [​IMG]

    Để nâng cao hơn, bạn muốn phân tích Real-time thì cài đặt plugin này cho trình duyệt: http://yslow.org
    Để sửa chữa nhanh chóng mà không cần phải tiếp xúc với code lằng nhằng, bạn có thể sử dùng 4 cách sau nếu muốn:

    • Tối ưu hóa tất cả các hình ảnh trên trang web của bạn (truy cập từ thư mục hình ảnh chính của bạn). Các công cụ đơn giản nhất bạn có thể sử dụng để làm điều này là Yahoo! Smush.it.
    • Cho phép nén bằng GZIP. Chỉ cần nhập các mã sau vào tập tin htaccess của bạn:
    Mã:
    AddOutputFilterByType DEFLATE text/plain
    
    AddOutputFilterByType DEFLATE text/html
    
    AddOutputFilterByType DEFLATE text/xml
    
    AddOutputFilterByType DEFLATE text/css
    
    AddOutputFilterByType DEFLATE application/xml
    
    AddOutputFilterByType DEFLATE application/xhtml+xml
    
    AddOutputFilterByType DEFLATE application/rss+xml
    
    AddOutputFilterByType DEFLATE application/javascript
    
    AddOutputFilterByType DEFLATE application/x-javascript
    Chỉ định ngày hết hạn cho các tập tin bằng cách nhập mã sau vào tập tin htaccess của bạn:
    Mã:
    <IfModule mod_expires.c>
    ExpiresActive On
    
    ExpiresDefault “access plus 1 month”
    
    ExpiresByType image/x-icon “access plus 1 year”
    
    ExpiresByType image/gif “access plus 1 month”
    
    ExpiresByType image/png “access plus 1 month”
    
    ExpiresByType image/jpg “access plus 1 month”
    
    ExpiresByType image/jpeg “access plus 1 month”
    
    ExpiresByType text/css “access 1 month”
    
    ExpiresByType application/javascript “access plus 1 year”
    
    </IfModule>
    Sử dụng một CDN (nội dung cung cấp mạng). Đây là một dịch vụ thường được cung cấp bởi nhà cung cấp lưu trữ trang web của bạn.

    5. Chặn file hay công bố các tính năng độc hại trong website


    Giải thích chung: Chặn một file hay bất kỳ mã nào đó trong website nghĩa là bạn chặn GoogleBot vào dò tìm các file đó, điều này có thể khiến Google đưa ra những giả định bất lợi cho chúng ta. Bởi Google không hiểu rõ về website và cũng không thể kiểm tra tất cả mọi thứ bằng tay được. Chính vì thế mà không nên tạo bất kỳ một dấu hiệu cảnh báo nhân tạo nào cho dù là cố ý hay cố tình.

    Vấn đề ở đây là:
    Sự hiện diện của các file bị chặn trên website có thể khiến Google cảnh giác hơn và tưởng rằng website đã bị nhiễm thành phần độc hại.

    Hướng giải quyết:

    Xem qua các danh sách kiểm tra dưới đây và chắc chắn rằng bạn đã không cho ra những dấu hiệu cảnh báo vô ý.

    • Không chặn các tập tin CSS và JS trong file robot.txt của bạn. Google rất chú trọng đến điều này.

    [​IMG]

    • Cẩn thận không nên chặn các file template (cũng tương tự như chặn CSS và JS). Đây là lỗi phổ biến nhiều người mắc phải vì nghĩ Google nó sẽ giúp Google tìm đến các file nội dung thay vì các file code, nhưng điều đó là sai lầm. Các chủ sở hữu site Wordpress có thể và cũng nên chặn các thư mục Plugins của họ.
    • Mặc dù Google chỉ có thể giải mã ('đọc') văn bản (text), nhưng sự hiện diện của hình ảnh cũng đóng vai trò rất quan trọng. Chính vì vậy đừng chặn Google dò tìm các thư mục hình ảnh của bạn. Chặn thư mục này sẽ làm cho tất cả các tập tin hình ảnh của bạn không thể index, do đó sẽ làm giảm số lượng nội dung được phân loại theo trang web của bạn. Không có bằng chứng chứng minh rằng hình ảnh sẽ giúp tăng thứ hạng, nhưng nó sẽ dẫn đến sự gia tăng đáng kể trong lưu lượng truy cập đến website nhờ vào kết quả tìm kiếm hình ảnh của Google. Nếu không có lý do gì thích đáng thì chúng tôi khuyến cáo các bạn không nên chặn các tệp tin phương tiện truyền thông bao gồm hình ảnh, video, infographic...
    • Tránh chặn thư mục nguồn cấp dữ liệu RSS của bạn. Đây là một nguồn thông tin quan trọng cho Google (và cho cả bạn nữa, tuỳ theo cách bạn nhìn nhận nó ra sao), thậm chí còn quan trọng hơn cả sitemap.
    • Mỗi tháng một lần, tôi khuyên bạn nên kiểm tra danh sách các truy vấn tìm kiếm trong Google Webmaster Tools. Ở đó, bạn có thể nhìn thấy lượng traffic mà website của bạn có được nhờ vào các từ khóa mà nó không hề được tối ưu hóa trong website của bạn. Nhưng chúng phải là những từ khóa có liên quan đến lĩnh vực bạn đang SEO.
    • Đối với những thuật ngữ mà thuộc diện “Cấm” của Google liên quan đến nội dung người lớn, đả kích, tôn giáo, chính trị, cung cấp thuốc, khoản nợ…(trong khi website không hề liên quan đến những thuật ngữ đó), thì việc kiểm tra này sẽ giúp bạn đoán được website có bị tấn công spam hay không.

    [​IMG]

    • Kiểm tra GWT ở tab Security Issues.
    • Sử dụng công cụ quét ít nhất 1 lần/ tháng. Đăng ký các dịch vụ trả tiền nếu muốn check hàng ngày:
    • Sucuri SiteCheck
    • SiteLock
    • Kiểm tra Code! Tìm những điểm đáng ngờ, hoặc tạo mã tự động với 2 công cụ trên. Chúng tôi khuyến nghị nên sử dụng các lệnh tìm kiếm thủ công:

    <script>function (theo sau là một dãi số lớn hơn 300 hoặc nhỏ hơn -300)

    hxxp:// (theo sau là một URL)

    Chạy chương trình tìm kiếm lỗi có thể sử dụng DreamWeaver hay phần mềm tương tự. Nhưng lưu ý back-up toàn bộ site lại.

    Lưu ý: kiểm tra kỹ từng kết quả đáng nghi nhưng không vội kết luận nó là độc hại rồi xóa đi.

    Kiểm tra các liên kết và nguồn gốc của chúng sử dụng công cụ sau cho các trang web quan trọng của bạn: Unmask Parasites
    Phần 3 cũng là phần cuối cùng sẽ được chia sẻ đến cho các bạn trong thời gian sớm nhất. Mọi thắc mắc và bình luận về phần 2 xin được comment bên dưới!

    Ghi nguồn diễn đàn seo seomxh.com khi đăng tải lại bài viết này.
    Bài viết được biên tập và lược dịch từ searchenginejournal
    Link: 8 kỹ thuật SEO On-page nâng cao bạn nên biết (Phần 2)
     
    Đang tải...
    Chỉnh sửa cuối: 3/3/16
  2. Bluesky

    Bluesky Hoa dại!

    Bài viết:
    568
    Đã thích:
    235
    mình chưa dùng mấy cái check nội dung này khi nào/ Thường nếu webmaster quản lý website từ đầu tới cuối thì sẽ không có trường hợp bị trùng lặp nội dung nhiều, có chăng chỉ vài url trong rất nhiều url được index kia
     
  3. MozSeo

    MozSeo Administrator

    Bài viết:
    1,255
    Đã thích:
    1,433
    Nội dung ở website bị trùng lặp thì rất nguy hiểm đến seo , điểm này liên quan đến seo nhiều hơn là onpage ! tốc độ tải web là do host và tối ưu web ví dụ như hình ảnh nặng khiến web bạn ì ạch !
     
  4. Thế Hùng

    Thế Hùng Well-Known Member

    Bài viết:
    163
    Đã thích:
    121
    Đây là tổng thể hoàn thiện nhất , bình thường nhắc đến onpage thì 1 số bạn chỉ nghĩ đến tối ưu các thẻ H , tối ưu key , des , với các kiểu bài viết trên website
     
    nguyenca thích bài này.
  5. kennyshang

    kennyshang Well-Known Member

    Bài viết:
    129
    Đã thích:
    8
    đúng là mấy kĩ thuật onpage này nâng cao nên mình chưa sử dụng bao giờ, mới biết mấy cái onpage đơn giản
     
  6. voquocky

    voquocky New Member

    Bài viết:
    0
    Đã thích:
    0
    Sao tối ưu nhiều vậy, cái này chủ yếu dành cho người biết rõ về code à, chứ người lơ mơ vào sửa xong website đi luôn
     
  7. anhsaoktv

    anhsaoktv Well-Known Member

    Bài viết:
    104
    Đã thích:
    12
    Đúng là kiến thức nâng cao, chỉ hiểu đôi chút về tốc độ load web với trùng lặp nội dung và title web thôi còn mấy cái khác có mã nguồn thì không hiểu chi cã
     
  8. chichi123

    chichi123 Member

    Bài viết:
    17
    Đã thích:
    0
    onpage mà cũng lắm kỹ thuật quá, nhưng cho mình hỏi là viết nhiều bài có có tốt không
     
  9. linh_seo_pro

    linh_seo_pro Well-Known Member

    Bài viết:
    351
    Đã thích:
    25
    mình thấy thù nội dung trùng lặp và tốc độ load trang là vấn đề mình quan tâm nhất, nếu vào 1 web mà nặng thì rất khó có thể load dc, rất khó chịu luôn,
     
  10. linhsq

    linhsq Well-Known Member

    Bài viết:
    565
    Đã thích:
    45
    Bạn nói rất đúng, vào một trang web mà thời gian load phải mất mấy phút thôi cũng thấy chán rồi, nếu nặng quá không load được thì người ta sẽ tìm trang khác để vào nhanh hơn.
     
Đang tải...
Đang tải...