Cách gỡ phạt Google: tác vụ thủ công spam dữ liệu cấu trúc - spammy structured data

Thảo luận trong 'Thảo Luận SEO Và Trợ Giúp SEO' bắt đầu bởi chicken2nd, 26/7/16.

  1. chicken2nd

    chicken2nd Administrator

    Bài viết:
    178
    Đã thích:
    256
    Đây là phần tiếp theo trong seria bài về những loại án phạt Google: án phạt spam cấu trúc dữ liệu và cách thức gỡ bỏ tác vụ thủ công này. Đứng ở phương diện nào đó, đây là một án phạt nguy hiểm vì sẽ khiến từ khóa đang liên quan đến những trang dính tác vụ này bị ảnh hưởng ngay lập tức.

    Về các bài viết khác mời tham khảo:
    I. Dữ liệu cấu trúc là gì?

    Dữ liệu cấu trúc hay structured data là những dữ liệu được xây dựng dựa trên quy chuẩn cấu trúc nhằm làm nổi bật các đặc tính nào đó của dữ liệu trên các bộ máy tìm kiếm.

    Dữ liệu cấu trúc được chia ra làm rất nhiều loại khác nhau, và là một trong các yếu tố giúp website của bạn đạt được những ưu thế khi xếp hạng tìm kiếm. Để tìm hiểu thêm về dữ liệu cấu trúc bạn tham khảo thêm tại http://schema.org/docs/documents.html hoặc tại https://developers.google.com/search/docs/guides/intro-structured-data.

    Documentation - schema.org

    Schema.org is a set of extensible schemas that enables webmasters to embed structured data on their web pages for use by search engines and other applications.
    schema.org


    Tác vụ này không nhiều người bị dính như tác vụ về liên kết hay nội dung tuy nhiên cũng là một loại án phạt tương đối nhiều người bị đặc biệt là những chủ website ảm hiểu sơ sai về rich snipnet nhưng lại "am hiểu" về ngụy tạo chúng.
    II. Tác vụ thủ công spam dữ liệu cấu trúc

    Spam dữ liệu cấu trúc là gì?

    Đây là án phạt của Google áp dụng đối với các website sử dụng các kỹ thuật vi phạm các quy định dữ liệu cấu trúc của Google.

    Các ví dụ điển hình dành cho án phạt này:

    - Giả tạo các dữ liệu cấu trúc như đánh giá (rating) nhưng không có form đánh giá thực tế, đưa dữ liệu đánh giá ngụy tạo. Cái này những site bán hàng rất hay làm và bị phạt nhằm hiển thị các ngôi sao đánh giá.

    - Giả tạo các reviewed nhằm hiển thị tốt hơn trên Google. Các án phạt mình từng review, gỡ hoặc xem những người khác gỡ đa phần dành cho các site làm về các dịch vụ hoặc cửa hàng nhằm tăng tính uy tín.

    - Giả tạo các nội dung ẩn có cấu trúc nhưng lại không hiển thị với người đọc chỉ dành cho máy chủ tìm kiếm

    - Vi phạm các nguyên tắc về giá cả, hoặc tin tức hoặc các hình ảnh chèn thủ công để nhằm kiếm một vị trí tốt hơn trên máy chủ tìm kiếm. Những site làm về du lịch hoặc món ăn rất hay làm trò này nhằm hiển thị đẹp hơn và thu hút khách hàng, qua đó chiếm lĩnh các vị trí cao.

    Tác vụ thủ công này ảnh hưởng đến website của bạn như thế nào?

    Nó sẽ khiến cho website của bạn bị tụt thứ hạng tại các từ khóa ở trên các trang có dữ liệu cấu trúc vi phạm nguyên tắc chất lượng và các quy định của Google.

    Cấp độ phạt được chia làm 2 bao gồm:

    - Toàn phần: Áp dụng phạt với tất cả các trang có chứa các mã dữ liệu cấu trúc. Mức độ nguy hiểm: Xong, quá nguy hiểm, gỡ ngay.
    google-structured-data-penalty-800x210.
    - Từng phần: Áp dụng phạt đối với một số trang có chứa các mã dữ liệu cấu trúc nhất định. Mức độ nguy hiểm: rất nguy hiểm, đặc biệt nếu như liên quan đến các bài mới được đăng dưới dạng vẫn vi phạm sẽ không thể rank top, gỡ ngay

    III. Đánh giá án phạt.

    Có thể nói trong một tá (gần thôi chứ chưa đủ nếu tính tá là 12 hê hê) thì đây là một trong các án phạt mà mình thấy rằng có thể gỡ nhanh chóng nhất nhưng lại phức tạp nhất nếu như người thực hiện gỡ không am hiểu về lập trình vì các mã dữ liệu cấu trúc được sử dụng chủ yếu bằng cách can thiệp code nguồn!.

    Cách gỡ án này chỉ cần: sửa lại các đoạn mã đánh dấu dữ liệu cấu trúc không tồn tại thực tế trên website do chúng ta ngụy tạo hoặc loại bỏ tất cả các mã dữ liệu cấu trúc mà chúng ta không hiểu, giữ lại một vài đoạn mã cơ bản như về website hay tổ chức (Organization). Đừng xóa toàn bộ các mã dữ liệu cấu trúc vì như vậy khả năng xem xét thành công sẽ thấp đi.

    Thời gian sửa chữa: Không quá 3 tiếng.

    IV. Các bước thực hiện gỡ án.

    Những bước thực hiện này áp dụng cho cả án toàn phần và án từng phần, lý do là vì chúng ta đều cần phải xem lại toàn bộ các trang có chứa dữ liệu cấu trúc để sửa hoặc xóa các cấu trúc vi phạm nguyên tắc Google.

    Các nguyên tắc áp dụng tuyệt đối:

    - Những trang có nội dung không hiển thị cho người đọc, không tồn tại nhưng chứa dữ liệu cấu trúc cần phải loại bỏ.

    - Những dữ liệu cấu trúc được thêm thủ công chỉ nhằm đánh lừa Google trên website cần được loại bỏ.

    - Gộp các dữ liệu cấu trúc nếu chúng cùng một nhóm.

    Bước 1: Chuẩn bị

    Chuẩn bị về mặt kỹ thuật, kiến thức:

    Bạn có am hiểu đủ để can thiệp vào mã nguồn các trang có chứa dữ liệu cấu trúc không? Nếu là có, chúng ta tiếp tục, nếu là không, hãy tìm lấy một người có kỹ thuật về lập trình và có khả năng đọc hiểu, áp dụng nhanh dữ liệu cấu trúc được quy định tại hai website mình đưa ở bên trên. Chú ý đọc thật kỹ rồi hãy làm, còn nếu như bạn thấy rằng mất quá nhiều thời gian cho việc đó, hãy bỏ tiền ra để mời một ai đó thạo về dữ liệu cấu trúc tư vấn cho bạn. Nhiều người nói thật là phí tiền, nhưng quan điểm thời gian và chi phí cơ hội của riêng mình thì đấy là thương vụ có lời nếu bạn kiếm được người làm với mức chi phí hợp lý. Thời gian là tiền bạc.

    Chuẩn bị về mặt tinh thần:

    Luôn trong trạng thái tập trung và cẩn thận nhất để không có các lỗi khi sửa các mã dữ liệu cấu trúc hoặc sửa nhầm vào mã nguồn website (php, aspx, asp…)

    Chuẩn bị về công cụ:

    Cần có một trình soạn thảo (editor) có thể hiển thị và chỉnh sửa ngôn ngữ cấu trúc đơn giản. Đề xuất: notepad ++ vì nhẹ và dễ sử dụng. Từ lúc này Gà sẽ gọi trình soạn thảo là notepadd++ nhé

    Mở sẵn công cụ kiểm tra dữ liệu cấu trúc để đảm bảo sau khi hoàn tất dữ liệu cấu trúc đúng chuẩn tránh sai sót gây hại tới website. Link: https://search.google.com/structured-data/testing-tool/u/0/
    Công cụ kiểm tra dữ liệu có cấu trúc
    search.google.com


    Bước 2: Rà soát và phân loại

    Nếu như website do bạn quản lý từ đầu, có lẽ dùng từ đơn giản là chính xác để biết được đâu là những site có chứa dữ liệu cấu trúc. Nếu website không do bạn quản lý từ đầu, dữ liệu cấu trúc đã tồn tại từ trước khi bạn có quyền quản lý, nếu có thể hãy liên lạc với người đã từng nắm site về mặt kỹ thuật trước đây và hỏi họ về cấu trúc website, những nơi chứa dữ liệu cấu trúc.

    Nhưng để đảm bảo chắc ăn hơn, bạn cần vào Google Search Console hay Google Webmaster Tool, truy cập giao diện tìm kiếm > dữ liệu cấu trúc. Google sẽ hiển thị ra cho bạn đầy đủ các dữ liệu cấu trúc mà nó tìm được trên website của bạn. Bạn chỉ cần chỉnh sửa các dữ liệu cấu trúc có trong phần này là đủ.
    du-lieu-cau-truc-google.
    Một ví dụ về dữ liệu cấu trúc tại một website bán hàng​

    Sau khi biết được có những loại dữ liệu cấu trúc nào có trên website của mình, bạn cần mở các trang có chứa mã dữ liệu cấu trúc bằng notepad++. Tiếp tục phân loại mã dữ liệu cấu trúc là microdata hay là json (hai loại mã đánh dấu dữ liệu phổ biến và thường được dùng nhất).

    Bước 3: Chỉnh sửa

    Trước khi chỉnh sửa, cần mở tạo ra văn bản thống kê hay checklist để đảm bảo công việc của chúng ta thực hiện đủ bước và chỉn chu. Đề xuất sử dụng excel.

    Bây giờ thì hãy nhìn vào notepad++ và chỉnh sửa lần lượt từng trang đã mở trên đó.

    Nhưng làm thế nào để biết được mã dữ liệu cấu trúc đã vi phạm nguyên tắc của Google?

    Một ví dụ cụ thể như sau:

    Bạn hãy nhìn vào đoạn code dưới đây (sử dụng microdata)
    Mã:
    <div class="price" itemprop="offers" itemscope itemtype="http://schema.org/Offer">
                 <?php if ($this->product->_display_price){?>
                    <div class="prod_price">
                    <?php if ($this->product->getPriceCalculate()>0) { ?>
                        <span id="block_price" itemprop="price" content="<?php print $this->product->getPriceCalculate();?><?php print $this->product->_tmp_var_price_ext;?>"><?php print formatprice($this->product->getPriceCalculate())?><?php print $this->product->_tmp_var_price_ext;?></span>
                        <span class="attributes_name">(Chưa bao gồm thuế VAT)</span>
                    <?php } else{?>
                        <span id="block_price" itemprop="price" content="0"> Liên hệ </span>
                    <?php }?>
    </div>
    
    Đây là đoạn code đúng nguyên tắc của Google khi các trường như giá trong phần kiểu cấu trúc Offer được truyền nội dung động vào phần giá trong khi đó các trường khác bao gồm: kiểu tiền tệ (VND - priceCurrency), ngày giá sản phẩm hết hạn (priceValidUntil), tình trạng hàng trong kho, hàng này còn sản xuất không truyền biến số tĩnh. Thực tế nếu như làm tốt hơn và chuẩn xác hơn, thì các trường trên đây đều cần phải truyền nội dung động, nhưng đứng ở quan điểm rằng sản phẩm rất ít, chỉ thanh toán qua VND, với các thời hạn sản phẩm… đều không thay đổi nên có thể để nội dung tĩnh như vậy.

    Đoạn code này sẽ bị sai nếu như chúng ta chèn thêm các phần sau:
    Mã:
    <div class="price" itemprop="offers" itemscope itemtype="http://schema.org/Offer">
                 <?php if ($this->product->_display_price){?>
                    <div class="prod_price">
                    <?php if ($this->product->getPriceCalculate()>0) { ?>
                        <span id="block_price" itemprop="price" content="<?php print $this->product->getPriceCalculate();?><?php print $this->product->_tmp_var_price_ext;?>"><?php print formatprice($this->product->getPriceCalculate())?><?php print $this->product->_tmp_var_price_ext;?></span>
                        <span class="attributes_name">(Chưa bao gồm thuế VAT)</span>
                    <?php } else{?>
                        <span id="block_price" itemprop="price" content="0"> Liên hệ </span>
                    <?php }?>
                        <meta itemprop="itemCondition" content="http://schema.org/UsedCondition" />
                        <meta itemprop="availability" content="http://schema.org/InStock" />
                        <meta itemprop="priceCurrency" content="VND" />
                        <meta itemprop="priceValidUntil" datetime="2020-01-01" />
                        <span itemprop="reviewRating" itemscope itemtype="http://schema.org/Rating">
                   <div style="display:none;">
                        <span itemprop="ratingValue">4</span>                
                        <span itemprop="name">Sản phẩm thật là đẹp.</span>
                        <span itemprop="author" itemscope itemtype="http://schema.org/Person">
                        <span itemprop="name">Chicken2nd</span>
                        </span>
                        <span itemprop="reviewBody">Sản phẩm thật là đẹp và rẻ. Tôi rất là thích nó. Đây là spam cấu trúc nhé.</span>
                        </div>
                    </div>
    Bạn sẽ nhìn thấy rằng tôi đã cố tình chèn thêm vào một đoạn mã và sử dụng display: none trong thuộc tính hiển thị CSS nhằm ẩn giấu nó khỏi người đọc mà chỉ hiển thị cho Google bot.

    Ngoài ra thì bạn cũng sẽ thấy được là, với đoạn tĩnh như thế này, thì tại sản phẩm nào cũng sẽ xuất hiện nội dung y hệt như vậy.

    Chúng ta sẽ có 2 phương án:

    - Loại bỏ toàn bộ đoạn code bắt đầu với thẻ div như hình dưới, không xóa cả phần cấu trúc dữ liệu đúng ở bên trên (khuyến nghị để gỡ án càng nhanh càng tốt)

    - Sửa chữa lại cấu trúc lập trình để hợp thức hóa phần rating và review này (khuyến nghị khi bạn là một người am hiểu thực sự và làm nhanh chóng).

    Bước 4: Kiểm tra

    Ở ví dụ trên chúng ta vừa chỉnh sửa code một trang sản phẩm, như vậy sau khi hoàn thành (lưu file lên hosting - máy chủ), đảm bảo rằng website hoặc hosting không lưu cache hoặc đã xóa cache, copy một đường dẫn sản phẩm bất kỳ, đưa vào Google Structured Test để xem có lỗi phát sinh hay không và rà soát lại các phần dữ liệu cấu trúc khác nhằm loại bỏ các spam nếu có.

    Bước 5: Gửi yêu cầu

    Khi bạn đã hoàn tất toàn bộ các thao tác ở trên, bây giờ hãy vào GWT > Lưu lượng tìm kiếm > Tác vụ thủ công > Yêu cầu xem xét lại. Có một số người bỏ trống form và gửi luôn, tuy nhiên để thời gian xem xét nhanh hơn bạn hãy miêu tả lại thông tin bạn đã xử lý những gì cho đội ngũ chống spam của Google biết. Một ví dụ:

    Bước 6: Chờ đợi phản hồi

    Đối với án phạt này, thời gian Google xem xét khá nhanh, thường chỉ 4 ngày - 5 ngày là có kết quả và nếu như bạn đã thực hiện tốt các việc ở trên, thì tỉ lệ thành công 100% (loại bỏ hoàn toàn tác vụ thủ công) có thể ok ngay lần đầu tiên gửi đơn. Còn nếu như đen tí thôi, thì ít nhất bạn sẽ được hạ án từ toàn phần (nếu bạn bị tác vụ này) xuống từng phần.

    Trong trường hợp Google từ chối gỡ bỏ tác vụ, đừng bực bội, ngay lập tức xem lại toàn bộ cấu trúc website, bắt tay vào rà soát, tìm kiếm lỗi, sửa chúng, và gửi đơn xem xét lại luôn sau đó. Chú ý phải tìm ra các bất thường về dữ liệu cấu trúc rồi hãy gửi đơn, đừng có nóng vội xóa tất dữ liệu cấu trúc đi, vì nó sẽ khiến website của bạn bị "đau" và ảnh hưởng thứ hạng từ khóa sau này.

    Bài viết này share thoải mái cho mọi người nhé, tuy nhiên ghi nguồn tôn trọng một tẹo. Đây là seria bài thân gửi tới anh em cộng đồng SEO. Chúc mọi người SEO an toàn!
     

    Các file đính kèm:

    Đang tải...
    Chỉnh sửa cuối: 27/7/16
    Linh Le, Thùy Dung, Bluesky and 9 others like this.
  2. thuongdo07

    thuongdo07 Well-Known Member

    Bài viết:
    98
    Đã thích:
    13
    Mình là mình hóng phần gỡ vì tác vụ này hiện tại cũng đang có nhiều người dính, mình thấy hình như trước đây cấu trúc dữ liệu Việt Nam ít người làm thì phải, giờ có người làm là dính :D
     
  3. banga

    banga Share is Best

    Bài viết:
    383
    Đã thích:
    242
    Những dạng tác vụ như này gỡ còn đơn giản hơn tác vụ về content và link vì chỉ cần can thiệp vào code , gỡ schema ra hoặc sửa lại cho đúng với cấu trúc của google là xong.
     
  4. hoangtien103

    hoangtien103 New Member

    Bài viết:
    3
    Đã thích:
    3
    Hóng phần các bước thực hiện gỡ án phạt của thớt, cám ơn thớt đã chia sẽ :).
     
  5. vinhomesland

    vinhomesland Well-Known Member

    Bài viết:
    64
    Đã thích:
    6
    mình dính án này đựơc 2 tuần và hiện giờ đã được google xóa rồi. một điều bất ngờ đó là từ khi dính án từ khóa có dane nhảy linh tinh mà traffic lại tăng mới lạ :D
     
  6. chicken2nd

    chicken2nd Administrator

    Bài viết:
    178
    Đã thích:
    256
    Nhiều người làm lắm chứ, nhưng tỉ lệ phạt không nhiều thôi ^^!

    Nói ngay từ đầu đây là một trong những loại tác vụ gỡ nhanh chóng, nhưng giả sử em không biết gì về ngôn ngữ lập trình, vào một file produtct.php với những đoạn code lê thê, em xử lý sao ^^!?

    Đã có rồi bạn nhé!
    :eek:
     
  7. huonggiang_9x

    huonggiang_9x Well-Known Member

    Bài viết:
    171
    Đã thích:
    24
    thực sự thì mình cũng đọc rất nhiều bài viết về gỡ tác vụ thủ công cho trang bị phạt về liên kết, tuy nhiên site của mình đã làm theo và báo cáo 3 lần mà vẫn chưa thể được. Tuy nhiên trang mình nó chỉ bị phạt về 1 số page thôi chứ không phải toàn phần. Visit vẫn ổn định chỉ giảm 20% so với lúc bị phạt. Từ khóa vẫn top rất nhiều. Nhưng nếu bây giờ mình không gỡ nữa thì sau này nó có bị ảnh hưởng đến các từ khóa còn lại hay không?
     
  8. chicken2nd

    chicken2nd Administrator

    Bài viết:
    178
    Đã thích:
    256
    Thông thường thì khi các bạn tiến hành gỡ phạt liên kết, điểm yếu là ở khâu kiểm tra liên kết, bỏ sót dẫn đến việc Google từ chối. Ngoài ra còn vì một lý do nữa, là các bạn không thường xuyên kiểm tra xem Google có cập nhật liên kết mới không. Sẽ có hướng dẫn thêm ở phần này, nhưng hiện giờ thì chưa có làm được vì tương đối bận!
     
  9. lamlehang

    lamlehang Well-Known Member

    Bài viết:
    94
    Đã thích:
    7
    Phần này cũng khó nhỉ nên cần nghiên cứu kỹ vì chuyên sâu của lĩnh vực seo nên phải nắm vững cám ơn bạn đã chia sẽ bài viết này.
     
  10. sohoriverview

    sohoriverview Well-Known Member

    Bài viết:
    108
    Đã thích:
    7
    Cảm ơn bạn...bài viết đúng lúc đang cần :)...Mấy cái này phải lưu làm phí kiếp k lúc cần lại mất
     
Đang tải...

Từ khóa search từ các công cụ tìm kiếm

  1. tác vụ đã tồn tại là sao?

Đang tải...