Vũ Thành Lâm

5 cách để tránh các vấn đề về lập chỉ mục và nội dung trùng lặp

lập chỉ mục và nội dung trùng lặp
5/5 - (1 bình chọn)

Trước khi một trang web có thể được xếp hạng tốt, nó cần phải được thu thập thông tin và lập chỉ mục. Cộng tác viên Manish Dudharejia chia sẻ năm mẹo cung cấp cho các trang của bạn cơ hội tốt nhất để được lập chỉ mục trong kết quả tìm kiếm.

Đọc ngay những cập nhật mới nhất của Google trong năm nay: Google Cập nhật 2018 Nguyên tắc Xếp hạng Chất lượng Tìm kiếm

Hơn bất kỳ loại trang web nào khác, các trang web thương mại điện tử nổi tiếng với việc phát triển các cấu trúc URL tạo ra các vấn đề về lập chỉ mục và thu thập thông tin với các công cụ tìm kiếm. Điều quan trọng là bạn cần giữ quyền kiểm soát này để tránh nội dung trùng lặp và ngân hàng dữ liệu được thu thập.

Dưới đây là 5 cách để tối ưu hóa chỉ mục trang web thương mại điện tử của bạn.

  1. Contents

    Biết những trang nào được Google lập chỉ mục

Để bắt đầu, điều quan trọng là thường xuyên kiểm tra xem có bao nhiêu trang của bạn mà Google báo cáo là đã lập chỉ mục. Bạn có thể thực hiện việc này bằng cách chạy tìm kiếm “site: example.com” trên Google để xem có bao nhiêu trang mà Google biết trên web.

Trong khi nhà phân tích xu hướng webmaster của Google là Gary Illyes nói rằng con số này chỉ là một ước tính, thì đây vẫn là cách dễ nhất để xác định xem có vấn đề gì xảy ra với việc lập chỉ mục trang web của bạn hay không.

Liên quan đến số trang trong chỉ mục của họ, Stefan Weitz của Bing cũng đã thừa nhận rằng mối quan hệ giữa hệ thống quản lý nội dung (Content Management System – CMS) và nền tảng thương mại điện tử, sơ đồ trang web và tệp máy chủ của bạn phải khớp gần như hoàn hảo hoặc ít nhất nếu có bất kỳ sự khác biệt nào thì cũng cần được được giải quyết và giải thích. Những con số này, lần lượt, nên gần đúng với những gì trả về trong một tìm kiếm trang web của Google. SEO thông minh trên trang web giúp ích cho bạn; một trang web được phát triển với kế hoạch SEO rõ ràng giúp tránh nội dung trùng lặp và các vấn đề về cấu trúc có thể tạo ra các vấn đề lập chỉ mục.

Nếu khi tìm kiếm trên Google với câu lệnh trên kết quả trả về quá ít làm bạn lo lắng thì thực tế nếu kết quả trả về quá nhiều cũng sẽ khiến bạn đau đầu. Vì điều này có nghĩa là bạn đã có nội dung trùng lặp trong kết quả tìm kiếm. Mặc dù Ilyes đã xác nhận rằng không có “hình phạt cho nội dung trùng lặp”, nhưng nội dung trùng lặp vẫn làm tổn hại đến ngân hàng thu thập thông tin của bạn và cũng có thể làm giảm quyền hạn về vấn đề bản quyền của bạn đối với các trang bản sao.

Nếu Google trả về quá ít kết quả:

Nếu Google trả về quá nhiều kết quả:

SEO Google sẽ trở nên dễ dàng hơn khi bạn đọc bài viết GOOGLE MEDIC là gì? Hướng dẫn đầy đủ về Cập nhật Thuật toán ngày 1 tháng 8  cho biết về những cập nhật mới nhất của ông lớn này.

  1. Tối ưu hóa sơ đồ trang web, robots.txt và liên kết điều hướng

Ba yếu tố này là nền tảng cho việc lập chỉ mục và đã được đề cập trong các bài viết sau: Quy trình thiết kế một trang Web chuẩn SEO

Bạn có thể tham khảo chi tiết tại các bài viết trên.

Không thể mô tả hết được tầm quan trọng của một sơ đồ trang web toàn diện. Nhưng tôi cần nói rằng nó thậm chí còn quan trọng hơn rất nhiều so với liên kết nội bộ. Gary Ilyes gần đây đã xác nhận rằng ngay cả những từ khóa ngắn cũng cho kết quả bất ngờ, nhiều trang đơn độc không có liên kết. Kể cả liên kết đến và đi. Cách duy nhất mà Google có thể biết về các trang này là thông qua sơ đồ trang web.

Điều quan trọng cần lưu ý là nguyên tắc của Google và Bing vẫn cho biết các trang có thể truy cập được từ ít nhất một liên kết. Dù sơ đồ trang web rất quan trọng nhưng không có nghĩa là loại bỏ tầm quan trọng của các liên kết trên trang.

Điều quan trọng không kém là đảm bảo tệp robots.txt của bạn hoạt động, nó không được chặn Google từ bất kỳ phần nào trên trang web của bạn mà bạn muốn được lập chỉ mục. Và nó sẽ thống báo về vị trí của (các) sơ đồ trang web của bạn. Tệp robots.txt có chức năng rất quan trọng vì nếu chúng bị hỏng, điều này có thể khiến Google ngừng lập chỉ mục trang web của bạn hoàn toàn, thông tin từ Ilyes.

Cuối cùng, một cấu trúc liên kết điều hướng trực quan và logic là một điều cần thiết cho việc lập chỉ mục tốt. Thực tế là mọi trang bạn hy vọng sẽ được lập chỉ mục phải có thể truy cập từ ít nhất một liên kết trên trang web của bạn, các thực hành UX tốt là điều cần thiết. Phân loại là trung tâm của điều này.

Ví dụ, nghiên cứu của George Miller về Cách tổ chức thiết kế tương tác (Interaction Design Foundation) cho thấy não bộ con người chỉ có thể nắm giữ khoảng bảy khối thông tin trong bộ nhớ ngắn hạn tại một thời điểm.

Tôi khuyên bạn nên để cấu trúc điều hướng của mình được thiết kế xung quanh giới hạn này và trên thực tế, thậm chí có thể giới hạn menu của bạn không quá năm danh mục để giúp mọi người dễ sử dụng hơn nữa. Năm danh mục cho mỗi phần menu và năm danh mục con cho mỗi menu thả xuống có thể dễ dàng điều hướng hơn.

Dưới đây là một số điểm quan trọng mà đại diện của Google đã thực hiện về việc điều hướng và lập chỉ mục:

Bing đề xuất những điều sau:

Đọc bài viết 101 Điều cần chú ý trong xây dựng liên kết (links) SEO 2017 để biết thêm về cách xây dựng các liên kết điều hướng trên trang.

  1. Xử lý thông số URL

Tham số URL là nguyên nhân rất phổ biến của “khoảng trắng vô hạn” và nội dung trùng lặp, làm hạn chế nghiêm trọng ngân sách thu thập dữ liệu và có thể làm loãng tín hiệu. Chúng là các biến được thêm vào cấu trúc URL để hướng dẫn máy chủ được thực hiện những việc như:

Nếu bạn sử dụng Screaming Frog, bạn có thể xác định tham số URL trong tab URI bằng cách chọn “Parameters” từ trình đơn thả xuống “Filter”.

Kiểm tra các loại thông số URL khác nhau. Bất kỳ thông số URL nào không tác động đáng kể đến nội dung, chẳng hạn như thẻ chiến dịch quảng cáo, phân loại, lọc và cá nhân hóa, phải được xử lý bằng cách sử dụng chỉ thị noindex hoặc canonicalization (và không bao giờ dùng cả hai cùng lúc).

Bing cũng cung cấp một công cụ hữu ích để bỏ qua các thông số URL được chọn trong phần “Cấu hình trang web của tôi” trong “Công cụ quản trị trang web Bing”.

Nếu các tham số tác động đáng kể đến nội dung theo cách tạo ra các trang không trùng lặp, dưới đây là một số đề xuất của Google về việc triển khai phù hợp:

Tham khảo: Làm thế nào để tối ưu hóa URL trong SEO?

  1. Bộ lọc tốt và xấu

Khi nào bộ lọc tìm kiếm có thể thu thập dữ liệu bộ lọc và khi nào bộ lọc sẽ không được lập chỉ mục hoặc được chuẩn hóa? Quy tắc chung của tôi đó là khi bộ lọc bị ảnh hưởng bởi các đề xuất của Google ở ​​trên đó sẽ là bộ lọc “tốt”:

Khi đó nó nên được lập chỉ mục. Còn bộ lọc “xấu” theo ý kiến ​​của tôi:

Các loại bộ lọc này sẽ không được lập chỉ mục và thay vào đó nên được giải quyết bằng AJAX , chỉ thị noindex hoặc canonicalization.

Bing cảnh báo quản trị viên web sử dụng chức năng AJAX pushState để tạo URL có nội dung trùng lặp.

Xem thêm: Ajax trong Woocommerce Thêm AddtoCart load tự động

  1. Sử dụng đúng cách noindex và canonicalization

Noindexing yêu cầu các công cụ tìm kiếm không lập chỉ mục một trang, trong khi quá trình chuẩn hóa “canonicalization” cho các công cụ tìm kiếm biết rằng hai hoặc nhiều URL thực sự chỉ cùng một trang, nhưng đó là một trang “chính thức”.

Đối với các bản sao hoặc gần trùng lặp, canonicalization được ưu tiên trong hầu hết các trường hợp vì nó giữ quyền SEO, nhưng không phải lúc nào cũng có thể. Trong một số trường hợp, bạn không muốn bất kỳ phiên bản nào của trang được lập chỉ mục, trong trường hợp đó, bạn nên sử dụng noindex.

Không sử dụng noindex và canonicalization cùng một lúc.

John Mueller đã cảnh báo chống lại điều này bởi vì nó có khả năng nói cho các công cụ tìm kiếm để ngăn chặn các trang canonical cũng như các bản sao, mặc dù ông nói rằng Google rất có thể sẽ coi thẻ canonical là một sai lầm.

Dưới đây là những thứ cần được chuẩn hóa:

Dưới đây là những điều mà tôi khuyên bạn nên noindexed:

Xem thêm những cách giúp bạn lên top Google nhanh nhất: 3 Cách tăng lượng truy cập Website giúp SEO lên Top Google

Exit mobile version