10 nguyên nhân khiến nội dung webiste không được Google Index.

Tác giả : Thanh Dương 16/08/2021
140

Tại sao nội dung website không được Google Index? Dưới đây là 10 lý do phổ biến mà các nhà quản trị nội dung cần biết để phòng tránh và tăng khả năng hiển thị nội dung của mình trên Google.

Ảnh minh họa. Nguồn pexels.com

Thực tế cho thấy, ngoài việc không ưu tiên hiển thị những nội dung mà chúng ta đã đăng tải, Google còn có thể xóa chúng khỏi chỉ mục trên SERP.

Tại sao Google lại loại trừ những nội dung như vậy, hiểu một cách đơn giản vì nó cho rằng những nội dung đó “chẳng mang lại tích sự gì cho người dùng” bởi Google luôn đặt “trải nghiệm của người dùng” lên vị trí số 1.

Không có người dùng sẽ không có người sử dụng các dịch vụ do Google tạo ra, lúc đó doanh thu sẽ bị sụt giảm. Do đó hãy luôn nhớ “bạn càng cung cấp những nội dung có ích cho người dùng thì bạn càng có cơ hội được xếp hạng cao trên SERP” và ngược lại bạn sẽ chẳng bao giờ có được lưu lượng truy cập tự nhiên từ “lời giới thiệu của Google”.

Dưới đây là các nguyên nhân phổ biến khiến nội dung, bài viết của website sẽ chẳng bao giờ được hiển thị, thậm chí Google còn từ chối lập chỉ mục cho nó mà bất cứ SEOer nào cũng cần biết.

Liên quan: Google tạm thời tắt tính năng yêu cầu lập chỉ mục.

1. Nội dung bị chặn bởi tệp Robot.txt.

Bạn có một nội dung tốt, không sao chép ở đâu và bạn tin vào chất lượng của nội dung đó sẽ khiến người dùng thích thú. Nhưng sau một thời gian công khai trên website mà vẫn không tìm thấy url đó trên trang kết quả tìm kiếm, hãy kiểm tra lại xem bạn có lỡ tay chỉnh sửa và chặn một số đường dẫn trên tệp Robot.txt không.

Theo

Tệp robots.txt sẽ là nơi bạn đánh dấu cho các công cụ tìm kiếm biết nơi chúng có thể và không thể truy cập vào trên trang web của bạn để trích xuất dữ liệu. Về cơ bản, tệp này liệt kê tất cả nội dung bạn muốn hiển thị hoặc ẩn khỏi các công cụ tìm kiếm.

Chính vì vậy nếu như một ngày đẹp trời bạn kiểm tra lại và thấy nhiều nội dung mình đã đăng tải trước đó có vẻ rất hấp dẫn nhưng lại mất tích trên Google thì việc đầu tiên hãy kiểm tra lại các lệnh trong tệp này trên hosting xem bạn đã cấu hình nó chính xác chưa.

Để biết chính xác bạn nên thiết lập tệp Robot.txt như thế nào bạn có thể đọc thêm các nội dung internet hoặc làm theo hướng dẫn của Google.

2. Ngăn chặn lập chỉ mục bởi Plugin SEO.

Tôi đã gặp trường hợp này một lần, số là trước đây tôi dùng Plugin SEO Yoast. Sau đó chuyển sang Plugin SEO Rank Math.

Trong SEO Rank Math khi bạn tối ưu hóa nội dung có phần ngăn chặn không hiển thị nội dung, vô tình tôi đã Click nhầm vào đó. Sau một thời gian tìm kiếm tôi đã phát hiện ra nguyên nhân.

Bạn cũng có thể tìm thấy nó tại mục Advanced, hãy bỏ dấu tích chọn tại No Index như hình phía dưới đi nhé.

3. Google từ chối các trang nội dung Spam (hoặc có vẻ giống Spam).

Thống kê thực tế cho thấy, mỗi ngày Google tìm thấy và lọc ra khoảng 25 tỷ các trang nội dung là Spam hoặc thuộc diện nghi vấn là Spam.

Có nhiều cách thức, thuật toán và cơ chế để Google phát hiện và đánh giá nội dung Spam, nhưng theo các chuyên gia SEO nó sẽ bao gồm một số các hình thức cơ bản như: spam liên kết, spam do người dùng tạo và spam trên các trang web bị tấn công (đây là ba xu hướng spam hàng đầu bị đánh dấu)

4. Nhồi nhét từ khóa trong nội dung.

Mẹo tốt nhất để tạo ra nội dung chuẩn SEO đó là phải hấp dẫn người đọc và tối ưu hóa cho máy học. Nhằm mong muốn có được thứ hạng cao trên Google rất nhiều các SEO Newbie vẫn thường nhồi nhét từ khóa trong nội dung của mình.

Thậm chí nhiều người nghe đâu đó thường bôi đen các cụm từ khóa chuẩn bị sẵn vì nghĩ rằng “Con Google bot có thể nhìn thấy và sẽ hiển thị nội dung của mình khi người dùng tìm kiếm các từ khóa đó“.

Thật buồn cười bởi đây là một cách làm hết sức chủ quan dẫn tới tình trạng nhồi nhét từ khóa vào nội dung. Thực tế là việc sắp xếp tỷ lệ từ khóa mà người dùng tìm kiếm vào trong một bài viết là hết sức cần thiết và phải có một tỷ lệ phù hợp chứ không phải “bạ đâu là nhồi đó”.

Mặc dù nhồi nhét từ khóa có thể là một cách dễ dàng để tăng thứ hạng của bạn, nhưng bạn cũng có nguy cơ bị Google xóa trang web của bạn khỏi kết quả tìm kiếm nếu như lạm dụng nó nhất là khi bạn chưa có nhiều kinh nghiệm nhiều về SEO nội dung.

Hơn nữa với thuật toán tìm kiếm theo ngữ nghĩa của Google thì giờ đây nó quá đủ thông minh để phân loại các loại nội dung với nhau.

4. Nội dung trùng lặp.

Một trong những lý do khiến nội dung của bạn không xuất hiện (hoặc xuất hiện tại tầng mây thứ 9) đó là Google đã đánh dấu nội dung của bạn là trùng lặp.

Có nhiều loại nội dung trùng lặp, tuy nhiên phổ biến nhất là các nội dung được sao chép qua lại trên các website. Đây là lý do phổ biến khiên nhiều các trang tin tức tổng hợp không hề có thứ hạng trên Google hoặc các trang web của doanh nghiệp thường xuyên đi ăn cắp chỉ với mục đích cho có nội dung giúp “làm đẹp cho website”.

Để tránh việc này hãy tự tạo những nội dung của riêng bạn thật hấp dẫn người dùng, nếu nội dung trùng lặp sảy ra trên website hãy chú ý thêm các thẻ noindex và thẻ meta HTML nofollow vào nội dung đó.

5. Nội dung tạo tự động.

Giống như nội dung trùng lặp thông qua việc sao chép trực tiếp, nội dung tạo tự động là cách mà các website lấy tin tự động từ các trang khác cập nhật trên website của mình thông qua RSS Feeds.

Với các CMS như WordPress hoặc Joomla, nhiều ông chủ doanh nghiệp nghĩ rằng việc cập nhật tin tức tự động sẽ làm giảm bớt gánh nặng và chi phí thuê nhân sự, nó rất đơn giản là cài đặt một Plugin cập nhật tin tự động. Khi người dùng truy cập website có càng nhiều tin tức thì càng hấp dẫn, điều này thật buồn cười nhưng không hiếm. Ngay cả chính tôi cũng đã được nhiều người hỏi về vấn đề này và cho rằng “đó là chân lý”.

6 Chuyển hướng lén lút.

Theo Google

Chuyển hướng là hành động đưa khách truy cập tới một URL khác với URL họ yêu cầu ban đầu. Có nhiều lý do chính đáng để chuyển hướng một URL tới một URL khác, chẳng hạn như khi di chuyển trang web của bạn sang địa chỉ mới hoặc khi hợp nhất nhiều trang thành một trang.

Tuy nhiên, một số chuyển hướng đánh lừa công cụ tìm kiếm hoặc hiển thị cho người dùng nội dung khác với nội dung được cung cấp cho trình thu thập dữ liệu. Bạn sẽ vi phạm Nguyên tắc quản trị trang web của Google khi chuyển hướng người dùng đến một trang khác với ý định hiển thị nội dung khác với nội dung được cung cấp cho trình thu thập dữ liệu của công cụ tìm kiếm.

Khi một chuyển hướng được triển khai theo cách này, công cụ tìm kiếm có thể lập chỉ mục trang gốc thay vì theo chuyển hướng, trong khi đó người dùng được đưa đến đích chuyển hướng. Giống như kỹ thuật che giấu, phương pháp này là đánh lừa vì nó cố gắng hiển thị nội dung khác nhau cho người dùng và Googlebot và có thể đưa khách truy cập đến một trang khác với mong đợi của họ.

Và tất nhiên, Google sẽ phạt các chuyển hướng lén lút vì không hiển thị nội dung cho người dùng khác với nội dung được chuyển tiếp đến các công cụ tìm kiếm, điều này tương tự như kỹ thuật che giấu.

7. Mã nguồn có chứa các phần mềm độc hại.

Google cấm tuyệt đối các hình thức tội phạm mạng, cho dù là lừa đảo hoặc thiết lập phần mềm độc hại như trojan và vi rút máy tính.Tính năng xóa nội dung của Google sẽ kích hoạt nếu bạn tạo các trang web độc hại để:

  • Có được quyền truy cập không được yêu cầu vào thông tin nhạy cảm của người dùng.
  • Đánh cắp chức năng hệ thống của người dùng.
  • Làm hỏng hoặc xóa dữ liệu cần thiết.
  • Theo dõi hoạt động máy tính của người dùng.

……

8. Nội dung kêu gọi hoặc giống hình thức trao đổi, mua bán liên kết.

Một trong những chiêu thức trước đây là giới SEO hay sử dụng đó là “trao đổi, mua bán liên kết“. Đơn giản có thể hiểu như này, tôi đăng liên kết của anh và anh đang lại liên kết của tôi. Liên kết đó có thể là ở footer hoặc trong nội dung và giờ đây nó sẽ trở thành một hành vi thao túng thứ hạng nếu như bạn sử dung quá đà và không thêm các thẻ mô tả chi tiết.

Liên quan

Hiện nay Google sẽ từ chối các hình thức liên kết dưới đây…

  • Các liên kết trả tiền để thao tác các kết quả tìm kiếm.
  • Thư mục liên kết chất lượng thấp.
  • Các liên kết ẩn (hoặc không) dưới chân trang.
  • Comment ​​và chữ ký trên các diễn đàn với các liên kết từ khóa nhồi.

Một mưu mô khác đó là việc bạn sử dụng các liên kết ẩn, đây là một hình thức SEO mũ sám nên tránh, hãy lưu ý với các thủ thuật lách luật như vậy.

9 . Nội dung chất lượng thấp.

Với những loại nội dung này hầu hết nó đều có thứ hạng rất thấp và nằm rất sâu trên các trang kết quả tìm kiếm, và như bạn biết đấy, chỉ cần sếp tại trang 2 của Google thôi thì gần như bạn đã mất cơ hội nhận lưu lượng truy cập chứ đừng nghĩ đến trang thứ 3.

Việc tạo nội dung chất lượng thấp có thể khiến nội dung của bạn bị xóa khỏi Google Tìm kiếm nhanh hơn bạn nghĩ.

Bạn không nên đăng nội dung không liên quan, vô nghĩa hoặc đạo văn vì lợi ích xếp hạng từ khóa hoặc tính nhất quán. Hãy dành thời gian để viết những bài đăng chất lượng cao và nguyên bản mà khán giả của bạn sẽ thấy hữu ích.

10. Vấn đề trang ngõ và truy vấn tự động.

Bạn đã nghe đến thuật ngữ Trang ngõ chưa? Dám cá là có đến 50% người mới tìm hiểu về SEO chưa biết đến nó. Sau đây là lời giải thích của Google…

Trang ngõ là các trang web hay trang được tạo để có thứ hạng cao đối với một số cụm từ tìm kiếm cụ thể. Loại trang này có hại cho người dùng vì có thể dẫn tới nhiều trang tương tự nhau trong kết quả tìm kiếm (về cơ bản, các kết quả đưa người dùng đến cùng một trang đích). Loại trang này cũng có thể đưa người dùng đến những trang trung gian không hữu ích bằng trang đích.

Sau đây là một số ví dụ về trang ngõ:

  • Nhiều tên miền hoặc trang nhắm mục tiêu các khu vực hay thành phố cụ thể nhưng lại chỉ dẫn người dùng đến một trang
  • Các trang được tạo để dẫn khách truy cập đến phần thực sự liên quan hay sử dụng được trên (các) trang web
  • Các trang giống nhau đáng kể và gần giống kết quả tìm kiếm chứ không phải một hệ thống phân tầng được xác định rõ ràng và duyệt xem được.

Tất nhiên, Google sẽ phạt người dùng đối với các trang ngõ vì mục đích duy nhất là thu thập lượng truy cập lớn vào một trang web trong khi đánh lừa người dùng bằng các kết quả tìm kiếm khác nhau.

Một vấn đề khác đó là truy vấn tự động tới Google, có thể hiểu như này…

Đã là người làm SEO chúng ta thường quan tâm tới KPI của một nội dung với mong muốn xem để biết rằng nội dung đó hiện có thứ hạng ra sao trên SERP, vì vậy người dùng có thói quen lạm dụng các tool để kiểm tra.

Việc thường xuyên sử dụng các công cụ truy vấn để tuy vấn vào Google sẽ bị đánh dấu là truy vấn tự động, và bạn sẽ bay mầu bởi Google cũng đã nói rõ “Google không chấp nhận các truy vấn tự động thuộc mọi loại hình tới hệ thống của chúng tôi khi chưa có sự cho phép rõ ràng từ trước của Google. Việc gửi các truy vấn tự động gây tiêu tốn tài nguyên.

Hành vi này bao gồm việc sử dụng phần mềm bất kỳ (chẳng hạn như WebPosition Gold) để gửi các truy vấn tự động tới Google nhằm xác định thứ hạng của một trang hoặc trang web trong kết quả tìm kiếm trên Google đối với nhiều cụm từ tìm kiếm.”

Vậy đó, ngoài việc được Google index nhanh dữ liệu để tránh việc mất bản quyền nội dung thì bạn cũng nên thường xuyên kiểm tra lại các nội dung của website xem có được hiển thị hay không.

Nội dung webiste không được Google Index không phải là trường hợp hiếm, nếu bạn gặp phải các tình huống này hãy kiểm tra lại các đầu mục như trên để tìm ra nguyên nhân.

Tin liên quan

Exit mobile version