Discovered - currently not indexed là gì? Cách hiểu đúng và checklist xử lý trong Google Search Console

Discovered - currently not indexed là gì?

Discovered - currently not indexed là trạng thái trong Google Search Console cho biết Google đã biết URL của bạn tồn tại, nhưng chưa ưu tiên truy cập để thu thập dữ liệu. Vì URL chưa được crawl, trang đó cũng chưa thể được lập chỉ mục và chưa có cơ hội xuất hiện ổn định trên kết quả tìm kiếm.

Nói một cách đơn giản, trạng thái này không có nghĩa là Google đang hạn chế trang của bạn. Nó chỉ cho thấy URL đang nằm ở giai đoạn đầu của quy trình.

Discovered khác gì với việc “đã index”?

Để tránh hiểu sai, cần tách rõ 3 bước:

Discovery: Google biết URL tồn tại, thường qua sitemap, liên kết nội bộ hoặc nguồn tham chiếu khác.
Crawling: Googlebot truy cập URL để đọc nội dung và tín hiệu kỹ thuật trên trang.
Indexing: Google quyết định có đưa URL vào chỉ mục tìm kiếm hay không.

Một bài blog mới publish hoặc một landing page mới tạo thường được Google phát hiện trước, nhưng chưa chắc đã được crawl ngay. Vì vậy, trong báo cáo index coverage, trạng thái này xuất hiện là điều hoàn toàn có thể xảy ra.

Vì sao trạng thái này khiến nhiều người nhầm là “lỗi”?

Có 3 lý do phổ biến:

URL chưa xuất hiện trên Google nên người quản lý website dễ nghĩ là có sự cố.
Tên trạng thái trong GSC nghe khá tiêu cực.
Nhiều người gom mọi trạng thái chưa index vào cùng một nhóm “lỗi index”.

Cần nhấn mạnh một điểm quan trọng: Discovered - currently not indexed không mặc định là hình phạt. Với URL mới, đây có thể chỉ là độ trễ trong mức ưu tiên thu thập dữ liệu của Google.

Trạng thái Discovered currently not indexed có đáng lo không? Khi nào cần can thiệp

Không phải mọi trường hợp URL không được Google crawl đều cần xử lý ngay. Cách đánh giá thực tế nhất là nhìn vào thời gian, mức độ quan trọng của URL và số lượng trang bị ảnh hưởng.

Nếu bạn chỉ có vài URL lẻ ở trạng thái pending index status, đôi khi Google chỉ đang trì hoãn crawl. Nhưng nếu nhiều URL quan trọng bị treo quá lâu, đó là lúc bạn cần xử lý.

Trường hợp có thể chờ thêm

Bạn có thể theo dõi thêm nếu rơi vào các tình huống sau:

URL mới publish trong 1 - 7 ngày.
Website còn mới, tín hiệu uy tín chưa mạnh.
Chỉ có vài URL lẻ gặp trạng thái này.
Trang không phải URL dịch vụ, URL doanh thu hoặc trang chiến lược.

Ví dụ: Một bài blog mới lên hôm qua, chưa được liên kết từ các bài cũ, vẫn ở trạng thái discovered currently not indexed là khá bình thường.

Trường hợp nên xử lý ngay

Nên kiểm tra và tối ưu nếu gặp các dấu hiệu sau:

URL quan trọng bị treo trên 2 - 4 tuần.
Nhiều URL cùng gặp trạng thái này.
URL đã tối ưu cơ bản nhưng vẫn chưa được crawl.
Đã gửi indexing request nhưng không có thay đổi rõ ràng.

Ví dụ: Một trang dịch vụ chính, có trong menu, đã nằm trong sitemap và đã có liên kết nội bộ nhưng sau vài tuần vẫn chưa được crawl, lúc này bạn cần phân tích và xử lý ngay.

Bảng quyết định nhanh: Chờ, tối ưu hay bỏ index

Tình huống	Nên làm gì	Mức ưu tiên
Bài blog mới publish 1 - 3 ngày.	Chờ thêm, kiểm tra lại sau vài ngày.	Thấp.
URL mới, website còn yếu, chỉ 1 - 2 trang bị ảnh hưởng.	Chờ kết hợp bổ sung internal link (liên kết nội bộ).	Thấp - Trung bình.
Trang dịch vụ quan trọng treo 2 - 4 tuần.	Kiểm tra bằng URL Inspection tool, tối ưu tín hiệu crawl.	Cao.
Nhiều URL cùng bị discovered.	Audit cấu trúc site, sitemap, canonical, chất lượng nội dung.	Rất cao.
Trang tag, filter, trang mỏng không có mục tiêu SEO rõ.	Cân nhắc không cần index.	Trung bình.

Điểm cần nhớ: Nếu URL yếu, mỏng hoặc ít liên kết, gửi yêu cầu index nhiều lần cũng không giải quyết nguyên nhân gốc.

Phân biệt Discovered - currently not indexed với các trạng thái dễ nhầm trong GSC

Một sai lầm rất phổ biến là xem tất cả trạng thái chưa index như cùng một loại vấn đề. Thực tế, discovered currently not indexed và crawled currently not indexed là hai tín hiệu khác nhau và cách xử lý cũng khác.

Bảng so sánh trạng thái trong GSC

Trạng thái	Google đã biết URL?	Google đã crawl?	Nguyên nhân thường gặp	Hướng xử lý ưu tiên
Discovered - currently not indexed	Có	Chưa	URL mới, tín hiệu yếu, ưu tiên crawl thấp, cấu trúc link chưa tốt	Kiểm tra giá trị URL, internal linking, sitemap, tín hiệu kỹ thuật
Crawled - currently not indexed	Có	Có	Google đã đọc trang nhưng chưa thấy đủ giá trị để index	Nâng cao chất lượng nội dung, xử lý trùng lặp, cải thiện giá trị nội dung
Excluded by noindex	Có	Có thể có	Trang bị gắn noindex	Gỡ noindex nếu muốn index
Duplicate / Google chose different canonical	Có	Thường có	Nội dung trùng, canonical (URL chuẩn Google nên ưu tiên) không rõ	Chuẩn hóa canonical, giảm URL trùng
URL không nằm trong sitemap hoặc tín hiệu yếu	Có thể có	Có thể chưa	Trang khó được phát hiện, ít liên kết	Thêm vào XML sitemap, cải thiện cấu trúc site

Bảng so sánh trực quan các trạng thái index trong GSC

Vì sao phải dùng URL Inspection thay vì chỉ nhìn báo cáo Pages?

Báo cáo Pages trong GSC chỉ cho bạn góc nhìn tổng hợp. Nó hữu ích để thấy xu hướng, nhưng chưa đủ để kết luận cho từng URL.

URL Inspection tool mới là nơi nên kiểm tra từng trang cụ thể, vì bạn có thể xem:

Google đã biết URL chưa.
URL đang ở trạng thái nào.
Google đang chọn canonical nào.
Trang có thể được kiểm tra bằng live test hay không.
Có thể gửi request indexing nếu cần.

Một lưu ý đáng chú ý trong giai đoạn gần đây là báo cáo tổng hợp đôi khi gom nhiều URL vào nhóm discovered hơn mức người dùng kỳ vọng. Vì vậy, đừng chỉ nhìn báo cáo Pages rồi kết luận vội về các vấn đề liên quan đến hàng đợi crawl.

5 nguyên nhân phổ biến nhất khiến Google biết URL nhưng chưa crawl

Phần lớn trường hợp discovered currently not indexed có nguyên nhân nằm ở chất lượng nội dung, cấu trúc website và hiệu quả thu thập dữ liệu tổng thể. Với đa số website doanh nghiệp, bạn nên nghĩ theo hướng crawl efficiency (hiệu quả thu thập dữ liệu), thay vì ám ảnh crawl budget như các site enterprise rất lớn.

Nội dung mỏng, trùng lặp hoặc giá trị thấp

Đây là nguyên nhân rất phổ biến. Nếu URL không cho Google thấy giá trị rõ ràng, trang đó dễ bị trì hoãn crawl.

Các tình huống thường gặp:

Bài viết quá ngắn, chỉ lặp lại kiến thức chung.
Nhiều bài blog gần giống nhau, khác rất ít về góc nhìn.
Trang tag/category gần như không có nội dung riêng.
Landing page sơ sài, chỉ có vài đoạn giới thiệu mỏng.

Ví dụ với website B2B: bạn tạo 10 bài viết xoay quanh các biến thể rất gần nhau của một chủ đề, nhưng mỗi bài chỉ 400-500 từ và thiếu insight riêng. Google có thể không ưu tiên crawl tất cả các URL đó.

Trong bối cảnh Google ngày càng “khó tính” hơn với chất lượng nội dung, content quality đang là tín hiệu quan trọng hơn trước.

Internal link yếu hoặc trang gần như “mồ côi”

Internal linking là tín hiệu giúp Google hiểu URL nào quan trọng trong website. Nếu một trang chỉ nằm trong sitemap nhưng không được liên kết từ nơi khác, nó gần như là một trang “mồ côi” (orphan page).

Dấu hiệu thường thấy:

URL chỉ xuất hiện trong sitemap.
Trang nằm quá sâu, cần nhiều click mới tới.
Không có link từ bài viết liên quan hoặc trang trụ cột.
Link nội bộ dùng cách triển khai khó đọc thay vì thẻ <a> chuẩn.

Ví dụ: một bài blog doanh nghiệp vừa xuất bản nhưng chưa được đưa vào danh mục (category), thiếu liên kết từ các bài viết cũ và không nằm trong mục bài viết liên quan. Khi đó, Google biết URL tồn tại nhưng chưa thấy tín hiệu đủ mạnh để ưu tiên crawl.

5 nguyên nhân Google biết URL nhưng chưa crawl

Sitemap có URL nhưng website không gửi đủ tín hiệu quan trọng

Nhiều đội ngũ nghĩ rằng chỉ cần đưa URL vào XML sitemap là Google sẽ crawl ngay. Thực tế, sitemap chỉ là tín hiệu gợi ý.

Vấn đề thường nằm ở chỗ:

Sitemap chứa quá nhiều URL yếu.
Bao gồm cả trang không thật sự cần index.
URL trong sitemap không được hỗ trợ bởi liên kết nội bộ và chất lượng nội dung.

Nếu sitemap “loãng”, tín hiệu quan trọng của các URL cần index cũng bị loãng theo. Cách thực tế hơn là chỉ giữ các URL thực sự cần index và có giá trị SEO rõ ràng.

Crawl thiếu hiệu quả do redirect, duplicate URL, tham số hoặc canonical lộn xộn

Đây là nhóm vấn đề làm giảm hiệu suất crawl dù website không quá lớn.

Các lỗi phổ biến gồm:

Nhiều phiên bản URL cho cùng một nội dung.
Internal link đi qua redirect không cần thiết.
Duplicate content (nội dung trùng lặp) giữa các URL tương tự.
canonical tag (thẻ chỉ định URL chuẩn) khai báo không rõ hoặc lệch.
HTTP/HTTPS, www/non-www hoặc URL có tham số gây nhiễu.

Ví dụ: Cùng một trang có thể truy cập qua nhiều biến thể URL, trong khi canonical không nhất quán. Khi đó, Google cần thêm tài nguyên để xử lý và có thể trì hoãn crawl những URL ít quan trọng hơn.

Server chậm hoặc website phản hồi thiếu ổn định

Không phải lúc nào vấn đề cũng nằm ở nội dung. Nếu website phản hồi chậm hoặc thiếu ổn định, Google có thể giảm tốc độ crawl.

Các tình huống thường gặp:

Hosting yếu.
Thời gian phản hồi của máy chủ quá lâu.
Timeout khi tải trang.
Lỗi 5xx xuất hiện rải rác.
Website vừa migrate xong nhưng phản hồi chưa ổn định.

Với các website doanh nghiệp đang mở rộng nội dung, đây là lỗi hay bị bỏ qua. Google không cần phải “phạt” website; chỉ cần thấy máy chủ phản hồi kém ổn định, hệ thống có thể giảm ưu tiên crawl và quay lại sau.

Tóm lại, với phần lớn website nhỏ và vừa, nên ưu tiên tối ưu hiệu suất crawl hơn là nói quá nhiều về crawl budget. Theo chia sẻ nhiều năm từ phía Google, crawl budget thực sự chỉ là mối quan tâm lớn với các website cực lớn.

Checklist xử lý nhanh theo thứ tự ưu tiên

Nếu đang tìm cách xử lý trạng thái Discovered currently not indexed trong GSC, đừng bắt đầu bằng việc bấm gửi index hàng loạt. Cách làm đúng là kiểm tra trước, xác định giá trị URL, rồi mới tối ưu tín hiệu.

Bước 1: Kiểm tra URL bằng URL Inspection trong GSC

Việc đầu tiên là mở URL Inspection tool và kiểm tra từng URL quan trọng.

Bạn cần nhìn vào các điểm sau:

Google đã biết URL chưa?
URL đang nằm ở trạng thái nào?
Google đang chọn canonical nào?
Có thể chạy live test hay không?

Mục tiêu của bước này là tránh chẩn đoán sai. Có những URL tưởng là discovered, nhưng khi soi riêng lại lộ ra vấn đề canonical hoặc noindex.

Bước 2: Đánh giá xem trang này có thật sự nên được index không

Không phải mọi URL đều cần xuất hiện trên Google. Hãy tự hỏi:

Trang này có mục tiêu SEO rõ ràng không?
Nội dung có đủ sâu và khác biệt không?
Đây có phải thin content (nội dung mỏng, ít giá trị riêng) không?
Đây có phải trang tag, filter hoặc trang phụ ít giá trị tìm kiếm không?

Nếu câu trả lời là “không”, bạn không nên ép index. Chất lượng chỉ mục tốt luôn quan trọng hơn số lượng URL được index.

Bước 3: Thêm internal link từ các trang đã index và có liên quan

Nếu URL xứng đáng được index, hãy tăng tín hiệu quan trọng cho nó bằng internal linking.

Cách làm thực tế:

Thêm 3-5 internal links từ các trang liên quan.
Ưu tiên link từ trang đã có traffic hoặc trang hub.
Dùng anchor text tự nhiên, phản ánh đúng chủ đề.
Đảm bảo link dùng thẻ <a> chuẩn.

Đây là một trong những cách đơn giản nhưng hiệu quả nhất để tăng ưu tiên crawl cho URL mới hoặc URL đang bị bỏ quên.

Bước 4: Kiểm tra sitemap, canonical và robots/noindex cơ bản

Sau khi xử lý nội dung và liên kết, cần rà lại tín hiệu kỹ thuật nền:

URL có nằm trong XML sitemap không?
Sitemap có chứa quá nhiều URL rác không?
Có noindex ngoài ý muốn không?
Canonical tag có trỏ đúng URL cần ưu tiên không?
Robots có chặn crawl sai không?

Đây là bước để loại bỏ các xung đột đơn giản nhưng rất hay gặp trong quá trình publish, migrate hoặc chỉnh sửa template.

Bước 5: Chỉ request indexing cho các URL thực sự quan trọng

Indexing request chỉ nên là bước cuối.

Nguyên tắc thực tế:

Chỉ gửi cho URL quan trọng.
Chỉ gửi sau khi đã tối ưu cơ bản.
Không submit hàng loạt mỗi ngày.
Theo dõi lại sau vài ngày đến khoảng 2 tuần.

Nếu website có vài URL chiến lược đang cần xuất hiện sớm, bước này hợp lý. Nhưng nếu toàn site có vấn đề nền, gửi yêu cầu liên tục sẽ không tạo ra thay đổi bền vững.

Nếu bạn cần rà soát nhóm URL dịch vụ, blog trụ cột hoặc landing page quan trọng, một buổi audit nhanh theo cụm URL sẽ hiệu quả hơn nhiều so với submit index thủ công từng trang.

Checklist xử lý nhanh Discovered currently not indexed theo thứ tự ưu tiên

Những việc không nên làm khi gặp trạng thái Discovered currently not indexed

Nhiều website xử lý mãi không hết vì làm sai thứ tự. Dưới đây là 3 sai lầm phổ biến nhất.

Sai lầm 1: Submit index liên tục nhưng không sửa nguyên nhân nền

Gửi indexing request lặp lại có thể hữu ích với vài URL, nhưng không thay thế việc tối ưu nội dung, liên kết nội bộ và cấu trúc website. Nếu nguyên nhân gốc vẫn còn, trạng thái có thể quay lại hoặc URL vẫn không được index ổn định.

Sai lầm 2: Muốn mọi URL đều được index

Đây là tư duy dễ làm loãng chất lượng toàn site. Những trang thin content, trang lọc, trang tag yếu hoặc URL trùng lặp không phải lúc nào cũng đáng được index. Cố ép tất cả URL lên chỉ mục thường không tạo thêm giá trị SEO.

Sai lầm 3: Bỏ qua tín hiệu toàn site và đổ lỗi hết cho crawl budget

Với website nhỏ và vừa, việc quản lý crawl budget thường không không phải là ưu tiên lớn nhất. Cụ thể, yếu tố cần sửa trước là chất lượng nội dung, duplicate content, cấu trúc link và khả năng phản hồi của site. Nói cách khác, đừng đổ mọi thứ cho crawl budget khi tín hiệu nền còn yếu.

Ví dụ thực tế: vì sao bài đã publish nhưng vẫn bị “Discovered” nhiều ngày

Một tình huống khá phổ biến trên blog doanh nghiệp là bài mới đã đăng, đã có trong sitemap nhưng vẫn treo ở trạng thái discovered nhiều ngày. Khi kiểm tra kỹ, nguyên nhân thường không quá phức tạp.

Vấn đề: Bài viết ngắn, chủ đề khá giống các bài cũ, chưa được gắn từ category hub, cũng chưa có internal linking từ các bài đã index.
Điều chỉnh: Bổ sung chiều sâu cho nội dung, thêm liên kết từ 3-4 bài liên quan, rà lại website structure và kiểm tra sitemap, canonical.
Kết quả: Sau khi tín hiệu về chất lượng nội dung và liên kết nội bộ rõ hơn, URL thường được Google crawl và có cơ hội index tốt hơn trong các lần cập nhật tiếp theo.

Đây là lý do SEO On Top thường xem trạng thái này như một tín hiệu chẩn đoán ưu tiên, thay vì vội kết luận là lỗi nghiêm trọng.

Câu hỏi thường gặp

"Discovered - currently not indexed" là gì trong Google Search Console?

Đây là trạng thái thông báo rằng Google đã nhận diện được URL của bạn qua sitemap hoặc các liên kết nội bộ, nhưng chưa thực hiện thu thập dữ liệu (crawl). Vì Google chưa truy cập nội dung, trang web của bạn chưa thể được lập chỉ mục (index) và hiển thị trên kết quả tìm kiếm.

Trạng thái "Discovered - currently not indexed" khác gì với "Crawled - currently not indexed"?

Sự khác biệt nằm ở giai đoạn xử lý: "Discovered" nghĩa là Google mới chỉ biết URL tồn tại và chưa hề ghé thăm. Ngược lại, "Crawled - currently not indexed" nghĩa là Google đã truy cập nội dung nhưng đánh giá trang đó chưa đủ giá trị hoặc chất lượng để đưa vào chỉ mục tìm kiếm.

Tôi có cần lo lắng khi thấy thông báo này không?

Không nhất thiết. Nếu bạn vừa đăng tải nội dung mới (trong vòng 1-7 ngày), đây là quy trình hoàn toàn bình thường khi Google đang xếp hàng ưu tiên crawl. Bạn chỉ cần can thiệp nếu URL là trang chiến lược, quan trọng nhưng đã bị treo trạng thái này quá 2-4 tuần mà không có chuyển biến.

Làm thế nào để giải quyết vấn đề "Discovered - currently not indexed"?

Bạn nên thực hiện theo quy trình 4 bước:

Kiểm tra URL bằng công cụ "URL Inspection" trong GSC.
Đánh giá lại chất lượng nội dung của trang đó.
Tăng cường liên kết nội bộ (internal link) trỏ đến URL từ các trang đã index.
Chỉ yêu cầu Google index (Request Indexing) sau khi đã tối ưu xong các tín hiệu trên.

Tại sao website của tôi bị Google "bỏ quên" các URL mới?

Google thường ưu tiên tài nguyên thu thập cho những trang có giá trị cao. Website của bạn có thể đang bị thiếu tín hiệu ưu tiên do: nội dung mỏng/trùng lặp, cấu trúc liên kết nội bộ yếu, hoặc Google đang gặp khó khăn trong việc phân bổ crawl budget cho các trang có độ ưu tiên thấp.

Có nên sử dụng tính năng "Request Indexing" cho tất cả URL bị treo không?

Không. Bạn không nên lạm dụng việc yêu cầu lập chỉ mục hàng loạt. Việc này không giúp thay đổi nguyên nhân gốc rễ (như chất lượng trang kém). Hãy tập trung tối ưu hóa cấu trúc website, tăng cường internal link và chỉ gửi yêu cầu cho các trang thực sự quan trọng đối với doanh nghiệp.

Xem thêm:

Kết luận

Discovered currently not indexed không hoàn toàn là lỗi nặng, càng không mặc định là hình phạt từ Google. Trong đa số trường hợp, đây là tín hiệu cho thấy Google đã biết URL nhưng chưa thấy đủ lý do để ưu tiên crawl ngay. Khi đó, thứ tự bạn nên ưu tiên xử lý đúng là: Kiểm tra URL có thật sự đáng index hay không, củng cố internal linking, rà lại sitemap và canonical, rồi mới cân nhắc request indexing cho các trang quan trọng.

Discovered - currently not indexed là gì? Cách hiểu đúng và checklist xử lý trong Google Search Console