اکستنشن کروم جت سئو

آموزش کامل گزارش pages در سرچ کنسول و نحوه گزارش گیری آن


سئو سایت حرفه ای نیازمند آنالیز دقیق صفحات سایت است که این کار در سرچ کنسول در بخش Pages قابل انجام است. در این صفحه از سایت جت سئو، گزینه های مختلف Pages و مفهوم گزارش های هر بخش را به صورت کامل و جامع می آموزید. بعد از مطالعه این محتوا می توانید علت مشکلات سایت خود از نظر ایندکس و کراول را تشخیص دهید و اقدامات مناسب در راستای رفع مشکل را انجام دهید.

بعد از آشنایی با اینکه سئو چیست، یکی از اولین قدم ها برای یادگیری سئو آموختن نحوه کار با سرچ کنسول است. Pages بخشی از سرچ کنسول گوگل است که وضعیت خزش و ایندکس تمام URLهایی که گوگل روی سایت شما پیدا کرده است را نشان می‌دهد. این گزارش قبلا با عنوان Coverage شناخته می شد اما در سال 2022 نام آن به Pages تغییر کرد. در این مطلب به بررسی این ابزار بخش‌های مختلف آن و نحوۀ حل خطاهایی که در گزارش Pages سرچ کنسول وجود دارد می‌پردازیم. این مطلب بخشی از آموزش سرچ کنسول در سایت جت سئو است که یکی از بهترین ابزارهای سئو و مهم‌ترینِ آن‌هاست.

بخش pages سرچ کنسول

معرفی گزارش Pages سرچ کنسول (بخش Coverage سابق)

گوگل در ژانویۀ سال 2018 از این ابزار با نام Coverage جدید رونمایی کرد. در کنار این ابزار، دو گزارش دیگر مرتبط با عملکرد جست‌وجو و پیشرفت‌های جست‌وجو (Enhancement) نیز معرفی شد که گوگل 3 هدف اصلی خود را از این به روزرسانی‌ها اینگونه اعلام کرد:

  1. اضافه کردن بینش عملی بیشتر
  2. حمایت از همکاری تیم‌های مختلف که از این ابزار استفاده می‌کنند.
  3. ارائه بازخورد سریع‌تر بین گوگل و کاربران

اما 3 سال بعد در ژانویه 2021 گوگل گزارش Coverage در سرچ کنسول را بهبود بخشید تا آن را دقیق‌تر و واضح‌تر کند. این تغییرات شامل موارد زیر می‌شدند:

  • حذف نوعی مشکل به نام Crawl Anomaly
  • تعیین نامی برای صفحاتی که ثبت شده‌اند اما توسط robot.txt مسدود شده‌اند ولی اینکدس شده‌اند با عنوان indexed but blocked
  • اضافه کردن مشکلی به نام indexed without content در بخش هشدارها
  • دقیق‌تر کردن مشکلات مربوط به 404

تغییر بعدی این گزارش سرچ کنسول مربوط به آگوست 2022 است که نام گزارش Coverage به Pages تغییر کرد که باعث شده است بعضی از مشکلات نمایش داده شده در این گزارش با یکدیگر ادغام شوند و نام واحدی پیدا کنند که در ادامه به آن اشاره خواهیم کرد.

چرا گزارش Pages گوگل سرچ کنسول مهم است؟

این گزارش نقشی اصلی را در روند رتبه‌بندی یک سایت ایفا می‌کند. چون برای اینکه یک صفحه یا سایت رتبه بگیرد، باید چند مرحله را پشت سربگذارد. اولین مرحله کشف شدن آن صفحه و سایت است. گوگل معمولا این کشف را از طریق نقشۀ سایت انجام می‌دهد. مرحلۀ بعدی خزش است که خزنده‌های گوگل بسته به بودجه‌ای که دارند سراغ خزیدن سایت شما می‌روند.

مرحله سوم ایندکس شدن است. بعد از اینکه سایت شما خزیده شد، گوگل آن را ایندکس می‌کند تا آن سایت در نتایج گوگل ظاهر شود. در نهایت بعد از ایندکس شدن است که آن صفحه یا سایت رتبه می‌گیرد. بسیاری از مشکلات مربوط به این روند در گزارش Pages قابل مشاهده است. به عبارت دیگر در این گزارش شما به انواع خطاهایی که ممکن است صفحات سایتتان ایندکس نشود دسترسی خواهید داشت.

بخش‌های مختلف Pages سرچ کنسول

تا قبل از آگوست 2022 وقتی گزارش Pages سرچ کنسول را باز می‌کردید، نمودار میله‌ای به 4 رنگ مختلف می‌دیدید که هر کدام بیانگر نوع خاصی از صفحات بود. این 4 بخش Errors، valid with warning، valid و Excluded بودند:

گزارش coverage سرچ کنسول

اما در آپدیتی که در این ماه توسط گوگل انجام شد، برخی از این بخش ها حذف و با هم ادغام شدند و با نام‌های جدیدی ظاهر شدند. در این آپدیت، بخش Errors و Excluded در گروه Not Indexed قرار گرفتند و دو گروه Valid  و valid with warning نیز در گروه Indexed قرار گرفتند:

گزارش Pages در سرچ کنسول

در ادامه، این دو بخش و خطاهایی که به نمایش می‌گذارند را بررسی می‌کنیم.

شما وقتی این نسخۀ جدید گزارش Pages را باز می‌کنید، یک نمودار با دو متغیر مشاهده می‌کنید و در زیر آن باکسی وجود دارد که عنوانش Why pages aren’t indexed است. یعنی دلایل ایندکس نشدن صفحات را به نمایش می‌گذارد:

خطاهای گزارش Coverage سرچ کنسول

بخش Indexed (بخش Valid و valid with warning سابق)

این بخش که در نمودار با میله‌های سبز رنگ مشخص شده است، در واقع URLهایی را نشان می‌دهد که بدون هیچ مشکلی ایندکس شده‌اند. یعنی حتی اگر طبق نسخۀ قبل گزارش Pages، valid with warning بوده‌اند، الان در دستۀ صفحات ایندکس شده قرار گرفته‌اند.

در بخش زیرین نمودار شما می‌توانید با کلیک روی View data about indexed page تمامی صفحات ایندکس شده را مشاهده کنید:

بخش indexed در گزارش pages سرچ کنسول

بخش Not Indexed (بخش Errors و Excluded سابق)

این بخش نشان‌دهندۀ صفحات ایندکس نشده است. این ایندکس نشدن هم می‌تواند به خاطر مشکل خاصی باشد و هم ممکن است که ایندکس نشدنش درست و از قصد باشد. یعنی صفحاتی که نیاز به ایندکس شدن ندارند مانند صفحه سبد خرید یا صفحه پرداخت. اما برای صفحات مختلف، خطاهای مختلفی نیز می‌تواند در این گزارش ثبت شود. در زیر نمودار گزارش Pages و در بخش Why pages aren’t indexed شما می‌توانید این دلایل را ببینید و همچنین مشاهده کنید که منبع خطا از کجاست و چه تعداد صفحه، آن مشکل را دارند:

خطاهای Coverage سرچ کنسول

انواع خطاهای Not Indexed کدامند و چگونه باید آن‎‌ها را رفع کنیم؟

خطاهایی که در این گزارش ثبت می‌شوند بسیار متنوع‌اند. در ادامه به انواع خطاهای Coverage سرچ کنسول و منبعشان اشاره می‌کنم:

Server error (5xx)

همانطور که از نامش پیداست، این خطا مربوط به سرور است مانند خطای 502 Bad Gateway یا 503 Service Unavailable. باید به این خطا توجه ویژه‌ای داشته باشید چون گوگل‌بات با دریافت این خطا نمی‌تواند به خاطر مشکل سرور صفحات شما را ایندکس کند. برای رفع آن باید با مدیریت هاست خود در ارتباط باشید تا ببینید که مشکل از هاست است یا از سایت شما.

Redirect error

ریدایرکت‌ها کاربران و گوگل‌بات را از یک آدرس قدیم به یک آدرس جدید می‌فرستند. در واقع زمانی از آن استفاده می‌شود که آدرس صفحه تغییر کرده باشد یا اینکه محتوای آن دیگر وجود نداشته باشد. این خطا به خاطر مشکلات زیر ایجاد می‌شود:

  • زنجیرۀ ریدایرکت بسیار طولانی شده است (به دلیل وجود ریدایرکت‌های پشت سر هم).
  • ایجاد حلقه ریدایرکت
  • پیدا شدن یک آدرس خالی یا غلط در زنجیره ریدایرکت

برای رفع این خطا باید آدرس مورد نظر را پیدا کنید و زنجیر هریدایرکت را اصلاح کنید.

Submitted URL blocked by robots.txt

برخی از آدرس‌هایی که در نقشۀ سایت ثبت شده اند توسط فایل robot.txt مسدود شده‌اند. Robot.txt فایلی‌ شامل دستورالعمل نحوۀ خزش سایت توسط ربات‌هاست. اگر URL مورد نظر باید ایندکس شود لازم است سراغ فایل robots.txt بروید و مشکل آن را رفع کنید.

بخش‌های مختلف pages سرچ کنسول

Submitted URL marked ‘noindex’

این خطا صفحاتی را نشان می‌دهد که برای ایندکس شدن در سایت مپ ثبت شده‌اند اما دارای تگ noindex هستند. برای رفع این مشکل یا باید تگ noindex را از صفحات مورد نظر بردارید تا ایندکس شوند و یا آنها را از سایت مپ حذف کنید. اگر نمی دانید noindex چیست کافی است مقاله جت سئو را در مورد آن مطالعه کنید.

Submitted URL seems to be a Soft 404

خطای soft 404 زمانی ایجاد می شود که یک صفحه کد وضعیت 200 را برگرداند اما گوگل با آن مثل صفحه 404 (حذف شده) برخورد کند. دلیل این موضوع می تواند ریدایرکت شدن صفحه مورد نظر به یک صفحه نامربوط و یا عدم وجود محتوای کافی در آن باشد.

Submitted URL returns unauthorized request (401)

خطای 401 Unauthorized به معنای درخواستی‌ست که نمی‌تواند تکمیل شود چون نیاز به لاگین شدن با ID و پسورد دارد. گوگل‌بات‌ها صفحاتی که دارای فرم لاگین هستند را نمی‌توانند ایندکس کنند. اگر دوست دارید که این صفحات ایندکس شوند، باید این لاگین شدن را حذف کنید.

Submitted URL not found (404)

این خطا نمایانگر درخواستی برای یک صفحه است که وجود ندارد چون ممکن است تغییر کرده باشد یا حذف شده باشد. این صفحات در هر سایتی وجود دارند و تعداد کم آن‌ها ضرری به شما نمی‌زنند اما اگر کاربری با تعداد بالایی از این صفحات روبرو شود ممکن است تجربۀ کاربری بدی برای او در پی داشته باشد. برای رفع این مشکل باید سراغ تمام این آدرس‌ها که این خطا را دارند بروید و آنهارا ریدایرکت کنید و یا کد وضعیت آنها را به 410 تغییر دهید.

Submitted URL returned 403

کد وضعیت 403 Forbidden به این معناست که سرور درخواست را می‌فهمد اما از انجام آن سرباز می‌زند. شما می‌توانید برای رفع این خطا دسترسی را برای بازدیدکنندگان ناشناس مانند گوگل‌بات باز کنید یا اینکه اگر این کار برایتان ممکن نیست آن را از سایت‌مپ حذف کنید.

Submitted URL blocked due to other 4xx issue

اگر URL شما به هر دلیلی غیر از خطاهای قبلی ایندکس نشده باشد، این خطا ظاهر می‌شود که معمولا به مشکلات از طرف کاربر اشاره می‌کند.

Duplicate without user-selected canonical

یعنی چندین نسخۀ تکراری از این صفحه وجود دارد و هیچ نسخۀ کنونیکالی برای آن وجود ندارد. به عبارت دیگر یعنی گوگل نمی‌تواند آدرسی را با تگ کنونیکال پیدا کند.


برای آنالیز بهتر صفحات سایت خود و رقبا ابزارهای دیگری نیز در اختیار دارید که در جت سئو آموزش این موارد هم به اشتراک گذاشته ایم: 

آموزش kwfinder

آموزش moz

آموزش اسکریمینگ فراگ

آموزش semrush

جمع‌بندی

این تمام خطاهایی بود که ممکن است شما با آن‌ها در گزارش Pages سرچ کنسول روبرو شوید. در انتها نکته‌ای که باید در نظر داشته باشید این است که بسیاری از خطاهایی که در نسخۀ قبلی این گزارش نمایش داده می‌شدند در این نسخۀ جدید با یکدیگر ادغام شدند. چون گروه‌های آن‌ها با هم ادغام شده‌ است. از این رو شما ممکن است در بخش Not Indexed بعد از این آپدیت ببینید که تعداد آدرس‌ها زیاد شده است. اما نگران نباشید. این افزایش تعداد به خاطر آپدیت و ادغام شدن گروه‌هاست و مشکلی سایت شما را تهدید نمی‌کند.

پیشنهاد می کنیم برای آنالیز سایت خود از ابزار جت سئو استفاده کنید. همچنین با نصب افزونه سئو گوگل کروم می توانید آنالیز هر صفحه را در سریعترین زمان ممکن انجام دهید. اگر هم به دنبال اطلاع از رنکینگ سایت خود بین سایت های ایرانی هستید می توانید به صفحه مربوطه در جت سئو مراجعه کنید.

بیشتر بخوانید :

شکاف کلمات کلیدی

تحقیق کلمه کلیدی

جایگزین الکسا

رتبه کلمه کلیدی

با عضویت در جت سئو گزارش سایت خود را 7 روز رایگان ببینید

بیشتر بخوانید

زنجیرۀ ریدایرکت بسیار طولانی ( ریدایرکت‌های پشت سر هم)./ ایجاد حلقه یا لوپ ریدایرکت/ یافتن یک آدرس خالی یا غلط در زنجیره ریدایرکت

10 نوع خطا در گزارش Not Indexed وجود دارد که شامل:

خطای Server error (5xx)/ خطای Redirect error/ خطای Submitted URL blocked by robots.txt/ خطای Submitted URL marked ‘noindex’/ خطای Submitted URL seems to be a Soft 404/ خطای Submitted URL returns unauthorized request (401)/ خطای Submitted URL not found (404)/ خطای Submitted URL returned 403/ خطای Submitted URL blocked due to other 4xx issue/ خطایDuplicate without user-selected canonical

دیدگاه خود را با ما در میان بگذارید