تگ نو ایندکس (noindex) همان طور که از نامش پیداست، برای ایندکس نشدن صفحات وب استفاده میشود. اما چرا باید بخواهیم برخی از صفحات سایتمان در صفحه نتایج جستجو ایندکس نشوند و چگونه میتوان این کار را انجام داد؟ اینها سؤالاتی است که در این مطلب به آن پرداختهایم.
تفاوت no index و disallow
دستور دیگری تقریباً مشابه دستور نو ایندکس وجود دارد با عنوان Disallow. اما تفاوت اینجاست که با دستور disallow به خزندهها میگویید «صفحه مورد نظر را نخزند و اطلاعات آن را نخوانند». این در حالی است که با دستور no index به خزندهها اجازه خزیدن صفحه داده میشود؛ اما از آنها میخواهیم که «اطلاعات صفحه را در فهرست نتایج گوگل نشان ندهند یا به عبارت دیگر آن را ایندکس نکنند».
نحوه استفاده از تگ noindex
همان طور که گفته شد، روشهای مختلفی وجود دارد برای اینکه به خزندههای موتورهای جستجو بگوییم صفحه یا صفحات مشخصی از سایتمان را ایندکس نکرده و آن را در صفحه نتایج موتورهای جستجو نشان ندهند. سادهترین و مؤثرترین این روشها استفاده از تگ noindex است.
این تگ به موتورهای جستجو میگوید که میتوانند صفحه را بخزند (crawl کنند) اما نباید محتوای آن را در صفحه نتایج جستجو (SERP) نمایش دهند.
برای این منظور باید یک برچسب در بخش «HEAD» HTML یا در هدرهای response اضافه کنید. برای دیدن اطلاعات سایت توسط موتورهای جستجو، این صفحه نباید در فایل robots.txt مسدود شده باشد (disallowed شده باشد).
اگر این صفحه از طریق پرونده robots.txt مسدود شده باشد، گوگل هرگز برچسب noindex را نمیبیند و ممکن است صفحه همچنان در نتایج جستجو ظاهر شود. برای اینکه به موتورهای جستجو بگویید صفحه شما را ایندکس نکنند، فقط موارد زیر را به بخش <head/> اضافه کنید:
<meta name=”robots” content=”noindex, follow”>
همان طور که میدانید، برای اینکه یک صفحه وب در صفحه نتایج موتورهای جستجو ظاهر شود، ابتدا باید توسط اسپایدرها یا همان رباتهای موتور جستجو ایندکس شود. دلایل متعددی میتواند باعث شود متخصصان سئو از تگ noindex استفاده کنند یا به عبارتی از موتورهای جستجو بخواهند صفحهای را ایندکس نکنند. معمولترین دلیل، جلوگیری از بروز خطای duplicate content یا محتوای تکراری است. وقتی بیش از یک نسخه از یک صفحه توسط موتورهای جستجو ایندکس شود (مثلاً نسخه قابل پرینت صفحه هم ایندکس شود) باعث ایجاد محتوای تکراری در سایت شده که در نتیجه آن، صفحه مذکور با افت رتبه مواجه خواهد شد. البته دلایل دیگری نیز برای عدم تمایل وبمستران به ایندکس شدن صفحات وب وجود دارد که از آن جمله می وان به موارد زیر اشاره کرد: بعضی صفحات وب هیچ سودی برای ایندکس شدن ندارند. این صفحات اطلاعات مفیدی برای کاربران به همراه نداشته و اصولاً کلیدواژه خاصی نیز ندارند. مثل صفحه «تشکر» که بعد از خرید یا دانلود نمایش داده میشود. هدف از طراحی این نوع صفحات صرفاً برقراری ارتباط دوستانه با کاربران و بازدیدکنندگان سایت است، نه کسب رتبه. ایندکس شدن این صفحات، به دلیل محتوای غیرمفید و سطحی باعث افت رتبه کلی سایت خواهد شد. دستور دیگری تقریباً مشابه دستور نو ایندکس وجود دارد با عنوان Disallow. اما تفاوت اینجاست که با دستور disallow به خزندهها میگویید «صفحه مورد نظر را نخزند و اطلاعات آن را نخوانند». این در حالی است که با دستور noindex به خزندهها اجازه خزیدن صفحه داده میشود؛ اما از آنها میخواهیم که «اطلاعات صفحه را در فهرست نتایج گوگل نشان ندهند یا به عبارت دیگر آن را ایندکس نکنند». جلو گیری از ایندکس شدن سایت توسط موتورهای جستجو گوگل، روشهای گوناگونی دارد. یکی از روشهای noindex کردن صفحات، استفاده از متاتگ robots در صفحاتی است که نمیخواهید ایندکس شوند. <meta name="robots" content="noindex > خیلی مهم است که متا تگ robots را با تگ x-robots اشتباه نگیرید. چراکه تگ x-robots کل سایت را نو ایندکس میکند و در نتیجه آن کل سایت شما از صفحات نتایج گوگل (SERP) محو خواهد شد. فایل robots.txt نوعی فایل متنی حاوی نقشه سایت و یک سری دستورات برای خزندهها است. وقتی خزندهها به یک سایت میرسند، ابتدا این فایل را چک کرده و بر اساس مقررات آن عمل میکنند. Noindex: /robots-txt-noindexed-page/ مشکل استفاده از فایل robots.txt برای نو ایندکس کردن صفحات این است که گوگل اعلام کرده الزامی برای استفاده از این فایل برای خود نمیبیند. بنابراین ممکن است با اینکه ایندکس شدن صفحهای را در این فایل ممنوع اعلام کنید، خزندههای گوگل بیتوجه به دستور، آن صفحه را در فهرست نتایج نمایش دهند.
نو ایندکس noindex به چه معناست؟
در واقع وقتی ما کلیدواژهای را در گوگل جستجو میکنیم، گوگل در میان صفحات ایندکس شده خود به دنبال آن میگردد. صفحاتی که اسپایدرهایش قبلاً آن را خزیدهاند.
نو ایندکس دستوری است برای خزندهها که به آنها دستور میدهد یک یا چند صفحه مشخص از سایت را ایندکس نکنند.
این دستورالعمل اغلب به صورت یک متا تگ به کد منبع HTML صفحه وب اضافه میشود. البته روشهای متنوعی برای no index کردن یک صفحه وب وجود دارد که در ادامه به آنها خواهیم پرداخت.
کاربرد تگ noindex در سئو چیست؟
noindex و disallow چه تفاوتی با هم دارند؟
چگونه از ایندکس شدن صفحه جلوگیری کنیم؟
برای این منظور کد زیر را در HTML تمام صفحاتی که نباید ایندکس شوند اضافه کنید:
تفاوت متا تگ robots و تگ x-robots در چیست؟
اگر برچسب X-Robots را به شکل X-Robots-Tag: “noindex” در هدر HTTP استفاده کنید، این اتفاق خواهد افتاد.
چگونه از تگ noindex در فایل robots.txt استفاده کنیم؟
شما میتوانید با قرار دادن دستور نو ایندکس در فایل robots.txt صفحاتی که نباید ایندکس شوند را به اطلاع خزندهها برسانید.
مزیت استفاده از فایل robots.txt این است که به وسیله آن میتوانید علاوه بر ممنوع کردن یک صفحه از ایندکس شدن، یک دایرکتوری کامل، یک تصویر یا فایل را به حالت نو ایندکس دربیاورید.
کافی است در این فایل دستور no index را نوشته و سپس آن را در گوگل کنسول ثبت کنید. در زیر یک نمونه دستور نو ایندکس را مشاهده میکنید:
جمع بندی
با اینکه همواره هدف ما از تولید محتوا و ایجاد صفحات وب، دیده شدن در صفحه نتایج جستجوی گوگل و سایر موتورهای جستجو است، گاهی به دلایلی که اکثر آنها به سئو سایت و کسب رتبه بهتر برمیگردد ترجیح میدهیم صفحات بیارزش یا تکراری سایتمان در جستجوهای کاربران نمایش داده نشود. به این منظور روشهای مختلفی پیش پای شما وبمستران قرار دارد که در این مطلب به آنها پرداخته شد.
از میان سه روش نام برده شده، متاتگ robots و تگ نو ایندکس مناسبتر بوده و به هدف ما از noindexing نزدیکترند.
شما می توانید با عضویت رایگان در جت سئو از امکانات خوب این ابزار ایرانی تحلیل سایت بهره مند شوید و به صورت کاملا رایگان مشکلات سئو سایت خود را با جت سئو بررسی کنید!
ممنون بابت آموزش
خوشحالیم که مطلب ما در مورد تگ نوایندکس برای شما مفید واقع شده و ممنون از همراهی شما