חיפוש

מה זה תקציב זחילה (Crawl Budget) בהקשר של SEO

תקציב זחילה (Crawl Budget) הוא מספר העמודים שהבוט של גוגל סורק ומאנדקס באתר שלכם בפרק זמן נתון. אם עמוד לא נסרק, הוא לא יופיע בתוצאות החיפוש.

רוב האתרים לא צריכים לדאוג מתקציב זחילה. אם העמודים שלכם מאונדקסים באותו יום שפרסמתם אותם, הכל תקין. לפי התיעוד הרשמי של גוגל, אופטימיזציית תקציב זחילה רלוונטית בעיקר לאתרים גדולים (מיליון+ עמודים עם שינויים שבועיים) או אתרים בינוניים (10,000+ עמודים עם שינויים יומיים).

עם זאת, הבנת אופן פעולת תקציב הזחילה עוזרת להימנע מטעויות נפוצות שמבזבזות משאבי זחילה, במיוחד באתרים שמייצרים כתובות URL רבות באופן דינמי (למשל ניווט עם סינון, פרמטרים ב-URL).

מגבלת תדירות הזחילה – Crawl Rate Limit

מגבלת תדירות הזחילה מגדירה את מספר החיבורים המקביליים שבהם Googlebot משתמש לסריקת האתר שלכם, ואת ההשהייה בין הבקשות. מגבלה זו קיימת כדי למנוע מהסורק להעמיס על השרת ולפגוע בחוויית המשתמש.

תדירות הזחילה יכולה להשתנות עם הזמן ומושפעת משני גורמים עיקריים:

  • Crawl Health – אם האתר שלכם מגיב מהר בזמן מסוים ההגבלה תהיה קטנה יותר, כלומר יתבצעו יותר חיבורים מקביליים עבור הזחילה.
  • הגבלת תקציב הזחילה ב Google Search Console – בעלי אתרים יכולים להגביל או להקטין את תדירות הזחילה של Googlebot באמצעות קונסולת החיפוש של גוגל (Google Search Console).

נחיצות הזחילה – Crawl Demand

גם אם מגבלת התדירות לא הגיעה לתקרה, Googlebot לא יסרוק הרבה אם אין צורך בזחילה. שני הגורמים העיקריים שמשפיעים על נחיצות הזחילה הם:

  • פופולריות – כתובות URL או דומיינים יותר פופולריים ברשת האינטרנט נוטים להסרק על ידי גוגל בתדירות גבוהה יותר.
  • Staleness | עיפוש – המערכות של גוגל מנסות למנוע מצב בו כתובות URL כבר אינן רלוונטיות באינדקס.

אירועים רחבים יותר, כגון מעבר לדומיין חדש, יכולים גם הם לגרור עלייה בנחיצות הזחילה כש-Google מאנדקס מחדש את הכתובות החדשות.

שילוב מגבלת התדירות עם נחיצות הזחילה נותן לנו את תקציב הזחילה – מספר כתובות ה-URL שהבוט של גוגל יכול ומעוניין לסרוק באתר שלכם.

גורמים המשפיעים על תקציב הזחילה

כתובות URL בעלות ערך נמוך מבזבזות תקציב זחילה שיכול להיות מושקע בעמודים עם תוכן אמיתי. הנה הגורמים הנפוצים ביותר, לפי רמת ההשפעה:

  • תפריטי סינון או חיפוש (Faceted navigation) – למשל סינון לפי צבע או מחיר בחנויות דיגיטליות יכולות לעזור למשתמשים אך יוצרות המון קומביניציות של כתובות URL. אלו כוללות גם Session Identifiers ופרמטרים שונים בכתובת ה URL.
  • תוכן משוכפל (תוכן כפול) הקיים באתר שלכם.
  • שגיאות Soft 404s – שגיאות המתקבלות כאשר השרת מחזיר 200 כ HTTP Response Code עבור עמודים שאינם קיימים במקום להחזיר שגיאת 404. עמודים אלו יכולים להפריע לזחילה מכיוון שכתובות אלו יסרקו במקום כתובות עם תוכן ייחודי הקיים באתר שלכם.
  • תוכן בעל ערך נמוך ותוכן ספאם.
  • ניווט אינסופי – מצבים בהם קיים ניווט אינסופי יגרום לבזבוז תקציב הזחילה. למשל מצב של עימוד ממוספר שאינו מסתיים, קישורים ביומן כלשהו המאפשרים לדפדפף בין חודשים ושנים בצורה בלתי מוגבלת יהוו בעיה עבור תקציב הזחילה באתר שלכם.
  • הפניות – כל פעם שעמוד באתר שלכם מבצע הפנייה, הוא משתמש בחלק קטן מתקציב הזחילה. הגבילו את מספר ההפניות בכדי להמנע מבזבוז זה.

טיפול בבעיות אלו משחרר תקציב זחילה עבור עמודים בעלי ערך אמיתי, מה שמוביל לזחילה יעילה יותר ואינדוקס מהיר יותר של תוכן חשוב.

טיפ! ייתכן ותרצו לבקש ממנועי חיפוש לא לאנדקס את עמודי תוצאות החיפוש באתר שלכם בשביל לחסוך בתקציב זחילה.

השפעת מהירות האתר על תקציב זחילה

שאלות נפוצות

שאלות נפוצות על תקציב זחילה:

האם מהירות האתר משפיעה על תקציב הזחילה?
כן. אתר מהיר מאותת ל-Googlebot ששרתים בריאים, ומאפשר לו לפתוח יותר חיבורים מקביליים ולסרוק יותר תוכן. לעומת זאת, timeouts או שגיאות 5xx תכופות מאטות את הזחילה באופן משמעותי.
האם תקציב הזחילה משפיע על הדירוג?
תדירות הזחילה אינה מובילה ישירות למיקומים גבוהים יותר. גוגל משתמשת בסיגנלים רבים כדי לדרג תוכן. זחילה חיונית כדי שהעמודים שלכם יופיעו בתוצאות החיפוש, אך היא אינה גורם דירוג בפני עצמו.
האם כתובות URL אלטרנטיביות נחשבות כחלק מתקציב הזחילה?
כל כתובת URL ש-Googlebot סורק נספרת כחלק מתקציב הזחילה, כולל כתובות אלטרנטיביות כגון AMP או hreflang באתרים מרובי שפות. גם משאבים מוטמעים כמו CSS, JavaScript וקריאות Ajax צורכים משאבי זחילה.
האם ההנחיה NoFollow משפיעה על תקציב הזחילה?
לפי גוגל, זה תלוי. כל URL שנסרק משפיע על תקציב הזחילה. כתובת המסומנת כ-NoFollow עדיין יכולה להיסרק אם קישורים אחרים מפנים אליה. אולם, אם כתובות NoFollow רבות אינן מאונדקסות באופן עקבי, Googlebot עשוי להתאים ולהפחית את הזחילה שלהן עם הזמן.
איך אפשר לבצע אופטימיזציה לתקציב הזחילה?
התחילו בתיקון בעיות נפוצות: הסירו תוכן כפול, תקנו שגיאות soft 404 וחסלו ניווט אינסופי. לאחר מכן התמקדו בכך שהעמודים החשובים ביותר יהיו קלים לגילוי באמצעות קישור פנימי תקין ומפת אתר XML מעודכנת. אופטימיזציית תקציב זחילה משפיעה ביותר על אתרים גדולים עם מבנים מורכבים.

סיכום

תקציב זחילה קובע כמה עמודים Googlebot סורק באתר שלכם בפרק זמן נתון. הוא מעוצב על ידי מגבלת התדירות (בריאות השרת, משאבי גוגל) ונחיצות הזחילה (פופולריות העמודים, רעננות התוכן).

עבור רוב האתרים הקטנים עד הבינוניים, תקציב זחילה אינו מקור לדאגה. עבור אתרים גדולים, צמצום כתובות URL בעלות ערך נמוך, תיקון שגיאות ושמירה על קישור פנימי נקי הם הדרכים היעילות ביותר להבטיח שעמודים חשובים נסרקים ומאונדקסים.

דיון ותגובות
0 תגובות  ]

השאירו תגובה

הוסיפו קוד באמצעות הכפתורים מטה. למשל, בכדי להוסיף PHP לחצו על הכפתור PHP והוסיפו את הקוד בתוך השורטקוד. מצאתם שגיאה בפוסט? עדכנו אותנו...

Savvy WordPress Development official logo