גרף הידע של גוגל – האם גוגל מנצל את התוכן שלך ומונע מהגולשים להגיע אליך?

זהר עמיהוד

כיצד גרף הידע של גוגל עשוי להשפיע על קידום אתרים? בפוסט הבא זהר עמיהוד מנתח את הדרך החדשה של גוגל לעבר החיפוש הסמנטי באמצעות טכנולוגיה לזיהויי קשרים בין יישויות.

ב-16 למאי, 2012 הכריזה גוגל על שינוי בהצגת תוצאות החיפוש וגם רמזה לנו איך עומד להראות החיפוש בעתיד באמצעות מה שהיא מכנה Google Knowledge Graph. השינוי עדיין בשלבי ניסוי, לא בארה”ב ובטח שלא בישראל נכון לכתיבת שורות אלה, אבל זה עניין של זמן וכרגיל אצלנו בישראל, זה ייקח קצת יותר זמן. סבלנות.

ב- 25 ליולי 2012 הודיעה גוגל על הרחבת הניסוי והוספת תכונות נוספות, כך שעושה רושם שגוגל קיבלה תגובות טובות וממשיכה בניסוי.

בתחילת אוגוסט 2012 הודיעה גוגל על התפתחות נוספת בגרף הידע:

  • שיכלול נוסף למנגנון הצעות החיפוש האוטומטי הכולל מעתה “ערבוב” של תוצאות מתחומים שונים ממש כמו בתוצאות החיפוש האורגניות.
  • לפעמים התשובה הטובה ביותר היא לא תשובה אחת אלא סדרה של תשובות. מעתה, גוגל מציגה סליידר של תשובות המשלבות תמונה + טקסט.
  • אפשרות לשילוב תוצאות הדואר שלך ב- Gmail בדף תוצאות החיפוש SERP. זה עדיין בניסוי (http://g.co/searchtrial) ויש לזה סיכוי, כך לפי אנשי גוגל. במילים אחרות, כאשר אתה מחובר לחשבון Google שלך ומבצע חיפוש, בצד תוצאות החיפוש, גוגל יציג לך גם תוצאות רלוונטיות מתוך תיבת הדואר שלך.
  • גרף הידע גם בטלפונים חכמים וטאבלטים בשילוב עם יכולת זיהוי הקול של גוגל.

איך זה נראה בתוצאות החיפוש?

אם ציפית למצוא Graph במובן ציור של נקודות במערכת צירים x, y המחוברות בקו, נכונה לך אכזבה. מה שיופיע בחלק מהחיפושים בצד שמאל של תוצאות החיפוש (בעברית, היכן שנמצאות התוצאות הממומנות) ובצד שימין לתוצאות החיפוש (באנגלית, היכן שנמצאות מודעות AdWords) הוא יחידת תצוגה חדשה המכילה פרטים על החיפוש.

גרף הידע של גוגל

כפי שהבנת מקריאת המאמר עד כה, בחיפוש באנגלית יחידת המידע תופיע לעיתים ובחיפוש בעברית ייקח עוד זמן עד שנראה משהו, אבל גם תורנו יגיע. מידע נוסף על הפיצ’רים של גרף הידע ניתן לקרוא כאן.

ועכשיו נצלול לסיור מרתק מתחת למכסה המנוע…

כדי להבין מהו Google Knowledge Graph צריך ללכת קצת לאחור בזמן ולבחון את התקדמות החיפוש, כי זהו המשך ישיר והגיוני ויש לו גם צד עסקי.

שלבים בחיפוש לאור השנים

אין לי כוונה לחזור עד שנת 1998 ולספר לכם את כל המהפכות שעבר מנוע החיפוש גוגל ולא את הדרך בה גוגל מציגים תוצאות, אבל יש מספר שלבים שאי-אפשר להתעלם מהם.

בראשית הדרך, מנוע החיפוש של גוגל היה טיפש ולמרות שגוגל מהתחלה טענה שהיא מציגה תוצאות רלוונטיות, בוא נודה על האמת, זה לא בדיוק זה מה שקרה בפועל. צריך לזכור שמהירות התקשורת וגם עוצמת המחשוב של תחילת שנות ה- 2000 לא היו משהו, בלשון המעטה.

מנוע החיפוש גוגל עשה התאמה בין הטקסט שחיפשת לבין הטקסט שמצא באתר והציג דף תוצאות. מראהו של דף התוצאות משתנה לאורך זמן ועכשיו עם Google Knowledge Graph ממשיך להשתנות עם תוספת מעניינת שלא תמיד תופיע, שאני רואה בה סימן לבאות.

אבל הנחיתות הטכנולוגית, של תחילת שנות ה- 2,000 מול היום, לא מנעה מגוגל להכריז בשנת כבר בשנת 2003 על טכנולוגיה בשם LSI או בשמה המלאה Latent Semantic Indexing.

את ההגדרה של LSI שלא כתובה בשפת בני האדם תוכלו לקרוא בויקיפדיה ופה אני אנסה להסביר בשפה קלה ופשוטה במה דברים אמורים.

המשמעות של LSI היא שהמשמעות של המילים משתנה בהתאם לקשר שלהן עם מילים אחרות. כלומר, למשמעות יש קשר לאופן השימוש במילים. מבחינת המחשב, המשמעות של המילים במשפט נקבעת לפי המילים שבקרבתם, כלומר, שאר המילים שבאותו דף אינטרנט.

הנה דוגמה אחת שתבהיר על מה אני מדבר. ניקח את המילה “לצאת” ונרכיב איתה שני משפטים: האחד, “הצרכן של היום לא רוצה לצאת פראייר.” והשני: “האם את מוכנה לצאת איתי הערב?” – אותה מילה “לצאת” עם משמעויות שונות ובטח שלך יש רעיונות נוספים בהקשר של מילה זאת. אז הנה עוד: “לאחר דיווח של מעשה אונס, בחורות מפחדות לצאת לבדן למרכזי הבילוי.”

עכשיו, חשוב שתוכנת מחשב צריכה להסיק מסקנות כפי שמוחך עשה זה הרגע, כי למילה “לצאת” היו המשמעויות הבאות, לפי סדר הופעתן: לצאת במובן להיות, לצאת במובן פגישה, לצאת במובן לעבור ממקום למקום.

כדי ש- LSI יעבוד, צריך לדבר על יישויות והקשרים ועל זה בדיוק אני עומד להסביר עכשיו.

יישויות או במונח האנגלי Entity

זהו מונח של אנשי מחשבים ובעיקר של אלה המתמחים במידע, אבל לא רק. אז מה זאת ישות? אני אתחיל בדוגמה. שולחן הוא יישות. יש לישות הזאת מאפיינים כמו גובה, משקל, צורה, מספר רגליים, חומר וכדומה. שחקן הוא יישות. ליישות הזאת יש מאפיינים כמו הצגות בהן השתתף, מוסדות שבהן למד, מקום מגורים, גיל, פרסים שקיבל וכדומה. עיר היא יישות. ליישות הזאת יש ראש עיר, יש תושבים, יש כבישים, מוסדות, תיאטראות וכדומה.

את המונח יישות נוכל להחיל על האובייקטים הבאים וזוהי רק רשימה חלקית, חלקית ביותר: שחקן, במאי, סרט, תמונה, ארץ, עיר, זמר, להקה, כוכב לכת. גם קבוצת כדורגל היא יישות וגם מכונית היא יישות וכך הלאה וכך הלאה.

אם הייתה לך הרגשה שחלק מהיישות נמצאות אחת בתוך השנייה, אתה צודק. למשל שחקן כדורגל הוא יישות וקבוצת כדורגל היא יישות, התאחדות לכדורגל היא יישות וכך הלאה. זה מביא אותנו לנקודה הבאה שהיישויות לא עומדות בפני עצמן אלא מנהלות קשרים ביניהן.

קשרים Relationships

הקשרים בין היישויות יכולים להיות פשוטים וגם מורכבים. קשר יכול להיות “אב-בן” ויכול להיות קשר “מעסיק-מועסק” ויכול להיות קשר “מכיל-מוכל” ויכול להיות קשר “סיבה-תוצאה” ועוד הרבה סוגי קשרים, לא כולם קשרים של היררכיה אלא גם קשרים רוחביים של “אחד לרבים”, “אחד לאחד” וכדומה.

ופה אנחנו מגיעים למושג Google Knowledge Graph. זהו באמת לא גרף במובן המילולי של המילה, של תרשים במערכת צירים בו מסומנות נקודות. הכוונה במילה גרף Graph היא לתאר בצורה ויזואלית את הקשר בין היישויות השונות, בין אם היישות שחקן, קבוצת כדורגל, עיר או ערך אחר. לצורך הפשטות ניתן לומר שכל ערך באנציקלופדיה הוא יישות, כל ערך בויקיפדיה הוא יישות.

גוגל משתמש בביטוי link graph כדי לתאר את הקשר שבו דפים הקשורים אחד לשני, בין אם אלה קישורים פנימיים בתוך האתר ובין אם אלה קשרים מדף באתר אחד לדף באתר אחר וכל זאת כדי לעזור לקבוע עד כמה הדף הזה רלוונטי ופופולרי בחיפוש.
פייסבוק עושה שימוש ב- social graph כדי להבין איך אנשים מקושרים אחד עם השני:

הגרף החברתי של פייסבוק

לכן הביטוי Knowledge Graph נמצא בסביבה טובה וזאת הדרך של גוגל לתאר את הקשרים בין אנשים, מקומות, ערכים שונים כדי שתוכל להציג אותם בצורה מלאה ובעלת ערך.

אם נשארת לקרוא עד כאן, מגיע לך כל הכבוד ואתה בודאי שואל אז איך זה משפיע על התוכן באתר שלי ועל הקישורים שלי בתוך האתר ומחוצה לו? ובכן, לפני שאענה על השאלה החשובה הזאת אני רוצה לקחת עוד קצת עומק לתוך המנגנון של גוגל.

במהלך השנים עם הגידול בעוצמת המחשוב והיכולת לעבד (ולא לאבד) כמויות גדולות של מידע, החלה גוגל ליישם הקשרים אלה וכך אם גוגל ימצא מאמר בו כתובים הביטויים הבאים: הרמת סינוס, השתלת עצם, טיפולי חניכיים וגם שיקום הפה, הוא יבין שאתה “רופא שיניים” למרות שהמילה רופא לא רשומה במפורש במאמר.

אם אתה רוצה שגוגל יבין שכתבת מאמר על משחק כדורגל כדאי שהמאמר יכיל את המילים הבאות, כולן או מקצתן: שער, קבוצה, שחקנים, שוער, מאמן, קוון, כדור, דשא, יציע, אוהדים, וגם ה”שופט בן …” כי אחרת זה לא יהיה מאמר על משחק כדורגל אלא על משהו אחר, נכון?

גוגל מבין מהמילים וההקשר שלהם במשפט ובעמוד את הנושא גם אם הוא לא רשום במפורש, כלומר הוא משתמע מהכתוב. זה כמו שאתה רואה מישהו עם חכה על שפת האגם ויודע שמדובר בדייג.

גוגל צריכים נתונים

היכולת של גוגל לבנות בסיס ידע הכולל עובדות על היישויות השונות (שחקנים, זמרים, קבוצות כדורגל, כוכבים, אישים, מקומות וכדומה) דורשת הרבה מאוד פיסות מידע קטנות עם הקשרים מתאימים. למשל, גוגל צריך לדעת בוודאות שאת הלהיט “I feel love” שרה דונה סאמר (Donna summer) בשנת 1977 והמפיק האיטלקי שלה היה Giorgio Moroder שהתפרסם כמי ששולט ברזי הסינטיזייר.

בשנת 2003 קנתה גוגל את Applied Semantics כדי שתוכל להניח את ידיה על בסיס נתונים ענק שהתאים בדיוק לעניין. בשנת 2007 הכריזה גוגל על Universal Search ולאחר מכן בשנת 2009 היא הודיעה על מיזם בשם Google Squared שנסגר לפני שנה. בשנת 2010 היא רכשה את חברת Metaweb עם בסיס הנתונים שלה הנקרא Freebase ומאז היא דאגה להגדיל את אוסף היישויות והקשרים ביניהן. על הדרך היא גם פיתחה את Autocomplete Suggestions שמיד ארחיב עליו.

גוגל הוא מנוע החיפוש הגדול בעולם דובר האנגלית, עברית ושפות נוספות אבל לא סינית, עם נתח שוק של 66% בשוק האמריקאי ועם כמעט בלעדיות בישראל, יודע מה אנשים מחפשים ובמידע הזה הוא נעזר.

אם חשקה נפשך ב- “מיטה זוגית” לך ולזוגתך ואתה מתחיל להקליד את הביטוי “מיטה זוגית” במנוע החיפוש גוגל, זה מה שתראה, או זה מה שבערך תראה:

חיפוש בגוגל

מנגנון ההשלמה האוטומטית Autocomplete Suggestion של גוגל המבוסס על החיפושים השכיחים מציג לך, הגולש המחפש, ביטויים נוספים הקשורים למה שכבר התחלת להקליד וחושף בפניך אפשרויות אחרות שאולי לא חשבת עליהן כלל. האם חשבת לחפש “מיטה זוגית עם ארגז מצעים” לפני שהתחלת להקליד? כנראה לא. ופה גוגל חשף בפניך אפשרות שלא חשבת עליה ואם התכוונת לחפש “מיטה זוגית” וללחוץ אנטר, הרי שסביר להניח שתבחר אפשרות אחרת ממה שהציע לך גוגל עם יותר מילים ולזה אנחנו קוראים “זנב ארוך”. חשוב שתבין כי יש לזה משמעות לקידום האתר שלך, כי ההשלמה האוטומטית מאפשרת למחפשים בגוגל למטב ולמקד את החיפוש.

מנגנון ההשלמה האוטומטית של גוגל פשוט מבחינה זו שהוא משלים את מה שהתחלת להקליד. אם תתחיל להקליד “פרס נובל”, תראה אפשרויות כמו “פרס נובל בפיזיקה” אבל לא תראה “טקס הענקת פרס נובל” למרות שהביטוי “פרס נובל” נמצא בביטוי. באנגלית זה אחרת כי אם תתחיל להקליד nobel prize המילה ceremony באנגלית באה אחרי nobel prize כך שהאפשרות nobel prize ceremony מוצגת.

אז מה עכשיו Google Knowledge Graph מציגה?

יחידת התצוגה שמופיע בצד תוצאות החיפוש תכיל מידע שונה בהתאם לאובייקט/יישות שהוא נושא החיפוש. יחידת תצוגה לשם של שחקן קולנוע לא תהיה דומה ליחידת תצוגה שתופיע לחיפוש אחר שמו של ציור מפורסם או של בנין מפורסם.

סוגי מידע בגרף של גוגל

מנועי החיפוש ובראשם גוגל עשו דרך ארוכה מלתת תשובות ישירות לשאילתות החיפוש כי במהלך השנים הם הבינו יותר ויותר את כוונת החיפוש. מנועי החיפוש נעשו “חכמים” יותר וזה מתחיל בדברים הקטנים: אם תכתוב בגוגל “דולר”, גוגל יציג לך בראש התוצאות את שער הדולר במדינה שלך מול המטבע המקומי הכי מעודכן שיש בידו. אם תכתוב “מלון בתל אביב” גוגל יבין שאתה רוצה תוצאות מקומיות ולכן יציג בפניך מפה ועליה מסומנים המלונות בעיר תל אביב, ומעכשיו אם תכתוב “אנדרומדה” גוגל יפרוש בפניך אפשרויות נוספות: סרט, סדרת טלויזיה, גלקסיה, להקת רוק, מסעדה ואם תכתוב 2+2 גוגל יחשב עבורך את התוצאה כאילו היה מחשבון ולא מנוע חיפוש.

גוגל מספח לעצמו שטחים שאינם תוצאות חיפוש קלאסיות. ראה למשל את גוגל מקומות (Places) שהוא התשובה של גוגל לדפי זהב למיניהם. את כל המידע תקבל בגוגל.

גוגל התחילה להשתלט גם על תחום הטיסות. אם אתה מחפש טיסות בתוך ארה”ב למשל בין Orlando ל- NYC זה מה שתראה: גוגל התחילו למכור כרטיסי טיסה (בכוונה סימנתי בקו אדום מקווקו את גוגל כדי להראות לך שהתוצאות הגיעו משם):

טיסות בגוגל

ומה שקורה עכשיו זה שגוגל נותנים שירות כמו ויקיפדיה. חפש ערך וגוגל כבר יציג לך את המידע שאפילו לא ידעת והכול מבלי שתלחץ בעכבר ומבלי שתעזוב את הסביבה הבטוחה של גוגל.

איך אנחנו כבעלי אתרים צריכים לנהוג עכשיו?

עכשיו אנחנו מבינים שגוגל “מבין” הרבה יותר טוב את מה שאנחנו כותבים באתר שלנו ו/או מחוצה לו.

נציג גוגל, עמית סינגל, טוען שבעלי אתרים אינם צריכים לעשות משהו מיוחד באתר כדי שפיסת מידע ממנו תיכלל ביחידת התצוגה של Google Knowledge Graph אבל אני ממליץ להתחיל לעשות שימוש ב- Schema.org – זהו תקן של סימון פיסות מידע בתוכן שהינך מפרסם כדי שגוגל ידע בוודאות את הכוונה. הסימון של סכמה מיושם מאחורי הקלעים ברמת HTML כך שכלפי הגולש אין שינוי, אבל כשגוגל קורא את תוכן הדף הוא הרבה יותר מבין שזה אירוע, ספר, שחקן, סרט וכדומה.

האם ל- Google Knowledge Graph תהיה השפעה על מיקום האתר שלך בתוצאות החיפוש?

Google Knowledge Graph נועד לתת מידע במקום בו ביטוי החיפוש “רחב מידי”. לדוגמה משתמש המחפש את הביטוי “יוגה” מה הוא בדיוק מחפש? הנה רשימה של אפשרויות: היסטוריה של יוגה, תרגילי יוגה, מדריכת יוגה, מכון יוגה, מכשירי יוגה, חוג יוגה והרשימה נמשכת. בחיפוש רחב שכזה, יחידת התצוגה של Google Knowledge Graph תיתן למחפש מידע נוסף שיקדם אותו בחיפוש וזאת בנוסף למידע אליו הוא נחשף באמצעות מנגנון ההשלמה האוטומטית של תיבת החיפוש.

אם המשתמש חיפש ביטוי יותר ממוקד כגון “מכון יוגה ברמת גן”, כוונתו ברורה וכבר אין מקום ליחידת התצוגה שתציג לו את הערך “יוגה” כי הוא מחפש משהו מאד ממוקד “מכון יוגה ברמת גן” ואין לא ענין כרגע בעובדות על יוגה, שכשלעצמן יכולות להיות מאוד מעניינות, אבל לא יקדמו אותו במציאת המכון ברמת גן.

ניקח דוגמה נוספת. הגולש מחפש את “דונה סמאר”, הזמרת שנפטרה. זהו חיפוש רחב ומכיון שכך, כוונת החיפוש אינה ברורה. האם לך ברור מה הגולש מחפש? אולי הוא מחפש את מועד ההלוויה? אולי הגולש רוצה לקרוא את ההיסטוריה של מלכת הדיסקו? או לדעת עליה פרטים כמו גיל, מקום מגורים, תקליטים שהקליטה, סרטים בהם הופיעה, פרסים אותם קיבלה, איך קוראים לאחיותיה ואיך קוראים לבנותיה ועוד. במקרה זה יחידת התצוגה מאוד תעזור. אבל אם הגולש הקליד Donna summer love to love you baby הוא קודם כל יודע מה הוא מחפש. love to love you baby היה אחד הלהיטים שאורכו 16 דקות בהן דונה גונחת. השיר הוביל לשרשרת להיטים כמו: bad girls, hot stuff, on the radio ואיך אפשר בלי enough is enough ו- last dance מתוך הסרט Thank God It’s Friday שהיה אבן דרך בחייה של הזמרת. כאן הצורך ביחידת תצוגה קטן אם בכלל.

אני מניח שתוצאות החיפוש ישתנו משהו לגבי אתרים עם ביטויי חיפוש “קצרים” של מילה אחת או שתיים, בעוד שלגבי ביטויי זנב ארוך: ביטויים עם 3, 4 ואפילו 5 מילים ויותר, התוצאות לא יושפעו בכלל ולכן למקדמי האתרים שקוראים את המאמר אפשר לומר: “כרגע, זה שינוי שהכי פחות מעניין אתכם”.

האם ל- Google Knowledge Graph תהיה השפעה על פרסום ממומן?

בהנחה שיחידת התצוגה של Google Knowledge Graph תופיע לביטויי חיפוש רחבים (יוגה, דונה סמאר) נראה לי שלא תהיה פגיעה בקידום הממומן ואני אסביר.

נניח ואני בעל עסק שמדפיס חולצות טי-שרט עם הדפס של דונה סמאר. מה הסיכוי שלקוח שמחפש “דונה סמאר” יקנה חולצה עם הדפס של דונה סמאר לעומת גולש שחיפש “חולצת דונה סמאר” או ביטוי אחר הכיל את המילה חולצה יחד עם דונה סמאר? ברור שהאפשרות השנייה סבירה הרבה יותר.

תמיד יאמר מישהו כן, יש סיכוי שמי שחיפש “דונה סמאר” יקנה חולצה, אבל הסיכוי הזה קטן, והייתי מסתכן ואומר: קטן מאוד. ולכן, בחיפוש “זנב ארוך” (בחיפוש הכולל 2, 3 ויותר מילים) יחידת התצוגה לא תופיע ותשאיר מספיק מקום לתוצאות ממומנות.

אז מה טומן בחובו עתיד החיפוש?

גוגל עושים צעדים גדולים וברורים לעבר חיפוש סמנטי (Semantic Search) בו הם מזהים לא רק פיסות מידע אלא גם הקשרים בעלי משמעות. בהתחלה גוגל יספקו לנו בעיקר עובדות על יישויות (ערכים) כמו סופר, אמן, שחקן, קבוצת כדורגל, עיר. אבל לא ירחק וגוגל יוכלו לנתח הקשרים בין יחידות מידע גדולות יותר כמו דפים הקשורים לאותו נושא ובכך להשפיע על תוצאות החיפוש המוצגות בפני הגולש וכל זאת לטובת הגולשים. נקבל יותר תוצאות רלוונטיות כתשובה לחיפושים שלנו. כבעלי אתרים המייצרים תכנים לאתר, גוגל ידע להעריך יותר טוב תוכן איכותי ואת זה נראה בשיפור מיקומים של האתר שלנו בתוצאות החיפוש.

גם היום גוגל יודע להציג את הדפים הקשורים לנושא מסויים, בעיקר בגלל שהטקסט מופיע באותם דפים, אבל הבנתו של גוגל תעמיק והוא יוכל לזהות הקשרים הרבה יותר מסובכים ולנחש הרבה יותר טוב את כוונת החיפוש שלנו גם אם לא ציינו זאת במפורש.

בעלי אתרים צריכים לוודא שהתוכן באתר שלהם הוא בעל ערך לגולש וגם שיש בו ערך המוסף לגולש המקבל תשובה ישירה לבעייתו ויותר. גוגל מחפש את אותם אתרים הנותנים “אקסטרה” ללקוחות שלהם ולכן יטה להציג אותם בעמוד התוצאות הראשון.

“זהו צעד קטן” אמר עמית סינגל, מנהל חטיבת החיפוש של גוגל.

כיצד לדעתכם גרף הידע של גוגל עשוי להשפיע על מקדמי האתרים?

שיתוף ב facebook
שיתוף ב linkedin
שיתוף ב whatsapp
שיתוף ב email
נכתב על ידי
זהר עמיהוד עוזר לעסקים להיות ראשונים בגוגל. בעל תואר שני במינהל עסקים מטעם אוניברסיטת תל אביב עם ידע וניסיון רב בשיווק כי כדי לקדם אתרים צריך להבין בעסקים.
0 0 הצבעה
קלות השימוש
0 0 הצבעה
פיצ'רים ופונקציונליות
0 0 הצבעה
תמיכה טכנית
0 0 הצבעה
תמורה לכסף
הרשמו
הודע על
guest
95 תגובות
הישן ביותר
החדש ביותר בעלת הכי הרבה הצבעות
פידבקים מוטבעים
צפייה בכל התגובות
שיתוף ב facebook
שיתוף ב linkedin
שיתוף ב whatsapp
שיתוף ב email

תוכן עניינים

95
0
נשמח לשמוע את דעתך, נודה לתגובהx
()
x