2006 אפריל | designer.co.il

designer.co.il - אייל שחר מול המכונה

חפש לפי נושאים
28 אפריל 2006
13

המלך עירום – אלגוריתם החיפוש

(אם לא קראת – מבוא לסדרה "המלך עירום – Google והאכזבה")

 

אם יש דבר אחד שכולם יודעים לגבי Google הוא שאין להתווכח על איכות תוצאות החיפוש. הילה אופפת את "הנוסחה הסודית" של אלגוריתם החיפוש, בדומה לסיפורי האגדה על יודעי הסוד של קוקה-קולה.
אני שואל – מתי בפעם האחרונה חיפשת במנוע חיפוש אחר? האם האלגוריתם טוב כמו שנדמה לך?

 

כמו שכבר כתבתי בעבר, אני חושב שההצלחה הראשונית של גוגל לא נובעת בהכרח מאיכות התוצאות, אלא יותר מהממשק הפשוט והנקי של עמוד הכניסה ושל תוצאות החיפוש. מאז ימי ההצלחה הראשונית - שנדמה כאילו היתה לפני עידנים – גוגל הפכו לברירת המחדל של מנועי החיפוש. אף אחד כמעט לא חושב פעמיים לאיזה מנוע לפנות כדי לחפש. ואם בדפדפן שלך יש אפשרות להגדיר את מנוע החיפוש – כולם מגדירים את גוגל.
יתרה מכך – כאשר רובנו מחפשים בגוגל, אנחנו ממשיכים לנבור גם לעמוד חמישי, שישי, ואף הרבה יותר, אם לא מצאנו את מה שחיפשנו. לא חושבים לנסות מנוע חיפוש אחר. ואם לא מוצאים גם אחרי עמוד 20, אומרים "אני לא מצליח למצוא. כנראה שאין", במקום לחשוב "גוגל לא מצליח למצוא. בוא ננסה מישהו אחר".

שתי אמירות עוטפות את אלגוריתם החיפוש בהחלטיות: שהוא הכי אמיתי ומדוייק שיש, ושאי אפשר לבצע בו מניפולציות. אין קוּנצִים (מת על המילה הזאת). אני רוצה להביא כאן שתי דוגמאות, שלא באות בהכרח להגיד שהכל שטויות, אבל לעורר בך ספק לגבי הנחות היסוד:

 

גוגל מוצא הכל – האמנם?

חלקכם בוודאי שמעתם על תוכנת Paint.net. זו תוכנה די חדשה לעיבוד תמונה, בסגנון Photoshop, אשר פותחה באוניברסיטת וושינגטון בחסות מיקרוסופט.
כשחבר שלי שאל לגבי עיבוד תמונה, זרקתי לעברו "חפש paint.net". הכי פשוט.
חיפש (נחשו איפה), וזה מה שמצא. תוצאה אחת בלבד, לחלוטין לא רלוונטית.
מיד הוא הרים אלי טלפון ואמר "אין. לא מוצא". העלבתי אותו כשווידאתי שהוא מאיית נכון, אבל לא. הכל תקין ואין תשובה.
הגעתי הביתה, ובדקתי לבד. צודק. לא מופיע בגוגל! תחפש ב-Yahoo – תמצא. תחפש בוואלה – תמצא. תחפש ב-altavista הישן – תמצא. רק לגוגל לא נשאר. הלך, הלך, הלך… (אגב – גם ב-live.com לא תמצא).

והנה משהו עוד יותר אבסורדי – חפש את paint.net 2.6 (שזו הגרסה האחרונה) – בינגו! עשרות אלפי תוצאות, כמעט כולן בנושא! איך זה ייתכן שאני ממקד את החיפוש ומקבל פתאום כל כך הרבה תוצאות? זה לא אמור להיות הפוך?

האמת שיש הסבר טכני לכל הסיפור הזה, שקשור באלגוריתם החיפוש והניסוח, אבל את חבר שלי התירוץ לא מעניין ממש. הוא פשוט לא מצא.

 

אי אפשר לתחמן את גוגל – האמנם?

לפני מספר שנים, פיתחתי עבור ידידה אתר שעמוד הבית שלו מבוסס פלאש. הזהרתי את אותה ידידה שגוגל יתקשה לקרוא את הפלאש (היום הוא כבר יודע יותר טוב) ולכן לא יצליח להגיע לעמודים הפנימיים, אך היא לא רצתה לוותר על החוויה הפלאשית.

בכדי לעזור לגוגל לקרוא את התוכן הנמצא בתוך הפלאש , הכנתי עמוד טקסט פשוט, עם כל הלינקים בצורה הכי יבשה וסטנדרטית, ללא עיצוב בכלל. שילבתי קוד המזהה את הרובוט של גוגל, ומגיש לו את העמוד הטקסטואלי במקום את גרסת הפלאש. במיוחד בשבילו. ממש האכלתי אותו בכפית.
תוך זמן לא רב הצלחתי למצוא את העמוד הזה בגוגל. זיהיתי ממש את הניסוחים שהופיעו בעמוד הטקסטואלי. המשתמש הרגיל כמובן לא רואה את העמוד הזה. יופי טופי.

אחרי תקופה, גיליתי שזו נחשבת לעבירה של ממש בעיני גוגל , ושאפילו יש לעבירה הזו כינוי – זה נקרא "הסוואה" (Cloaking) או Doorway pages. למרות שזה נעשה בתמימות מלאה מצידי – מובן שזו עבירה. הרי זו דרך להציג דבר אחד במנוע החיפוש ודבר אחר בתוכן האתר. זה עשוי להטות לחלוטין את אמינות התוצאות!

לפי מה שלמדתי, גוגל יודע לזהות את הרמאות הזו, והוא מוחק את האתרים המרמים מרשימותיו. בפועל – האתר של ידידתי חי במשך זמן מה במקום מכובד בתוצאות. כיוון שהחלטתי להימנע מסכסוך עם אלוהים שיניתי את השיטה וברחתי מארץ. אני לא יודע אם האתר לא היה חי טוב עד עצם היום הזה אם לא הייתי משנה דבר.

 

לפני כ-3 חודשים קרה דבר דומה ל-BMW גרמניה. האתר השתמש באותה שיטת רמאות, אך לפי הפרסומים הוא הוסר מרשימותיה של גוגל, או שגוגל דירג אותם אי שם בקרקעית. משהו כזה. גם לאחר שהם חזרו למוטב – גוגל לא וויתרו על העונש. לאחר פניות מטעם BMW, הוחלט במשרדי גוגל לוותר להם. רק שעכשיו קשה למצוא את BMW גרמניה בגלל שכל תוצאות החיפוש עוסקות בנושא הרמאות והעונש…

סיפור זה מעלה שתי שאלות, בדיוק בשני הנושאים שאני עוסק בהם כאן:

1) אם גוגל משנים את הדירוג של אתרים המנסים לפגוע באמינות התוצאות – זה לא פוגע באמינות התוצאות?

2) אם גוגל מוותרים כל כך בקלות (אולי מחשש שמא יפגעו באמינות התוצאות) – לך תדע כמה רמאים מסתובבים להם בראש התוצאות ולוקחים את הסיכון שירדו מהרשימות למשך שבוע-שבועיים במקרה שייתפסו.

 

 

 

 


22 אפריל 2006
10

המלך עירום – השער

(אם לא קראת – מבוא לסדרה "המלך עירום – Google והאכזבה")

 

אין ראוי מלהתחיל את סדרת "המלך עירום" עם ההזנחה של גולת הכותרת, חזית הקונצרן, עמוד הבית - מנוע החיפוש הגלובלי.
עם כל ההתעסקות הבלתי נפסקת בחווייה האפליקטיבית באינטרנט, ושימוש ב-AJAX בכל מקום בו יש מקום פנוי ל-4 אותיות, החוויה הסובבת את עמוד הבית היא אולד-סקול לגמרי.

כמו משתמשים רבים, גם כשאני רוצה לחפש תמונות, אני מתחיל ב-Google.com, ואז לוחץ על הקישור images. לא יודע למה. אולי כי נוח לי יותר להגיע ל-google.com עם קיצורי המקלדת. אולי כי אני בטוח בכתובת שלו. כנ"ל לגבי חיפושים אחרים בגוגל, כמו בקבוצות הדיון או בחדשות.
המעבר מנושא אחד לשני מלווה בריענון פושטי של העמוד. כבר שנים שמוצעים פתרונות יפים להתנהגות הממשק הצפוי בצקרה כזה. שדה החיפוש של Yahoo הוא דוגמה מצוינת.

זה נראה כהולך יד ביד עם ההתעקשות על העיצוב הפשוט והמצומצם, שמקבעת את גוגל על ייצוג המנועים השונים כקישורים פשוטים, מה שנותן באמת רושם של הפניה לעמוד חדש.

מפריעה לי מאד גם חוסר העקביות בהתנהגות של המנוע "המשולב". אם נכנסים ל-google.com, מקישים את מילת החיפוש (מבלי לשגר את החיפוש), ולוחצים על images – ההתנהגות זהה לזו של Yahoo – לא קורה דבר פרט לסימון "images" מעל שדה החיפוש. כנ"ל לגבי המעבר ל-Froogle. אבל אם מבצעים את אותו הניסוי עם החדשוןת, הקבוצות, או המפות – הליחצה על הלינק למעשה מבצעת גם שיגור של החיפוש על חשבון הבית.

ואיפה הוידאו? העדפה של Froogle על פני גוגל-וידאו בלינקים הראשיים מייצגת התעלמות מצמיחת חיפוש הוידאו ברשת.

והחידושים וההמצאות? זהו? עמוד הבית יישאר כפי ששוחרר לאוויר לפני כמה שנים? יותר גרוע, הוא חזר לאחור כמה שנים. דווקא יש את Google Suggest, תחליף העמוד הראשי הנסתר מעיני הגולשים, אשר במקום להיחשף ולקבל את התשואות המגיעות לו – קיבל פיק ברכיים והחליט להישאר כביטא עד שכבר לא יעניין אף אחד.
אפשר לראות כבר תכונות מעניינות ועכשוויות יותר אצל AOL , אצל Microsoft, ואצל Yahoo לדוגמה.

 


RSS twitter Facebook
איל שחר