להציל את האות המתה

האינטרנט התחיל, בעצם, כפלטפורמה משודרגת לטקסט. תחילה, של מאמרים מדעיים, בעיקר של פיזיקאים. אפילו ראשי התיבות של הפרוטוקול שעליו מבוססת רשת האינטרנט – HTTP, הם Hypertext Transfer Protocol. כך, האפשרות להפוך כל קטע טקסט לקישור אל מסמך אחר, הפך את האינטרנט לספריה הגדולה וגם היעילה ביותר בעולם.

עם הופעת מנועי חיפוש יעילים, נהיה אפילו יותר קל למצוא ספר ברשת מאשר לגשת לחדר הסמוך ולחפש אותו על המדפים. ולבטח שיותר קל למצוא קטע ספציפי בטקסט הרשת מאשר בספר, גם אם הספר כבר מונח פיזית על ברכיך. אבל בשביל שזה יקרה, הספר היה צריך להיות בפורמט של טקסט שמחשב יכול לקרוא, לא כתמונה (שאדם יכול לקרוא).

סוג המידע "טקסט" הפך אט אט לאזרח מדרגה שנייה ברשת, שני למידע חזותי: תמונות וסרטי ווידאו. אין כנראה הרבה כסף להרוויח מעיבוד של טקסט. לא כמו שאפשר למשל לעשות מהאפשרות להקפיץ לאנשים לשדה הראיה פרסומת או "מידע שיווקי", מה שדוחף טכנולוגיה כגון זו של מציאות רבודה, Augmented reality. יש ל Augmented reality אמנם מרכיב של טקסט, בעיקר תרגום משפה לשפה המיועד לקהל של תיירים.Text_Recognition_and_augmented_Reality

אותי היחס הזה לטקסט מטריד. ברשומה הזו אני מנסה לדמיין את "הדבר הבא בטקסט".

קצת רקע: אני קורא לא מעט במחשב, ורוב החומר הזה נמצא בפורמט של PDF , פורמט השייך לחברת Adobe. זו שהצליחה לגרום לרוב העולם לאמץ את הפורמט הזה. היא מחלקת בחינם תכנה לקריאת הפורמט הזה, ומנסה לייצר הכנסות מכל מי שמנסה לייצר מסמכים בפורמט הזה.  לפחות זו הייתה הכוונה המקורית, אבל אני סקפטי אם זה עבד עבורם. כי כיום יש אינספור דרכים לייצר מסמכי PDF בלי לשלם לאף אחד. יש גם תכנות לקריאת PDF העולות פי כמה באיכותן של זו של  Adobe.

עדיין, אותה השאיפה הנושנה והנכזבת של Adobe לייצר רווח גורמת לחלק גדול מהטקסט שנמצא בפורמט הזה להיות בלתי שמיש. בנוסף, יש לקבצים האלה אוסף מגוחך של הרשאות שיוצר המסמך יכול לקבוע באופן בלתי הפיך, כמו חסימת האפשרות להעתיק חלק מהטקסט, לשנות בו דברים או להדפיס אותו. שוב, דברים שאולי פעם נראו לאנשים חשובים, אך היום רק כולאים ים של טקסטים בתוך פורמט שלא מאפשר לעשות הרבה דברים חשובים.

ויש עוד דבר מאד מהותי לפורמט של קבצי PDF. בניגוד לקבצים של ספר אלקטרוני, PDF הוא מוכוון נייר. הפורמט משמר הן את סידור הטקסט והן תמונות הנלוות אליו, על דף נייר בגודל מסוים. אפשר להגדיל או להקטין את גודל האותיות על המסך, אבל אורך השורות לא הולך להשתנות – הטקסט או שיגלוש מהמסך אם הגדלת יותר מדי, או לא יתפוס את כל רוחב המסך אם לא הגדלת מספיק. אם יש על הדף כמה טורים של טקסט, אין בנמצא תכנה שאני מכיר שתגלול לך את הטקסט טור אחרי טור על גבי מסך צר למשל, כמו של טלפון. הטורים תמיד ישארו האחד ליד השני, ואתה אמור לסרוק את הדף מעלה-מטה והצידה, כך שכדאי שתהיה לך תפיסה מרחבית טובה…

וכמובן שאין אפשרות לשנות את הגופן לכזה שיותר נוח לך בעין. אם מישהו החליט הפקת מסמך באיזשהו גופן ביזארי (כל מה שהוא עם סריף, לדעתי), אז זה מה שיש. כך תקרא את המסמך.

רוב הטקסטים שיש לי הם בעצם תמונות של טקסט, תוצר של סריקה ברזולוציה נמוכה מדי מכדי שתוכנה תוכל לזהות את מראית האותיות כטקסט בעל משמעות, ולכן אי אפשר למשל לחפש בטקסט מילה כזו או אחרת. אבל ככה זה כשרוצים קבצים שאפשר לשתף בקלות, למשל בדואר אלקטרוני. ברזולוציה קצת יותר גדולה תכנה כן מסוגלת לפחות לזהות את השורות של הטקסט כך שאפשר לפחות "למרקר" קטעי שורות – תהליך החיוני לרבים במהלך של קריאה לצורך הבנה. לפעמים אפשר אפילו לבחור מילים בודדות. אבל זה לא אמין.Fullscreen capture 09042014 110114

אם רוצים שהתכנה תוכל לזהות את הטקסט כטקסט, מה שנקרא OCR(optical character recognition) צריך לסרוק את המקור ברזולוציה ממש גבוהה ולייצר קבצי ענק שקשה לשתף, אבל אם זיהוי הטקסט היה עובד כמו שצריך (והוא לא), אז מיד אחרי הזיהוי, הקובץ היה הופך לקובץ קטן ביותר וקל לשיתוף.

חשבתי על דרכים בהם אפשר להפוך את "טקסט" לאזרח יותר שווה זכויות בעולם הדיגיטלי, זה שכיום עיקר ההשקעה ותשומת הלב בו היא בדימויים – ווידאו ותמונות. אני חושב שרוב המרכיבים של מה שאני הולך לתאר כבר קיימים במקומות אחרים.

אני מודע שמעבר לחסמים הטכנולוגיים, כמו יכולת שרחוקה מלהיות מושלמת של זיהוי ממוחשב של אותיות בתמונה (OCR) ברוב השפות, (קצת יותר טוב באנגלית) ותרגום אוטומטי שמייצר בדרך כלל גיבוב אותיות חסר משמעות, ישנם חסמים לא טכנולוגיים לא מבוטלים, כמו זכויות יוצרים, שקצצו מאד בכנפי פרויקטים מושקעים ועתירי טכנולוגיה כגון google books. ברור לי שכל שירות של טיפול בטקסט חייב לספק תגמול הוגן לאנשים שהשקיעו בכתיבה, תרגום, עריכה והוצאה לאור. אנסה להציע פה פתרונות הוגנים.

מה שהייתי רוצה לראות הוא סוג של שירות, כמו למשל השירותים שחברת google  מציעה: של מפות, או דואר אלקטרוני. או מערכת כמו של tripadvisor שבה קהל הגולשים מדרג בתי מלון, מסעדות ואתרי תיירות. שירות שיאפשר את הדברים הבאים:

0.0 – רוב הטקסטים הסרוקים, נסרקו כאשר ספר מונח, פניו מטה, על משטח הזכוכית של הסורק. מה שאומר שכל שני עמודים מנוגדים, הפכו להיות עמוד אחד מבחינת התכנה. אפשר לראות את זה כ"טורים", ולא פעם גם כל אחד מהעמודים בעצמו מחולק לטורים. כשקוראים ספר שכזה, ורוצים שטור אחד ימלא את כל המסך, משמעות הדבר היא מין דפדוף מסובך, שחלקו הזזה ימינה ושמאלה וחלקו דפדוף מעלה מטה. אבל כל כך פשוט לזהות שכל אחד מהריבועים של טקסט שעל מה שהקובץ המקורי חושב שהוא עמוד, או טור, הוא בעצם עמוד בפני עצמו, וכך לאפשר מעבר פשוט מעמוד לעמוד רק על ידי דפדוף…רלוונטי במיוחד למכשירים בעלי מסך קטן מ 14 אינצ'ים.Presentation1-001

0.1 – בכלל, כל השטות הזו של "עמוד" היא שטות מימי הנייר. כשמסמך נקרא בפורמט אלקטרוני, הרבה יותר פשוט ונוח לקרוא כאשר שורות הטקסט נגללות באופן אחיד. אפשר לשמור את מספרי העמודים המקוריים בשולי הטקסט, למי שרוצה, ואפשר לאפשר למי שרוצה להדפיס את הטקסט על פי העימוד המקורי, או להתאים את ההדפסה לגודל דף הנייר וקנה המידה. אבל בשביל לבטל את החלוקה לדפים, צריך לפחות לזהות את שורות הטקסט, גם ללא זיהוי האותיות שבהן.

0.2 – הפרדת ים הפיקסלים שבכל דף לאלמנטים תחביריים מובחנים: פרקים, פסקאות, שורות ומילים. גם ללא זיהוי של האותיות עצמן שהוא תהליך יותר קשה. עצם הייצוג כמילים ומשפטים מאפשר הצגה גמישה של הטקסט על אמצעי תצוגה שונים, בעלי גדלי מסך שונים: מטלפון, דרך טאבלט, מחשב אישי נייד, מסך מחשב גדול, טלוויזיה. בלי צורך להזיז את תמונת הטקסט ימינה ושמאלה בכל שורה.

1 – שדרוג קבצי טקסט, גם כאלה שנסרקו באיכות ירודה, לטקסט קריא, שבו זוהו האותיות, כך שאפשר לחפש בו ואולי גם לערוך אותו. קשה קצת יותר, אך יש לי רעיונות (בהמשך) איך לעשות את זה.

2 – מערכת לשיתוף של הערות ופרשנות לטקסטים. זו אינה מערכת שיתוף של טקסטים שיש בה בעייתיות חוקית. זו מערכת שבה לכל מי שיש עותק של טקסט מסויים, יש גישה לכל ההערות והפרשנות שאנשים הוסיפו לטקסט זה,  עם מערכת דירוג שתוכל לעזור לאנשים לדעת בקלות לאיזה הערות כדאי להם להתייחס.

3 – אפשרות לקַשֵר בין גרסאות של הטקסט בשפות שונות; ברמת המילה או לפחות ברמת המשפט, עם יחס מיוחד לשפת המקור. כולל אפשרות להתמודד עם מספר תרגומים לאותה השפה או עם מספר גרסאות של הטקסט – אפילו בשפת המקור. (הכוונה כאן אינה לתרגום ממוחשב של טקסטים – הטכנולוגיה לזה לא באמת קיימת.)

כדי שאפשר לעשות את 2 ו 3, על ה"טקסט" לחזור ולהיות טקסט, בפורמט שמחשב יכול לקרוא – כלומר – אותיות ולא פיקסלים. קבצים שבהם הטקסט הוא רק תמונה לא מאפשרים את זה. אבל כדי שתמונה תהפוך טקסט, עליה להיות באיכות מספיק טובה ורוב קבצי הטקסט הם לא כאלה. חלקם אפילו נסרקו כשספר הונח פתוח על זכוכית הסורק, לא מפורק, וקצות השורות בעותק הסרוק מתפתלות כלפי מטה (או מעלה), כך שאפילו לבני אדם קצת קשה לקרוא את האותיות שבקצה השורה. לא אחת, יש חלקים של הדף שחסרים, או ששורות הטקסט לא מקבילות לקצה העותק הסרוק. בעיה.

בעיה שיכולה להיפתר על ידי ריבוי משתמשים. יש הקוראים לזה "מיקור המון" (crowd sourcing).

למחשב קשה אמנם לזהות באמינות גבוהה כל אות ואות בדף, אבל יחסית קל לו לזהות שדף מסוים בעותק של ספר שהוכנס למערכת על ידי משתמש אחד, זהה לדף שמשתמש אחר הכניס בעותק אחר של אותו הספר. שני הקבצים לא חייבים היו להיסרק באותו כושר הפרדה (רזולוציה), ואפילו לא חייבים להכיל בדיוק אותו מספר עמודים. אבל אם יש את אותו הדף בשני קבצים שונים, גם אם באחד מהם הדף אולי הונח קצת עקום ובשני חלק מהשורות נקצצו או מתעקלות לקראת סופן, אפשר לגלות באופן אוטומטי שמדובר באותו הדף. ישנם מספר אלגוריתמים בתחום הראיה הממוחשבת המאפשרים לייצר "חתימה" ייחודית מתמונה, וכל דף של טקסט אפשר לראות אותו כתמונה, כך שעותקים שונים של אותו הדף, גם אם הם נסרקו אחרת (למשל כפי שתואר מעלה) יפיקו חתימות שהן מספיק קרובות בכדי שאפשר יהיה למצוא את כל העותקים של כל דף, מתוך כל העותקים שבכל הקבצים שכל המשתתפים "הביאו" אל המערכת. פה דווקא באה לעזרה העובדה שבקבצי PDF איו למשתמש יכולת לשלוט בעיצוב, כמו למשל להחליף גופן או לשנות את רוחב השוליים.

כעת, די בכך שאחד העותקים של הדף הוא כבר בפורמט של טקסט של ממש, או לפחות תמונה באיכות ממש גבוהה כך שאפשר לזהות בה כל אות ואות באמינות גבוהה, אזי אפשר "לפענח" בהצלחה גם כל עותק אחר של הדף, גם אם הוא באיכות ירודה, חסר או עקום. אפשר להחזיר למשתמש שסיפק עותק ירוד שכזה, את הטקסט שהושג מהגרסה הכי איכותית של אותו הדף. אם יש תמונות או דימויים בדף, גם איכות אלה יכולה להיות משופרת בעותק המשודרג.

נקודה חשובה היא שאין מספקים לאף משתמש טקסט שלא היה לו מלכתחילה, רק גרסה משודרגת של הטקסט שכבר יש לו, שאותו הוא יכול היה לקרוא גם קודם – רק לא באופן ממוחשב. ואין זה מעניינה של המערכת איך הושג אותו העותק. מרגע שלמשתמש יש עותק כלשהו של דף, הוא קנה לעצמו את הזכות לשדרג את איכות הטקסט בדף זה, וליהנות מכל התכונות שהמערכת שתתואר כאן מספקת.

גם אם כל הדפים הקיימים במערכת, שזוהו כעותקים של דף מסוים קיימים רק בגרסאות של תמונה (image), אזי יש עדיין טכניקות, שוב מתחום הראיה הממוחשבת או טכניקות המשמשות להגדלת האיכות של וידאו ולהפקת תמונות איכותיות ממנו (super-resolution) המאפשרות, על ידי מיזוג המידע התמונתי ממספק עותקים של הדף, לייצר תמונה מאוחדת של הדף שבה יש יותר פרטים ושאת האותיות בה אפשר לזהות באמינות יותר גבוהה. ככל שיהיו יותר משתמשים, שיספקו יותר עותקים של אותו דף טקסט, כך יקל יותר יהיה לייצר עותק איכותי של הדף. וכך, כל אחד מהמשתמשים שסיפקו עותק, יקבל עותק משודרג, קריא יותר, כזה שבתכולתו אפשר לחפש, אפשר לסמן, אפשר להעביר למעבד תמלילים ולערוך.

וכאן אני מגיע לחלק היותר משמעותי של המערכת – מה אפשר לעשות עם הטקסט כשהוא כבר נגיש כטקסט, כאותיות, לא רק כתמונה.

אפשר כאמור להעביר אותו למעבד תמלילים, ואז להכניס לתוכו תוכן נוסף, הערות, קישורים רלוונטיים, פרשנות. אבל אז, הטקסט מאבד את הקשר עם קהילת הקוראים שלו. מאותו הרגע, כל איש לעצמו. כל הכוח של "חכמת ההמונים", של הרשת, כבר לא זמין יותר לקורא אותו טקסט מרגע זה.

לכן, חייבים מערכת המספקת את הכלים להוספה של "מטא-טקסט" לטקסט: הערות, הסברים, קישורים, הדגשות של קטעים משמעותיים, מילון מונחים המוזכרים בטקסט ועוד, אבל כך שאפשר להפריד בבירור בין המקור לתוספות, שיהיה ברור מיהו המחבר של כל אלמנט טקסטואלי. במערכת שכזו, כל מי שניגש למערכת עם עותק כלשהו של הטקסט, יכול ליהנות מכל העושר המצטבר של כל אותו ערך מוסף שהוסף לטקסט על ידי כל קהיליית הקוראים שלו. אלא שכדי שהקורא לא יטבע בים של תוספות חסרות ערך, חייבת להיות מערכת של דירוג איכות ההערות, על ידי קהילת הקוראים עצמה. לא רעיון חדש, דווקא כזה המיושם ברוב השירותים של תוכן המסופק על ידי "הגולשים", המשתמשים בעצם.

סוג אחד של מטא-טקסט שבו אני משתמש לא מעט, והייתי רוצה לראות יותר ממנו, הוא האזכור בסוגריים בתוך הטקסט (או בהערות שוליים, או בהערות בסוף הספר) של המונח בשפת המקור שהמתרגם חשב, בדרך כלל בצדק, שהבאתו תסביר יותר טוב את הדברים. בעיקר כאשר אין מילה מקבילה בשפה אליה תורגם הטקסט כולו. דוגמאות רבות לכך יש בטקסטים של פילוסופים גרמניים ששפתם עשירה בתחיליות וסיומות המאפשרות ליצור משורש אחד ריבוי גדול של מילים שמשמעותן שונה אך כולן קשורות בטבורן לאותו שורש. ברוב השפות האחרות, מילה אחת מסוג זה מיתרגמת לשלוש-ארבע מילים, תכופות מחוברות במקפים, ועדיין, זה לא ממש זה.

אם נדקדק, אין באמת בשום תרגום, משום שפה לשום שפה, שום מילה שיש לה מקבילה זהה לחלוטין בשפה השנייה. יש תמיד הבדלי ניואנסים הנובעים מהבדלי התרבות בין דוברי השפות השונות. וולטר בנימין, כשהוא כותב על "שליחותו של המתרגם" (שתורגם כ"משימתו של המתרגם") מביע כדוגמה את המילה "לחם" בגרמנית וצרפתית. חישבו על זה, מה עובר לגרמני ולצרפתי בראש כשכל אחד מהם חושב על המילה "לחם" בשפתו שלו. אין להשוות.

אחד הדברים שאני מוצא מאירי עיניים במיוחד הוא לקרוא את "הקדמת המתרגם" לספר. ההתעכבות הזו על לבטיו של המתרגם היא לא אחת הקדמה מצוינת לספר עצמו. היא מאפשרת הבנה טובה ביותר של הטקסט המתורגם. אבל לפעמים אין ברירה, ואני מוצא את עצמי יושב עם התרגום לעברית ולידו "פתוחים" (בחלונות. טוב, זה במחשב) התרגום לאנגלית ולפעמים גם המקור בגרמנית או בצרפתית. שפות שאני לא ממש קורא. עדיין, ראיית המונחים במקור, או בתרגום האחר, מוסיפה המון להבנת הטקסט, גם כאשר התרגום סביר. כאשר התרגום היה סביר לזמנו אך כבר לא סביר היום, כמו הרבה מאותם "תרגומי המופת" לעברית שנעשו לפני חמישים ושישים שנה, ההשוואה לתרגום עדכני יותר, אפילו בשפה אחרת, היא כלי מצוין.

וכאן אני מגיע לחלק השלישי של המערכת שהייתי רוצה שמישהו יבנה. האפשרות לקשר בין גרסאות שונות של אותו הטקסט, באותה השפה או בשפות אחרות. ראיתי דוגמה לא רעה לממשק כזה כאשר google translate  מתרגם דף אינטרנט.Fullscreen capture 02042014 165435

כאן צריכה לבוא הסתייגות: הרבה יותר קל לשייך משפט מתורגם למשפט בשפת המקור כאשר התרגום הוא ממוחשב – למרות שהתרגום הממוחשב כלל אינו קריא ובעל משמעות ברוב המקרים, הוא לפחות מתרגם משפט למשפט, ומאפשר לשמור על הקשר ביניהם. תרגום אנושי לא תמיד ישמר את סימני הפיסוק כך שיהיה יותר קשה להצמיד מקור לתרגום. קשה, אבל אפשרי, אם לא ברמת המילה אז ברמת המשפט. אם לא ברמת המשפט, אז ברמת הפיסקה. איך לעשות את זה? על בסיס אותם העקרונות של תרגום ממוחשב, אפשר באופן אוטומטי, באחוזי הצלחה לא רעים לדעתי, להתאים שורה מתורגמת לשורת מקור. ביחוד באם עוברים על הטקסט מתחילתו, ומניחים שברמת הפרק יש תיאום מלא בין המקור לתרגום וברוב המקרים גם ברמת הפיסקה. זה לא יהיה מושלם, אך במערכת המשלבת תכנה עם חוכמתם השיתופית של המשתתפים, שבה המערכת מסמנת את המקומות שבהם היא לא בטוחה בהתאמה ומאפשרת למשתמשים לתקן, להוסיף או להעיר, אפשר להגיע לאחוזים גבוהים של התאמה. אין צורך בהתאמה מלאה כי עדיין, כל גרסה של הטקסט עומדת בפני עצמה, וההתאמה לשפה האחרת היא משהו מאד מועיל, אך אי התאמה פה ושם לא גורעת משמעותית. כי אין מדובר פה בתרגום אוטומטי – התרגום כבר קיים, ונעשה ביד אנוש.

מערכת כזו שבה כל הגרסאות, בכל השפות, קשורות זו בזו בקשר בלתי אמצעי יכולה לקרב את חזונו המיסטי משהו של וולטר בנימין, של התקרבות לאותה שפה מושלמת שאבדה לנו עם התמוטטות הפרויקט של מגדל בבל. בנימין רואה כאידאל את הגרסאות של כתבי הקודש שבהן משולבות גרסת המקור והתרגום ברמה של שורה -שורה. או בלשונו:

Denn in irgendeinem Grade enthalten alle große Schriften, im höchsten aber die heiligen, zwischen den Zeilen ihre virtuelle Übersetzung. Die Interlinearversion des heiligen Textes ist das Urbild oder Ideal aller Übersetzung.

אפשר לחשוב גם על מערכת כמו זו המתוארת מעלה שתאפשר תרגום מבוזר של טקסטים, בעזרת ציבור גדול של גולשים. אבל זה דורש מחשבה נוספת. רק רעיון, קצת יותר בוסרי מהאחרים שפה.

ואחרון אחרון חביב: איך לגרום לבעלי הזכויות על הטקסט המקורי ועל תרגומיו לרצות להיות חלק מהמערכת הזו ולא לחסום אותה?

נתחיל בזה שבמערכת הזו, לא נוצרים עותקים חדשים של טקסטים. לכל משתמש יש גישה רק לדפים שהוא "הביא עמו מהבית". אין טעם להידרש לשאלה אין הוא השיג אותם, והמערכת צריכה להניח שהוא הגיע לידיו כחוק: קנה ספר, וסרק אותו. או שקיבל אותו ממערכת הטקסטים של אוניברסיטה, כחוק, לצורך לימודיו (אפשר לסרוק עד 20% מהספר, וברוב המקרים, יש הקפדה על כלל זה.) המשתמש מקבל עותק משודרג בהרבה של הדפים שאתם הגיע, אבל זה עדיין אותו החומר.

ועדיין, מערכת כזו צריכה לתמרץ את בעלי הזכויות לשתף בה חומר. למשל, אם מו"ל מעלה למערכת גרסת טקסט מלאה (אותיות) של ספר, והוא היחידי שעשה כן, אזי המערכת יכולה לגבות מהמשתמשים תשלום קטן עבור ההמרה של דפים מתמונה לאותיות ולהעביר אותו למו"ל. ועדיין, אף אחד לא מקבל דפים של טקסט שאין לו מלכתחילה. העותק השלם של הספר נשאר מוגן במערכת.

המו"ל מקבל בנוסף אפשרות למַעֵן בחומר פרסומי את הקהל המעוניין בטקסטים שאותם הוא מוציא לאור, ויכול גם להציע להם לרכוש את החלקים של ספרים שעדיין אין להם (כמו שהוצאת Lonely Planet מציעה לרכוש פרקים בודדים של מדריכי הנסיעות שלה). יתירה מזאת, כל אותו ה"מטא-טקסט" שהמשמשים יוסיפו מוסיף ערך לספר שהמו"ל השקיע כסף בהוצאתו לאור.

אם המוציאים לאור היו ממספרים את העותקים המודפסים, הייתה גם אפשרות להעלות למערכת דף המכיל את המספר הסידורי של הספר, ובכך להוכיח בעלות שתאפשר למו"ל לתת או למכור לך במחיר סמלי, עותק דיגיטלי של הספר.

יש מודלים אחרים, כמו למשל ה Kindle של אמזון, שמיועדים למי שמוכר טקסטים. אבל הם לא ממש רלוונטיים לכאן, כי המערכת של שדרוג טקסטים לא מיועדת להפצת טקסטים או מכירתם, רק לשדרוגם של טקסטים קיימים, בעיקר כאלה שהחלו את חייהם כעותק מודפס.

האם זה יספיק? לא יודע. צריך אולי מישהו כמו סטיב ג'ובס (איפה הוא כשצריך אותו…) לשכנע את בעלי הזכויות לטקסטים להסתגל לעולם החדש הזה. זו הייתה הגאונות האמתית שלו, לא יכולת המצאה טכנית. Google books הסתבך קשות עם הפרויקט הזה, של המרת כל אותה אות מתה לאות דיגיטלית, שאתה אפשר לעשות דברים. והם עשו זאת בתקציבי ענק. אבל גוגל היא (לדעתי) פשוט חברת התכנה הגרועה בעולם.

עד שיגיע חזון אחרית הימים הזה, אפשר לפחות להשתמש בתכנה יותר מוצלחת מזו של אדובי לקריאת ויצירת קבצי PDF, שיש לה גם גרסה חינמית לא רעה. נסו את PDF-XChange Editor.

והנה כמה ספרים בפורמט PDF שהצטברו אצלי.

חברת התכנה הגרועה בעולם

לא, זו כבר לא מיקרוסופט. google היא מבחינתי הזוכה בתואר חברת התכנה הגרועה בעולם. לפני שאנסה להסביר למה העובדה שהתכנה של גוגל לא עולה כסף, לא מצדיקה את התנהלותם ומה (כנראה) קורה פה, הנה כמה דוגמאות:

google drive: מאפשר לך לקבל גיבוי אוטומטי ברשת של כל מה שאתה שם בתיקיה אחת. כשמתקינים את הישום, יש לו מיקום ברירת מחדל שבו הוא שם את התיקיה הזו, ותחתיה אתה יכול לשים כל מה שתרצה. אלא שאחרי כמה חדשים בהם ראיתי שהדיסק בו נמצאת התיקיה הזו הולך ומתמלא בעוד הדיסק השני (משום מה פוצל הדיסק הקשיח שלי לשניים – כך זה הגיע מהיצרן) ריק, העתקתי את התיקיה של google drive על תכולתה לדיסק השני. מאותו הרגע, אבד הקשר עם העותק של התיקיה ברשת. לא משנה מה ניסיתי, הקשר לא חודש. נכנעתי והעתקתי את התיקיה חזרה למקומה המקורי, וסיפרתי על זה ליישום. קיבלתי הודעת שגיאה ש"זו לא התיקיה המקורית".

אין למוצרים של גוגל באמת מערכת תמיכה. הם מסתמכים על זה שתחפש בכל מיני פורומים פתרונות, ולפעמים מישהו מגוגל מפציע באחד הפורומים האלה ומציע עצה כזו או אחרת. מסתבר שאני לא היחיד שנתקל בהודעה הזו. בפורומים יש מאות אנשים שחיפשו פתרון לבעיה, מאז שצצה לפני כשנתיים. פעמיים הפציע שם מישהו מגוגל והציע מה לעשות, משהו שהיה אמור לעבוד, אבל אם היה מנסה לעשות זאת בעצמו, היה מגלה שלא. שנתיים, ואין לבעיה הפשוטה הזו, של הזזת התיקיה פתרון. אם אתה מנסה להזיז את התיקיה של Sky Drive, השרות המקביל של מיקרוסופט, אין בעיה.

מה עשיתי? הסרתי את ההתקנה, מחקתי כל מה שבתיקיה שברשת, והתקנתי מחדש כשהפעם אני מתערב בהגדרות וממקם את התיקיה במקום שבו אני רוצה. האם גוגל יתקנו את זה אי פעם? מי יודע.

gmail: למשך תקופה של כמעט שנתיים, לא יכלו משתמשי gmail לקרוא את המייל שלהם כשהם לא מחוברים לרשת. גם את המיילים שהם כבר הורידו למחשב וקראו. באנדרואיד לא הייתה בעיה לעשות זאת, ממש באותה התקופה. במחשב האישי – לא. היכולת הזו הייתה קיימת במשך כמה שנים, ואז, בלי הודעה מקדימה, היא נעלמה. בפורומים נאמר (לא נמסר רשמית) שהם לא מרוצים מהמימוש, שהתבסס על משהו שהם קראו לו gears, והם מחכים ל HTML גרסה 5. שמחת זקנתי. איזו מין מחויבות ללקוחות התנהגות זו מראה? אולי זה שהם מנסים לגרום לאנשים לנטוש את המחשב האישי ומערכת ההפעלה חלונות ולעבור לפלטפורמות בהן הם שולטים?

גם כיום, אם לא הפעלתם gmail offline, גרסה נחותה של gmail, ודאגתם לסנכרן אותה עם הרשת מפעם לפעם, אין לכם גישה למייל שלכם אם אין לכם חיבור רשת. פשוט מודיעים לכם ש"אין גישה ליישום כרגע". למה בטלפון ובטאבלט יש גישה כזו? אי אפשר לממש את זה תחת "חלונות"? אפשר ואפשר. גוגל לא מעוניינים, כנראה, או מצפצפים.

google maps: יש ל maps במחשב האישי מראה חדש, שעל הדרך שמט לא מעט פונקציונליות. כמו gmail, גם maps במחשב האישי לא תומך ב offline. בניגוד לאנדרואיד, שם אפשר לסמן קטע במפה, למשל עיר שאתם מתכוונים לנסוע אליה, והוא ישמור מקומית עותק שאליו אפשר לגשת גם ללא חיבור רשת, במחשב האישי פשוט לא מופיעה אפשרות כזו.

אבל חוץ מזה, יש משהו שנקרא "המפות שלי". גם שם יש בגרסה החדשה בעיה רצינית בהגדרת ממשק המשתמש, אבל גרוע מזה – המפה שהכנתי בעמל רב לנסיעתי לרומא, עם כל המסעדות הטבעוניות, המוזיאונים, הגלריות, כל המקומות בהם יש ציורים של קראווגיו, כל העמל הזה ירד לטמיון כי לקחתי אתי את הטאבלט ולא המחשב האישי – כי אליו אפשר כאמור להוריד מפות. אבל באנדרואיד, "המפות שלי" אינן. פשוט אין אליהן גישה. הייתה גישה בעבר, אמנם רק עם חיבור רשת, אבל עכשיו – אין.

גם במחשב האישי עושה רושם שהתכונה הזו בדרך החוצה. היא כבר לא מופיעה בשום תפריט, רק בחלון החיפוש, לפעמים. אבל אם תומכים בזה עדיין, אז למה להעלים את זה מהגרסה הניידת (אנדרואיד) ועוד ללא הודעה? ומתי זה יחזור?

Google web albums: בלי לשאול אותי, כל אלפי התמונות שהעליתי לרשת, למשהו שנקרא  picasa web albums, נחטפו על ידי גוגל, והפכו להיות חלק מ google+, הנסיון הפתטי שלהם לרשת חברתית. בלי לשאול אותי. ובמשך כמעט שנה, לא יכולתי להוריד אותן חזרה למחשב. כלומר, יכולתי תמונה תמונה אבל לא תיקיות שלמות. בדיוק באותה תקופה הלך לי הדיסק הקשיח, והייתי בטוח שיש לי גיבוי ב  web albums. ובכן, היה לי גיבוי, אבל גוגל החליטו שאם אני רוצה את התמונות שלי חזרה, אז אני צריך להוריד אותן אחת אחת, באלפיהן.

כססתי ציפורניים ובדקתי בפורומים. היו לא מעט תלונות, ואחרי כמעט שנה, הואילו אלוהי הגוגל לעשות למשתמשים שלהם טובה, ולהחזיר להם מעט שליטה בתמונות שלהם ואפשר היה למצוא דרך להוריד חזרה תיקיות שלמות.

עד כאן ארבע דוגמאות. יש לי עוד הרבה, אבל הוצאתי מספיק קיטור לפעם הזו.

בשורה התחתונה, אין באמת תיעוד רשמי של התכונות הנתמכות בשום מוצר תכנה של גוגל. אולי כי הם לא רואים את זה כמוצר אלא כשירות. אבל איך לעזאזל חברה התומכת במספר פלטפורמות לא מנסה אפילו לספק תאימות מינימלית כלשהי ביניהן, לפחות ברמת הפונקציונליות?

חלק מהבעיה יכול לנבוע מרצונם לדכא את השימוש במחשב האישי, שבמערכת ההפעלה שלו לא הם שולטים, ולקדם פלטפורמות מתחרות שבמערכת ההפעלה שלהן הם כן שולטים. מבחינת חברת אינטל, שמטה לחמה מבוסס כמעט כולו (לצערה) על המחשב האישי, גוגל היא אויב מר. אני תוהה האם קברניטיה מודעים לזה.

אבל גוגל היא גם פשוט חברת תכנה גרועה. יש להם אלגוריתם חיפוש מוצלח, נכון. אבל אם הרך הזעיר (מיקרוסופט) היה מרשה לעצמו להתנהג כמוהם, שוועת המשתמשים הייתה עולה לשמיים. גוגל מרשים לעצמם להסיר תכונות משמעותיות, לאפשר או לחסום גישה למידע שלך עצמך, כנראה רק לפי צרכי צוות הפיתוח של השירות. ואין פרץ ואין צווחה. הם כנראה לא שמעו על משהו שנקרא "בקרת תצורה" – כשהם משחררים גרסה חדשה, הם אפילו לא טורחים לבדוק האם מה שעבד עד כה עדיין עובד. או האם אותם הדברים עובדים גם במחשב וגם בטלפון. לבטח שהם לא משחררים גרסאות במקביל כך שתהיה תאימות.

אולי זה בגלל ששנים עבדתי בחברת אינטל, שם התאימות היא קודש, שאני כל כך מזועזע מההתנהלות של גוגל. אני לא יכול לדמיין לעצמי מה שהיה קורה אם פקודה אחת של המעבד, מתוך כמה אלפים. הייתה נעלמת. או שהייתה נותנת תוצאה שונה בספרה ה 63 אחרי הנקודה. אינטל הייתה מחזירה מעבדים ומפצה את הלקוחות במיליארדי דולרים.

האם גוגל יכולה להתנהל ככה בגלל שהיא לא גובה כסף עבור שירותיה? כנראה ככה הם חושבים. הם אומנם מוכרים את "האישונים" שלנו למפרסמים בעשרות מיליארדי דולרים בשנה. הם אמנם מפתים אותנו לשים את כל הדברים היקרים לנו באכסון אצלם, בחינם. אבל החינם הזה, יש לו מחיר. כי אין שום מחויבות, שום ערובה, שהדברים יהיו שם כשתצטרך אותם.

כדאי שכל מי שמשתמש בשירותיהם, ואני נמנה על אלה, וגם אמשיך להימנות, יבין: אנחנו לא לקוחות. לא מתייחסים אלינו ככאלה, כי הם לא רואים אותנו ככאלה.

זו חברה שמתנהלת על פי צרכי צוותי הפיתוח שלה, לא הלקוחות. הם לא חושבים שיש להם כאלה. ואם לצוות הפיתוח לא נוח יותר לתמוך בתכונה מסוימת לשנה שנתיים, או לתמיד, גם במחיר של פגיעה משמעותית במשתמשים, אז התכונה הזו תיעלם בקול דממה דקה, בלי הודעה מתי ואם תחזור. ואין לכם למי להתלונן.

חברת התכנה הגרועה בעולם כבר אמרתי?

סיטרא אחרא דוט קום

בימי כסטודנט בטכניון, לפני עידן האינטרנט, הטלוויזיה הייתה האויב. גרנו אז בהדר הכרמל, תחילה שנתיים בסביבה דתית קלות, ושנתיים ברמת ויז'ניץ, שכונה חרדית של ממש, של הגרופי'ז של האדמו"ר מויזיניץ. בתקופה ההיא, היו שכניי מזמנים אותי לפעמים לבתיהם באמתלה כזו או אחרת, ואז הייתה מפציעה לפתע טלוויזיה מתחת לערמת שמיכות או מפות בחדר המגורים, והיו מבקשים ממני, בסודי סודות, בלי שהשכנים ידעו, שאתקן או אסדר דברים בטלוויזיה עבורם. ואם היה צורך לקחת את המכשיר לתיקון, זה היה צריך להיעשות באישון לילה, "בהשקט ובבטחה" (ססמת הפנימייה הצבאית).

טוב, זה היה אז. הרדיו, האיום הקודם נשכח, והטלוויזיה הייתה אז התגלמות "הצד האחר", הסיטרא אחרא בארמית. היום, הסיטרא אחרא מגולם על ידי האינטרנט, ובמיוחד בגלגולו החדש והמסוכן יותר, זה שבטלפון. זה שבטלפון יותר מסוכן כי הרבה יותר קשה לפקח על הקהל השבוי, שלא יציצו אל מעבר לגדר.אומן 002-004

האמת, האיום אמיתי. כל טלפון חכם הוא חלון לעולם שדרכו יכול אדם להימלט, וירטואלית לפחות, מהכלא שבו שמה אותו הקהילה הסגורה הרמטית כמעט שלו. אתה יכול להפעיל לחץ חברתי ולמנוע מאנשים להחזיק טלויזיה או מחשב בבית. חיבור לכבלים או אנטנה זה משהו שהשכנים יכולים לראות ולהלשין עליך. האח הגדול מ"1984" יכול עוד ללמוד דבר או שתיים מהחברות החרדיות הסגורות על פיקוח ושליטה.

אבל אתה יכול למצוא מספיק מקומות שבהם אתה יכול לגלוש בטלפון, ואיש לא ידע. במיוחד אם תסתיר את מה שלמדת שם ואת ההשפעה של זה עליך.

כפי שאפשר לראות מטה מהעלון שחילקו שם באומן, הם לא חוסכים בסופרלטיבים. "פצצה אטומית", לא פחות. 70% מהנושרים, נשרו עקב גלישה באינטרנט, הם טוענים. מה זה אומר? שמרגע שאתה מסיר לאנשים את המחסום מהעיניים, ולו קצת, אולי הם מבינים שמה שמכרו להם מיום לידתם הוא לא כזה להיט?

נכון שזה לא הפוך, זה לא ש 70% מאלו שגלשו באינטרנט נשרו, זה פחות "גרוע" ממה שהכותרת מנסה להראות. אבל עדיין, אין לי ספק שאכן האינטרנט הוא איום ממשי על לכידות הקהילה ואפשרויות השליטה בה. וזה לא רק אינטרנט, זה גם "סרטים". אפילו "במבי"?

אינטרנט הוא כל כך זוועה, ש"בעל שבט הלוי" (מה זה?) גורס שאם הברירה היא בין אישה המפרנסת את בעלה הלומד בכולל, בעבודה במקום בו יש אינטרנט , או אשה עובדת במקום בלי אינטרנט ובעל עובד גם הוא (שומו שמיים!!!) אז האופציה השנייה עדיפה! שהבעל יצא לעבוד למחייתו? רק כדי שאשתו לא תעבוד במקום בו יש אינטרנט? באמת שכלו כל הקיצים.

וה"גאון" רבי משה צדקה, הולך אפילו יותר רחוק – יש לגרש מבית הכנסת את מי שחשוף לאינטרנט או לטלפון לא כשר! לא לצרף אותו למניין אפילו. לא קצת קיצוני?

זהו פשוט טרור שעושים לבני הקהילה. משטר אימים של דיכוי והפחדה.

אומן 002-003

עוד לפני שהאינטרנט פלש לטלפונים, כבר היה על החרדים להגדיר "גן נעול" של תחומי מספרים שבהם הם יוכלו לדבר רק אחד עם השני ולא חס ושלום עם חילונים. כתבתי על זה רשומה בשם הקומות הכשרות. כך החרדים קוראים לגרסה המצונזרת של הטלפונים הסלולריים.אומן 002

אני עדיין עובר מפעם לפעם ברמת ויז'ניץ, בעיקר כשאני נוסע לרחוב ארלוזורוב 8, לרכוש מהקיפלי האגדי של לייבל. וזה השלט שאני רואה על חלק מהבתים שם:אינטרנט

מה גורם לאנשים לשים שלט שכזה? האם יש אנשים ששמים שלטים על בתיהם כמו: "אני לא גונב" או "אני לא מכה את ילדיי? אם לקלוט אינטרנט או סרטים זהו חטא כל כך חמור, אז למה מישהו צריך להצהיר את מה שמובן מאליו? שהוא לא עושה את זה?

אלא אם כן, הדעות חלוקות. ויש הגורסים שהאינטרנט נחוץ לצרכי פרנסה, או יכול להיות מועיל לפעמים. ואז, יש כאלה המרגישים צורך להצהיר שהם מהיותר מחמירים, מהיותר מדקדקים. כי יש לא מעט מזה בחברה החרדית, מעין תחרות בהקצנה, בבחינת "שופוני, אני יותר אדוק ממכם". וזה מתבטא בפרשנות יותר ויותר קיצונית של כל מיני מצוות ואיסורים. אם יש תקופת נידה, אז לוקחים עוד מקדם ביטחון שבוע לפני ושבוע אחרי, ובינתיים משתגעים מחסך מיני, עד כדי כך שילדות בנות שלוש מהוות פיתוי שיש להעלים מן העין.

גם באומן. בכניסה היה אינטרנט אלחוטי בחינם, שבו השתמשו בעיקר הלא חרדים, וגם החרדים האמריקאים והצרפתים. הוא כמובן היה נעול בחג ובשבת, אבל אם הוא היה נעול ולא מכובה, סימן שמישהו שם כן המשיך להשתמש בו. DSC03035

אבל מצד שני, לא היה שם רב אחד שלא יצא עם קצף על השפתיים בדרשתו, כנגד האינטרנט.אומן 002-001

היו מתונים יחסית, כמו למשל הרב בצרי, שהציעו פתרון טכנולוגי לבעיה טכנולוגית: יישום שישדר לחמישה חברים כל פעולה באינטרנט הנעשית בטלפון חכם. כך יהיו לכל אחד חמישה שומרי כשרות שימנעו ממנו לצרוך תכנים לא ראויים.

מה שתמוה בעיני, זה שהם לא מבינים שזו מלחמה אבודה מראש. אם צריכים חמישה כדי להשגיח על האחר, איזה סיכוי יש להם? ככל שזעקות החמס רמות יותר, כך ברור לי שהסיכויים לבלום את זה קלושים יותר. עם כל המשטור והדיכוי.

ויש גם קריקטורות:אומן 002-002

הכרזות באומן כנגד האינטרנט בכלל והאייפונים בפרט (עם זה אני מזדהה, לכו על אנדרואיד!) היו בכל מקום. אפילו על הקיר שמתחתיו, בערך, קבור רבי נחמן. זה מפצירים במתפללים להתפלל שיוציא את השאול תחתיות (==אינטרנט) מאיתנו.

אינטרנט

וגם כאן, בעוד פשקוויל, יותר חריף, מדובר כבר ב"רשתו הטמאה של השטן" ו"התנתק מרשתו הארורה של הסטרא אחרא ושבור את כל המכשירים הפוסלים אותך וכובלים אותך." הלודיטים לא יכלו לנסח את זה יותר טוב…

אינטרנט

עוד אי אלו רשומות על אומן בראש השנה… וזה הופיע השבוע על כרזותmaran123_g

 

Big Data

עברו כמעט שלושה שבועות מהכנס שארגן המרכז להנדסת מחשבים בטכניון על
Machine Learning and Big Data, ועדיין לא יצאה לי מזה רשימה.

זה הקישור לכנס: 3rd Annual International TCE Conference

קיוויתי לכמה דברים  כאשר החלטתי ללכת לכנס, למרות שהוא כבר ממש לא בתחום עיסוקי: לפגוש מכרים מהימים שבהם זה כן היה פחות או יותר מה שעניין, ואף פרנס אותי, לנסות ולקבל השראה לפטנטים שאותם אני מפעם לפעם כותב ואף מוכר, ולמצוא אולי חומר מעניין לכתוב עליו, כאן.

כי יש השקה מעניינת בין העולם הזה של big data והעולם אותו אני מנסה לגלות עכשיו, זה של מדעי הרוח. big data מעצב את עולם המושגים שלנו, והומחשה קיבלתי כמה שבועות מאוחר יותר, בכנס הלקסיקלי העשירי של מרכז מינרבה באוניברסיטת תל אביב. ההגדרות שניתנו שם למושגים כמו "נורמלי" או "זיכרון" שונות בתכלית מההגדרות שהיו ניתנות להם לפני עידן ה big data.

מכרים אכן פגשתי, רעיונות לפטנטים לא עלו לי בינתיים כתוצאה  ישירה מהכנס. אבל מי יודע, לך תדע איפה זה יצוץ. אין מדע להמצאתיות. אתה יכול רק לדאוג לאספקה סדירה של גירויים, ולקוות לטוב.

 ורשומה? לקח לי זמן עד שמצאתי מה הייתי רוצה לכתוב על הכנס. חלקית בגלל גודש האירועים והכנסים בהם נכחתי בשבועות האחרונים. כמעט על כולם יש לי מה להגיד, אבל זה ייקח זמן. אז החלטתי לחזור לכנס הזה, והכתיבה תאפשר לי קצת לנסות לעבד מה ששמעתי שם.

נושא היום הראשון של הכנס היה big data. אבל מה שנחשב big data  משתנה בקצב מאד מהיר עם הגידול המהיר בכמויות המידע העוברות ברשת והמאוחסנות בשרתים. השפה כרגיל ממחישה את השינוי היטב. כמעט כל כמה חודשים אני לומד על שמות של מספרים עוד יותר גדולים, בדרך כלל לתיאור כמויות של נתונים המאוחסנים אצל חברות כמו גוגל, פייסבוק וכמובן ידידנו הקשוב אלינו תמיד – ה NSA.

מגיגהבייט וטרהבייט המוכרים, עברנו ביעף דרך פטהבייט, אקסביייט, זיטהבייט ועד יוטאבייט. וזה לא סוף הדרך. כל אחד מהשמות האלה מציין מספר הגדול פי אלף מקודמו, חזקות עוקבות של אלף.

הנה כמה שמות, ומשמעותם (לקוח מויקיפדיה)yottabyte

ומצאתי גם את השמות האלה, שבשלב זה עוד לא מדובר על בניית מתקני אחסון נתונים בגדלים כאלה, אבל השמות כבר כאן (אני לא בטוח אם הם "רשמיים").

(Xenottabyte (1 000 000 000 000 000 000 000 000 000 Bytes

(Shilentnobyte (1 000 000 000 000 000 000 000 000 000 000 Bytes

(Domegemegrottebyte (1 000 000 000 000 000 000 000 000 000 000 000 Bytes

אבל כבר מדברים על נפחי אכסון של יודה-בתים, כמו שמראה האינפוגרפיקה הזו:blog-infographic-yottabyte-size

אז יש כמויות בלתי נתפסות של מידע דיגיטלי שצריך להעביר ולאכסן, ואין ספק שיצרני הדיסקים הקשיחים עושים עסקים טובים. מדהים בפני עצמו שאפשר בכלל למצוא דברים בערמות האלה,וזה שהחיפוש הוא כל כך מהיר אומר בעצם שני דברים:

  • שהמידע מאוכסן כך שלפחות בחלקו אפשר למצוא דברים מהר. בגוגל קוראים לזה (עדיין) "The brittney spears data set" למרות שכיום היא כבר ממש לא מייצגת את הדברים שאנשים מחפשים יותר. הסט הזה משתנה כל הזמן
  • שלא כל המידע באמת נגיש. כי חברה כמו גוגל יודעת שהיא חייבת לספק תשובות תוך שברירי שניה, ולכן התשובות לשאילתות החיפוש שפוגעות במידע שגוגל חושבת שהוא פחות סביר שיהיה יעד לחיפוש ולכן הוא משוכפל פחות פעמים ברחבי העולם, יתכן ויהיו לא בדף הראשון של תוצאות החיפוש, מקום בו אנחנו לא מסתכלים כמעט אף פעם.

חיפוש זה דבר נפלא. באמת. אבל הוא בעצם רק נקודת ההתחלה. כי השלב הבא, שכבר בעצם כמעט פה עכשיו, הוא לקבל לא הפניות למקומות בהם אפשר למצוא את התשובות לשאלות שלנו, אלא ישר את התשובות לשאלות שלנו.

אבל גם זה לא מאד מעניין. לפחות לא מבחינה פילוסופית. כי תשובות לשאלות שאנו יודעים לשאול, הן פחות או יותר מקבילות ל"מובן מאליו החברתי". הן מהוות שיחה בתוך עולם הקטגוריות שלנו כפי שהוא כבר קיים כעת. (עוד על זה ברשומה על תאוריה של אוונגארד). הן דרך להפוך את החלקים של הזיכרון שלנו המאוחסנים מחוץ למוח שלנו, שם בענן, לשווי ערך לחלקי הזיכרון שלנו המאוחסנים בתוך המוח שלנו. להפוך מידע לידע.

אתגר לא קטן, והישג טכנולוגי אדיר. אבל מה שנראה לי מעניין, זה לדעת לשאול את השאלות שאינו מובנות מאליהן.  להיות מסוגל לדעת מה שאני לא יודע, וקצת מזה קיים כבר בתחום בו עסק היום השני לכנס, זה על machine learning.

הדגימה את העניין הרצאה של מישהו מהרשות לפיתוח אמצעי לחימה (המצגת כאן). הם מנסים לפתח מערכת המנסה לזהות באופן אוטונומי איומים על ספינה מתוך שפע המידע המגיה מהחיישנים שעל הספינה ועל "פלטפורמות אחרות". הם משתמשים בשיטה הנקראת SVM, ראשי תיבות של מכונת וקטורים תומכים, באנגלית  Support Vector Machine. זו שיטה לבניית "מסווגים" אוטומטיים. אחרי שנותנים למערכת כמה דוגמאות למה נמצא בקבוצה אחת ומה נמצא בקבוצה שנייה (שלב הלימוד או ההנחיה), נותנים לה למצוא לבד מה הקריטריונים לסווג שאר הנתונים בין שתי הקבוצות.

מה שמעניין בשיטה הזו, שהמערכת מסווגת מצוין, אבל לא תמיד על סמך הקריטריונים שבן אדם היה מסווג לפיהם. הרבה מאד פעמים אלו קריטריונים שאי אפשר בכלל להסביר אותם בשפה מדוברת אלא במונחים מתמטיים בלבד. כלומר, המערכת לומדת לשאול שאלות לגבי הנתונים ("העולם" שלה) שאנחנו לא יודעים לשאול, או יותר נכון, שאנחנו לא יודעים שהיינו צריכים לשאול.

מפתחי המערכת ברפא"ל כן ניסו להבין את הקריטריונים שהמסווג שלהם מצא, לדבריהם כדי לראות האם המערכת שהם פיתחו "עושה שכל" ולעזור למצוא שגיאות התכנון המערכת. ואז, בשלב השאלות מהקהל, קם אחד ושאל שאלה מעניינת: "למה בכלל אתם חושבים שאתם צריכים להבין מה שמהמערכת עושה?"

שאלה שאני בטוח שעלתה במוחו של כמעט כל מי שיש לו ניסיון כלשהו במסווגים. כי הניסיון מראה שמוחנו פשוט מוגבל, בהרבה מאד מקרים, מכדי להבין את מורכבות המערכת שהנתונים מייצגים, ולכן גם לא מסוגל להבין מה חשוב ומה לא חשוב לשאול על הנתונים כדי לסווג אותם לקבוצות. קבוצות שהמרחק ביניהן מקסימלי. כלומר, שההפרדה ביניהן היא הטובה ביותר שאפשר להשיג, שהן מובחנות בבירור זו מזו.

והנה מקום בו כבר הפנמנו את נחיתותנו ממחשבים. תשובת המרצה הייתה שהוא לא בטוח שסט נתוני האימון שלו אכן מייצג את עולם הבעיה. יתכן, אבל ניסיון להבין את מהות הווקטורים התומכים היא לא הפתרון.

לאן בעצם אנחנו מתקרבים? לא להגדרה הקלסית של בינה מלאכותית, אבל היכולת לעשות סינתזה (או סתם להיזכר) היא מה שבלא מעט מקרים נראה לנו כאינטליגנציה. ב"להיזכר" מחשבים כבר עברו אותנו מזמן. ביכולת סינתזה, הם כבר מאד מתקרבים אלינו, ואף עברו אותנו בלא מעט תחומים. מן הסתם בזכות מאגר הענק של "דוגמאות" לאימון המערכות האלה ש"יודבתים" (Yoddabytes) של מידע מאוכסן ונגיש מזמנים.

והנה הרצאה אחת שמצאתי מעניינת במיוחד:

Sparse Modeling of Graph structured Data and Images

מן הסתם גם בזכות המרצה, מיקי אלעד מהטכניון.

עידן המהפכות

בקרוב יהיו בחירות באירן, והמשטר שם חושש ממהומות.  גם בטורקיה שמח. במצריים טוניס ולוב היו מהפכות שהפילו עריצים ויעלו בעתיד משטרים איסלמיים – על פי רצון העם כמובן. וכל זה מיוחס, במידה רבה, לרשתות החברתיות.

נכון, יש לרשתות החברתיות פונקציה אינסטרומנטלית  מסוימת בכל המהפכות והמחאות האלה, כולל מחאת קיץ 2011 אצלנו.  אבל הייתי רוצה לטעון כאן, שתפקידן המשמעותי לא היה יצירת ערוצי תקשורת חליפיים לשלטון או מערכת לתאום שאפשרה את התארגנות המחאה. אלא שיש להן תפקיד אחר, הרבה יותר משמעותי בהבאתנו אל עידן המהפכות הנוכחי.

אפשר לחשוב על זה כך: חברות הענק של האינטרנט, כולן אמריקאיות אגב, כמו פייסבוק, טוויטר, וורדפרס (המארחת את הבלוג הזה), וגם גוגל (אם יצליחו לעשות משהו מגוגל+) בעצם מוכרות לנו את האשליה שקולנו נשמע. שיש מי שמקשיב לנו.

מה, לא עושים לנו "לייק" מפעם לפעם? או משתפים משהו שהעלנו? או אומרים לנו "יופי של תמונה"? או מגיבים לנו לאיזו רשומה? זה ממש ממכר – האשליה הזו שמישהו שם בחוץ "מקשיב" לנו. או לפחות לא משתיק אותנו.

מסתבר שזה בעיקר ה NSA שמקשיב לנו. וגם כמובן אותן החברות המוכרות לנו את האשליה הזו, כדי שיוכלו לשווק ביתר יעילות את "בבת עיננו" (eyeballs) למפרסמים.

הרשתות החברתיות גורמות לנו לשגות באשליה שקולנו נשמע, ולכן מן הסתם הוא גם נחשב. ואז אנחנו יוצאים לרחוב, ומשמיעים את קולנו.

בישראל בה הקפיטליזם הרבה יותר משוכלל מזה שבמדינות המוסלמיות, הוא השכיל לחבק ולבלוע במיומנות את המחאה. הממשלה עשתה לנו "לייק" במנותה את וועדת טרכטנברג, ובאימוץ חלק ממסקנותיה. היא גם חילקה תוספות שכר לחלק מהמגזרים שצעקו יותר חזק, כדי לקחת אותן חזרה מהציבור, עם ריבית, שנה מאוחר יותר. סתיו שפיר ואיציק שמולי עברו לשחק את משחק הפוליטיקה הרגילה. יהיר לפיד, כמעט בלי להתאמץ אפילו, רכב אל תוך משרד האוצר על גלי אותה המחאה,  כשהוא מספק במיומנות תקשורתית לא רעה את האשליה שקולנו אכן נשמע. היי, הבחור מתקשר איתנו בפייסבוק, אז הוא בטח בסדר.

ועכשיו? עכשיו שקט במקומותינו. צעקנו, "שמעו אותנו", עכשיו נעבור לעניין הבא. כנראה למיקרו-סערונת הבאה שתחולל איזה "אושיית" פייסבוק כזו או אחרת.

אם ארדואן היה קורא את הרשימה הזו, נאמר, משתכנע וזורק איזה עצם קטנה למפגינים, עושה להם איזה לייק קטן. מפעיל קצת טכניקות של קואופטציה, מאמץ, מן השפה ולחוץ כמובן, חלק מהז'רגון של המחאה, הוא היה חוסך לעצמו הרבה צרות, וקונה לעצמו שקט שבמהלכו היה יכול עוד ועוד לבסס ולהרחיב את סמכויותיו (כמו למשל חוק המשילות ש"יש עתיד?" מקדמת).

כי האנשים בעצם רק רוצים להרגיש ששומעים אותם, ש"מחבבים" אותם, שמשתפים את מה שהם עצמם שיתפו. הם רוצים שימשיכו לשווק להם את האשליה שקולם נשמע. שיש לו משמעות

. גם אם הם יודעים, עמוק בפנים, שבעצם לא.

እንጀራ

יש רבים בעולם הסבורים שאני מומחה גדול לבישול אתיופי. ועד שהתנתקתי לפני מספר חודשים מכתובת הדואר האלקטרוני של מעבידי, הייתי מקבל בתדירות די גדולה שאלות הבהרה למתכוני האוכל האתיופי שמסתובבים באינספור מקומות באינטרנט תחת שמי.

איך זה קרה? ומה משמעות שם הרשומה?

על השאלה השנייה קל יותר להשיב.  እንጀራ פרושו אינג'רה,  (Injera), לחם שטוח עם מרקם ספוגי העשוי מקמח של טֶף (teff, ጤፍ). את נזידי העדשים (wat) שמים עליו ואוכלים אותם ביחד, ביד ימין. נורא טעים.

ולגבי השאלה הראשונה: בתחילת שנות התשעים, עם התחלת גלי העליה מאתיופיה, פרסם עיתון לאשה מספר מתכונים אתיופיים, ביניהם רבים צמחונים. כיוון שעולי אתיופיה לא פתחו מסעדות המיועדות ללא אתיופים (ועוד על כך בהמשך), והייתי סקרן לנסות את האוכל, העתקתי מעיתון לאשה שהיה בחדר ההמתנה של ד"ר רומנו, רופא השיניים שלי באותם שנים, מספר מתכונים אתיופיים צמחוניים. או שאולי תלשתי את הדף? אני לא זוכר, ובטח לא מודה…

אותם השנים הם גם ימי תחילת האינטרנט, ופרוטוקול ה HTTP (אתרים המתחילים ב www הם בפרוטוקול זה) לא היה כה דומיננטי באינטרנט כמו שהוא היום. חלקים נכבדים של הפעילות באינטרנט התרכזו במה שנקרא newsgroups, וכיוון שהיו גם מעט אנשים עם גישה לאינטרנט, יכולת להכיר את רוב האנשים שהיו פעילים בקבוצה (newsgroup) מסוימת. באותם השנים הייתי מתכתב באימייל עם אשיות אינטרנט כמו Tim BernersLee, כיום Sir Timothy John "TimBernersLee, OM, KBE, FRS, FREng, FRSA, לגבי פרוטוקולים כאלה ואחרים…

אחת הקבוצות בה נהגתי לבקר נקראה (אם אני זוכר נכון) news.food.veg.receipes, קבוצת דיון למתכונים צמחוניים. מישהו שם חיפש מתכונים אתיופיים צמחוניים, לי היו המתכונים מעיתון לאשה, תרגמתי אותם לאנגלית והעליתי לקבוצה, מתי שהוא ב 1991-2.  ומאז, כמו דברים רבים מימיה הראשונים של הרשת, כל המתכונים האלה הועתקו ושוכפלו אינספור פעמים, הומרו לפורמטים חדשים ומעודכנים, הוכנסו למאגרי מתכונים ברשת, והועלו בפורומים אינספור של מתכונים ובישול. ובכל הגלגולים הרבים האלה, שמי וכתובת האימייל שלי נשארו איכשהו צמודים אליהם. כתובת האימייל שלי שם אפילו נותרה זו של תחנת העבודה הספציפית שהייתה לי באותה תקופה, ואיכשהו, המיילים המשיכו להגיע אלי, ה"גורו" העולמי של הבישול האתיופי, עד מאי 2011. אז "הודחתי" מהכהונה הרמה, והמיילים התחילו לחזור לשולחיהם. כך חולפת תהילת עולם 😦

בישלתי לפי המתכונים האלה, אבל לא הרבה. בלי האינג'רה זה לא זה, ואינג'רה מסובך להכין, ולא הכנתי אף פעם. אבל כל פעם שעולי אתיופיה פתחו מסעדה בארץ, הלכתי לאכול. בדרך כלל, המסעדות נסגרו לפני שהספקתי להגיע אליהן. ב 1996 נשלחתי בשליחות מעבידי דאז לאורגון, ארה"ב, לשנה ושם היו שתיים-שלוש מסעדות אתיופיות טובות, והיה תענוג. ואז חזרתי לארץ, ועדיין לא היו כאן מסעדות.

גם עולי הודו, וגם עולי אתיופיה, משום מה, לא פתחו פה מסעדות איכותיות שיציגו את המטבח הנפלא שלהם. ולא ברור לי למה. אני עובר אחת לשבועיים דרך התחנה המרכזית הישנה, רואה שם לא מעט מסעדות אתיופיות, או לפחות מקומות שבהם יושבים אתיופים ליד שולחנות, ונראים כמו מסעדה. בדרך כלל 3-4 שולחנות מכוסים מפת ניילון, טלוויזיה רועמת שירים באתיופית (אמהרית או טיגרית, אני לא מבחין..), ואנשים יושבים, מעשנים ושותים, אבל אני אף פעם לא רואה אף אחד אוכל. מייאש.

לפני כמה שבועות שמחתי לראות את השלט הזה על אחד המקומות האלה שליד רחוב נווה שאנן. סוף סוף תפריט!

לפני שבוע נכנסתי למקום הזה. שוב, אף אחד לא אוכל. שאלתי אם יש שירו, מעין תבשיל עדשים. אמרו לי שיש. הזמנתי, ישבתי וחיכיתי. כולם הסתכלו עלי במבט מוזר. עוד שמתי לב, שהאדם שממנו הזמנתי, לא העביר את ההזמנה הלאה לאף אחד. אולי חיכה שיגמור ללעוס את כדור ה"גת" הענקי שישב לו בלחי. חשבתי כבר לברר מה קורה, אך עשן הנרגילות הסמיך (נרגילות מעט שונות מאלו הערביות) שבר אותי, קמתי ואמרתי למלצר שיבטל את ההזמנה. הוא לא התרשם, ואני – יצאתי בידיים ריקות. חבל. אנסה שוב בפעם אחרת בשעת צהרים, אולי בערב לא מקובל לאכול.

Stolpersteine

לקיומן של ה Stolpersteine, "אבני נגף" בתרגום מילולי מגרמנית, התוודעתי די מזמן. אלו שלטים קטנים הממוקמים בתוך המדרכה ליד בתים רבים באירופה המאזכרים את שמות היהודים שגרו בבתים האלה, או בבתים שעמדו בכתובת הזו, עד שגורשו ונרצחו. חלק מהשלטים גם מאזכרים אחרים שגורשו, כמו למשל צוענים.

היזמה ל"אבני הנגף" האלה היא של אמן גרמני בשם Gunter Demnig, ואפשר לראות אותן בערים רבות בגרמניה ובעוד עשר ארצות אירופאיות. בסרט הדוקומנטרי "הדירה" שראיתי לא מזמן, מבקר עושה הסרט עם אמו בכתובת בה גרה לפני השואה בגרמניה, והם מגלים של את שמם על השלט לפני הבית.

היזמה אכן יפה, ונוגעת ללב. היא דרך צנועה אך ארוכת-משך לזכור ולהזכיר את המורשת היהודית הכל כך משמעותית של גרמניה בפרט, ואירופה בכלל.

נזכרתי ב"אבני הנגף" לפני שבוע כקיבלתי קובץ רשימות מסע של פרופסור אמריקאי, יהודי (במקרה) שלימד בחורף 2011 סמסטר באוניברסיטה שבאבו-דיס וגר באותו הזמן ברמאללה. באחת מהרשימות הוא מספר על ביקור אצל מכרים במערב ירושלים, יהודים, "המתעבים גם הם את הסיטואציה" כהגדרתו, חלקם אף סרבני מצפון. בקיצור – שמאלנים. בין האורחים היו שניים שחזרו מהמבורג, גרמניה,  "ניגפו"  שם באבני הנגף האלה וסיפרו על זה לנוכחים.

המארחת העירה שיש מקום אולי לשים שלטים מסוג זה גם ליד בתים בישראל, מהן גורשו משפחות פלסטיניות ב 1948. שתיקה לא נוחה השתררה בחדר.

למה בעצם? למה גם לי לא נוח לחשוב על זה? סיבה אחת: את המקבילה הזו, בין היהודים שגורשו מבתיהם באירופה, לפלסטינים שגורשו/הוברחו מבתיהם כאן, הצלחתי, כמו רובנו, להדחיק לא רע בכלל – עד עכשיו. אבל עצם העלאת האפשרות של שלטים המציינים את הפלסטינים שגורשו מכתובות ספציפיות בישראל, מקשה עלי להמשיך את פעולת ההדחקה הזו, ושווה לחקור את ההשוואה הזו ולראות מה אפשר ללמוד ממנה.

דווקא בגלל ש"זה לא אותו הדבר". דווקא בגלל שלא שלחנו את הפלסטינים כלפי מעלה דרך הארובה, אלא רק מזרחה. דווקא בגלל שזה היה במהלך מלחמה, שבה קיומנו כמדינה היה מוטל על כף המאזניים. דווקא בגלל שהמגורשים או צאצאיהם עדיין איתנו היום, חלקם תחת שלטוננו אפילו, או תחת כיבושנו.

בשורה התחתונה: האירופאים בכלל, והגרמנים, פולנים, סלובקים, אוקראינים וכן, גם הצרפתים וההולנדים שביצעו את העבודה בפועל, השיגו מה שהאירופאים רובם שאפו לו, גם אם שלא במוצהר – להיפטר מהמיעוט היהודי שבתוכם. שבעים שנה אחרי זה, זה כבר אירוע היסטורי מבחינתם. הם חיים בשלום עם המצב שנוצר, הם שילמו פיצויים לקורבנות, אפשר לעבור הלאה. הגיע זמן ההנצחה, ואפשר לבנות אנדרטאות, מוזיאונים לתרבות היהודית שהוכחדה בשואה, ולמקם אבני נגף ברחובות.

והם גם דאגו ששרידי הקרבנות לא יחזרו הביתה. אם על ידי פוגרום קטן פה ושם לאחר המלחמה, כמו בקילצה שבפולין, ואם על ידי עזרה בהקמת מדינת הלאום היהודי. ואם יש ליהודים מדינה, יכבדו וילכו אליה, ויעזבו אותנו במנוחה. אז פה ושם זולגים חזרה יהודים לאירופה, בעיקר מרוסיה אל מערב אירופה, אך המספרים קטנים מספיק בשביל שלא להטריד.

ואיפה אנחנו, שישים שנה אחרי? ב 1948, וגם קצת פחות ב 1967, פעלנו נמרצות כדי להתאים את המציאות בשטח לאתוס הציוני של "ארץ ללא אנשים לאנשים ללא ארץ". נכון, הייתה מלחמה. נכון, לא התחלנו בה. נכון, לא הייתה לנו פה מדינה לולא פעלנו כמו שפעלנו. אבל היו פה אנשים, והזזנו אותם מפה כדי שתהיה לנו מדינה משלנו. והפצע שפצענו עדיין פעור.

הסיבה ששלטי זיכרון כאלה לא הולכים להיות מותקנים ברחובותינו בעתיד הנראה לעין, היא שאנחנו לא השכלנו כמדינה, במהלך 65 השנים שחלפו, למצוא פתרון לבעיית הפליטים ורצוי,  פתרון מוסרי.

נכון, הדבר לא רק בידינו. אבל הוא כן בעיקר בידינו. ואחת הסיבות העיקריות לזה שאנחנו לא פותרים את בעיית הפליטים היא שאנחנו מדחיקים את הנושא. ואנחנו מדחיקים כי אנחנו כעם, מסרבים לקבל את האחריות ההיסטורית לגירוש הפלסטינים.  גם "סמולנים" מושבעים כמוני, המצדדים חד משמעית בהקמת מדינה פלסטינית, עובדים קשה כדי לשכוח את העובדה שמדינת ישראל לא הייתה ממש  ריקה כשהגענו.

המחשבה על "אבני נגף" כאלו במקומותינו, מבהירה לי ששלטי הנצחה כאלה יוכלו להיות כאן רק כאשר הנושא יהיה היסטוריה. והוא יהיה כזה רק כאשר ימצא לפליטים והמגורשים פתרון מוסרי וצודק, בהסדר בין העם היהודי כולו, לעם הפלסטיני כולו.

רק כשנוכל להיות בטוחים שהנעדרים, או צאצאיהם, לא יחזרו לבתים אלה. ספציפית או בכלל. לא יותר משהיהודים יחזרו אל בתיהם באירופה. רק כאשר תיפתר סוגיית זכות השיבה סופית. והפתרון יהיה לא על ידי כיפוף זרועות לרשות הפלסטינית ולתושביה הנמצאים תחת כיבוש, רק אז יהיה זה פתרון בר קיימא

ואם לנצל את ההשוואה לאירופה. הסיבה שרוב הניצולים היהודים לא חזרו לבתיהם בגרמניה, צרפת או הולנד, היא שהיהודים הפנימו שאירופה לא רוצה אותם בקרבה. שהם כן העדיפו לחיות במדינה משלהם, מדינה בה הם קובעים את החוקים ובה הם הרוב.  ואיזה סיבה יש לנו לחשוב שלא כך יהיה עם הפלסטינים? שאם תהיה להם מדינה משלהם, מדינה של ממש, שהם לא יעדיפו לחיות בה ולא לחזור לבתיהם ולהיות מיעוט במדינה בה ההמנון לא המנונם, הדגל לא דגלם, וחוקי ההגירה תפורים על פי מידת דת הרוב.

אין לי מושג האם באמת יכול להימצא פתרון כזה, איך ועל ידי מי. אבל עד אז, המחשבה על Stolpersteine במקומותינו, על "אבני נגף" ברחובותינו, הנושאים את שמות המשפחות הפלסטיניות שגרו כאן לפנינו, היא מטרידה ועוכרת מנוחה. היא עוכרת את מנוחתי עד כדי כך, שחשבתי שאעכיר גם את מנוחתם של קוראי הרשומה הזו. מצטער….

והפלסטינים, מה הם יכולים לעשות בעניין? לא הרבה בעולם האמתי. אבל בעולם הווירטואלי, כפי שהם עושים כשהם מעלים את מיקומי הכפרים הפלסטינים המושכחים והמחוקים ל google earth, כך הם יכולים גם להתקין Stolpersteine שכאלה בעולם הווירטואלי, ואפילו בלי הסכמת הצד הישראלי. הם יכולים לציין את שמות המשפחות באבני נגף וירטואליות, בשכבת מידע מעל הכתובות שבהן גרו, ב goole maps ו/או ב google earth. יתרונן של אבני נגף וירטואליות אלה הוא שאין צורך להיות פיזית במקום עצמו כדי לקרוא אותן, הן אינן דוהות ואינן מתבלות, ועלותן פחותה בהרבה.

כדי לספק את סוג האסוציאציה המרחבית שמספק שלט פיזי, נדרשת רק אפליקציית  augmented reality  בטלפון (החכם, ברור שחכם). זו תאחד את מידע המיקום מה GPS המובנה בטלפון עם התמונה מהמצלמה שבטלפון, אולי עם רכיב נוסף של זיהוי תמונה מתוך Google street view  וכך "תרכיב" (superimpose) את השלט הוירטואלי על תמונת המקום עצמו כאשר המשתמש נמצא במקום, כך שהשלט יראה "ממוקם פיזית" במקום אותו הוא מציין.

סימנים דהים

הסביבה שלנו ממש רוויה בסימנים. סימנים הממקמים אותנו בעולם, ומאפשרים לנו לדעת איפה אנחנו ואיך להגיע למקום אליו אנו רוצים להגיע. יש כל כל הרבה סימנים שברוב המקרים אף אפשר להסתדר מצוין בלי מפה, קל וחומר בלי מערכת נווט לוויני. ועל כך, כבר הרחבתי די בשתי רשומות: המפה והטריטוריה וציוניוני הדרך.

לטוב ולרע, הסימנים האלה הולכים להיעלם, לדהות והתפוגג כמו מערכות אחרות שאיבדו את תועלתן, שאבד עליהן הכלח (מה זה הכלח הזה?). כמו שכבר אין בצידי הדרכים תחנות בהן אפשר להשקות ולהאכיל את הסוסים, כך יעלמו מן הנוף גם שלטי ההכוונה והמיקום.

כאשר לכל אדם יש מכשיר טלפון נייד בכיסו, והמכשיר אומר לו בדיוק איפה הוא נמצא ולאן לשים את פניו, מה החפץ בכל אותם מאות הדונמים של שלטי אלומיניום ופלסטיק המצטופפים מול עינינו ואומרים לנו למשל שהבית שלפנינו הוא מספר 27 ברחוב הרצל. כאילו שאנחנו לא יודעים…

או אותו השלט בקומה השניה המגלה את עינינו שיש שם בונה כינורות ששמו מנדל, (שאגב נפטר כבר לפני שנים ואיש לא טרח להסיר את השלט). הרי אנו כבר יודעים איך למצוא את בונה הכינורות הקרוב.  ידענו עוד לפני שיצאנו מהבית. אין אנו הולכים ברחוב, כינורנו בידינו, מחפשים מישהו שיתקן אותו לפי השלטים על חזיתות הבתים.

תוך זמן לא רב, נוכל אפילו להסתכל "דרך" מסך הטלפון אל העולם, וספציפית, אל הבית שמולנו, ועל גבי חזית הבית נראה איפה בדיוק  ממוקמת חנותו של בונה הכנורות, אחרי שמערכת הנווט כבר הביאה אותנו עד הבית בלי להזדקק לשום שלט בדרך. קוראים לזה Augmented Reality וזה ממש לא מסובך למימוש. זה מסוג הדברים שכבר הוכחו בקנה מידה קטן לפני שנים והולכים לקרות בכל מקום תוך מספר קטן של שנים. ולא רק זה, גם נוכל לראות על המסך מה חשבו הלקוחות הקודמים של בונה הכינורות על שרותיו, וכמה אמור לעלות לנו לתקן את המותחן השבור.

יש אינספור שימושים ל Augmented Reality ומערכות מיקום ונווט בכלל, אך המשותף לכולם הוא שהם מייתרים את השלטים והסימנים שבעולם האמתי, וגורמים להגירת כל מערכת המסמנים הזו אל העולם הווירטואלי. נכון שהעלמות השלטים הפיזיים תגדיל את תלותנו במערכת הלוויינים התלויה מעל לראשנו וברצונה הטוב של ממשלת ארצות הברית המתפעלת אותם ומאפשרת לנו לנווט בעזרתם. אבל את אותו הדבר אפשר גם לומר על רשת האינטרנט ושרתי חברת גוגל. אין דרך אחורה.

כמות הרעש החזותי שתיעלם מעולמנו עם השלטים היא אדירה. יהיה לנו הרבה פחות צפוף בעיניים. יש סיכוי סביר שגם חלק גדול משלטי הפרסום יהגרו לעולם הווירטואלי וייעלמו גם הם משדה הראיה שלנו, וזה יהיה ממש לא רע. המאמץ שמוחותינו משקיעים בהתעלמות  לא מודעת מכל הרעש החזותי (והקולי) הזה הוא ניכר, והעלמות השלטים תגרום לנו להיות קצת פחות עייפים בסופו של יום.

אבל זה בהנחה שנצליח להתמודד עם הצפת החושים בעולם הווירטואלי….

לא כל כך נעים לראות גן סגור

איפה שזה רק עושה שכל, אני מכניס לבלוג קישורים לאתרים הרלוונטיים לנושאים בהם הרשומה עוסקת.

אבל לא כולם כך. אתר עיתון הארץ למשל, גם כשהוא מסקר נושאים החיים במרשתת, לא יכניס לגוף הכתבה קישורים אליהם. במדור האינטרנט כן יהיו קישורים, אבל גם שם הם לא יהיו בגוף הרשימה, אלא אחריה.

בויקיפדיה יש אין ספור קישורים בתוך הטקסט של הערך. אבל כולם בתוך ה"גן הסגור" של ויקיפדיה. גם כאשר אין עדיין ערך מאחרי הקישור, או שיש רק stub, לא יכניסו קישור לכתובת חיצונית, גם כשהוא רלוונטי ומכיל את כל המידע שהקורא היה צריך כדי להשלים את המידע החסר. בויקיפדיה יש קישורים, אך בנספח נפרד אחרי סוף הערך, ויש גם קישורים בנספח המקורות.

איך יתכן שאפילו מאמרים מדעיים המתפרסמים online, המצטטים אחרים ומסתמכים עליהם, מכילים תגים סתומים כמו למשל  [smith 86] שאם אתה רוצה לדעת מה הם אמרו, אתה צריך ללכת לסוף המאמר, לחפש את התג, לראות את שם המקור המצוטט וללכת לחפש אותו באינטרנט או בספריה? למה אין קו תחת הטקסט שמאזכר את המקור, בגוף המאמר, שיכול לשמש לקורא קרש קפיצה ישירות אל המקור המצוטט?

בבתי הקזינו של Las Vegas היציאות מוסוות כדי שתישאר ותשאיר את כספך במכונות המשחק או על השולחנות. בגן הנעול של חברת Apple, המוטיבציה המוצהרת היא רצון לשמר את "חווית המשתמש", המוטיבציה הלא מוצהרת אך הלא נסתרת, זהה לזו של בתי הקזינו: ככל שתישאר יותר אצלנו, תשאיר יותר מכספך אצלנו.

אבל מה הסיבות לזה שאתרים, גם כאלו שללא כוונת רווח, עמלים להשאיר אותך בתוך ה"גן הסגור" שלהם? או לפחות לא לסמן את היציאה בברור?

סיבה אחת יכולה להיות הרצון לאפשר לך קריאה לינארית ורציפה של הטקסט, בלי שתקפץ הנה והנה, ותשכח מאיפה ולמה התחלת ולאן אתה הולך. זו גם דילמה שאני מתמודד אתה כשאני מכניס קישור, הייתי מעדיף לא לאבד את הקורא באמצע הרשומה, סתם כי אני אוהב שקוראים את מה שאני כותב. אבל הטקסט בויקיפדיה הרי זרוע בקישורים. אמנם רק פנימיים, אך אלו כה מפתים שלעתים רחוקות אני מצליח להגיע לסוף הערך ממנו התחלתי, בלי ללכת לאיבוד בעץ (נפלא) של מידע כה זמין ונגיש. אז אצלם לפחות זו לא הסיבה. לפחות לא זו המודעת.

בעיתון הארץ, ואתרים מסוגו, היו מן הסתם רוצים שתישאר בתחומי האתר המורחב של העיתון כדי שיוכלו למכור את "זמן האישון" שלך למפרסמים. יותר עיניים השוזפות את דפי האתר ליותר זמן משמעותם יותר כסף לעיתון לכל מודעה. וגם שם, הכותבים היו מן הסתם גם רוצים שתגמור לקרוא את הכתבה עד סופה. ואחרי שתגמור אותה, מתחת לכתבה, יציעו לך עוד כתבות שאולי היית רוצה לקרוא. רק תישאר.

אז איך אפשר להציל את ה HyperText? זו הרי צורת קריאה כה אינטואיטיבית שקשה לי כבר לראות טקסט סתם, סגור על עצמו, המתיימר להגיד כל מה שיש להגיד על נושא מסוים, בלי שום חלון החוצה, אל העולם הגדול.

וכדי להוכיח את טענתי, אין ברשומה הזו ולו קישור אחד. לו היה, עלול היה הקורא שלא להגיע לכאן, למקום בו אני מציין את העובדה החגיגית שזו הרשומה המאה במספר שאני כותב ב"דרכי עצים".

סוד הקסם של Facebook

יש משהו מאד מיושן בפייסבוק, ואני חושב שזה חלק מקסמו.

זה קצת כמו תוכנית טלויזיה שאתה יושב וצופה בה די פסיבי רוב הזמן, בחומרים שהעלו אחרים.

המדיום של הטלוויזיה, שמביני דבר כבר סתמו עליו את הגולל כמיושן ולא רלוונטי, עדיין טבוע בנו עמוק – אחרי הכל, זה המדיום עליו גדלנו. יש משהו נוח באינטראקטיביות המוגבלת הנדרשת לצפיה בו. לכל היותר נדרשת לחיצה מפעם לפעם על השלט להחלפת ערוץ או אולי על כפתורי ה"עצור" ו"נגן" אם הממיר גם מקליט.

מהרבה בחינות, פייסבוק הוא עוד פחות אינטראקטיבי. למעשה זה כמו ערוץ טלוויזיה יחיד שלתוכו החלטת בעבר באילו יחסים ינוקזו הערוצים החביבים עליך. פייסבוק מחלק את זמן המסך שלך באופן יחסי בין ה"חברים" השונים שלך, למעשה "ספקי התוכן" או הערוצים בהם אתה מעדיף לצפות. גם רוב התוכן ששם הוא לא באמת חומר מקורי אלא  חומרים שאנשים שאתה מכיר חשבו שגם מכריהם ישמחו לראות. בעצם, זה ערוץ טלוויזיה עם colaborative filtering.

חברה כמו google  , מודאגת., בצדק לדעתי, מזה שאנשים בוהים יותר זמן בפייסבוק  מאשר במקומות שבהם היא עצמה מוכרת פרסומות. אך אם התזה שלי נכונה, והאינטראקטיביות הנמוכה הנדרשת מרוב משתתפי פייסבוק היא הסיבה לזמן הרב שהם משקיעים שם, אזי יש ל Google את כל מה שצריך כדי להשאיר את אישוני הצופים לטושים למסכים עליהם מתנוסס הלוגו שלהם.

כל מה שהם צריכים לעשות הוא ממשק חדש ליישומים קיימים כמו למשל Youtube. בממשק זה המשתמש יוכל לשבת ולרות סרטונים מתחלפים בקצב, כמו ערוץ MTV פרטי, על פי העדפותיו – כמו למשך הערוצים אחריהם הוא עוקב, אמנים אותם הוא מחבב, סוגי מוסיקה שהוא מעדיף וכו, והעדפות האנשים שהוא מכיר יכולות לככנס גם הן למיקס.

אותו הדבר יכול להיות ממשק ל Google News. שם החדשות, שוב – על פי העדפות הצופה, המסמן נושאים או אמצעי תקשורת ככאלה בהם הוא מעדיף לראות, יזרמו על פני המסך מלמטה למעלה כמו ticker של בורסה או פס החדשות שבתחתית ערוץ חדשות.

למעשה מדובר פה על שינוי פרדיגמתי בסידור המידע. במקום חלוקה במרחב, שבה המידע מרוכז בחלקים שונים של דף אחדת או במספר דפים שהמשתמש מנווט ביניהם, מדובר כאן בחלוקה של הזמן, שבו המשתמש לא מנווט לשום מקום, והמידע זורם לפניו כמעט ללא התערבות. ואם יש התערבות היא מהסוג של Fast forward, Rewind, skip.

וכדי לגרום למשתמש להישאר עם ה"ערוץ" פתוח,  מתבקש לפתח ממשק שיכול לתפוס את כל המסך או חלקו – למשל פס של Ticker  בתחתית הדפדפן.

וחשוב לאפשר לממשק  להכיל בתוכו גם אירועי סינכרוניים כמו הגעת מיילים או צ'אט, כך שהמשתמש לא יעזוב אותו כדי לבדוק הגעת דואר. הוא עלול שלא לחזור..

זה לדעתי הסוד של פייסבוק. הוא מאפשר לנו להיות couch potatos בחיים של אחרים. אבל מאד קל לספק את אותה הפרדיגמה לכל סוג של תוכן…ומי שיעשה את זה, לפני שפייסבוק יעשו זאת בעצמם, יכול לעצור את פייסבוק מלבלוע את האינטרנט.