להציל את האות המתה


האינטרנט התחיל, בעצם, כפלטפורמה משודרגת לטקסט. תחילה, של מאמרים מדעיים, בעיקר של פיזיקאים. אפילו ראשי התיבות של הפרוטוקול שעליו מבוססת רשת האינטרנט – HTTP, הם Hypertext Transfer Protocol. כך, האפשרות להפוך כל קטע טקסט לקישור אל מסמך אחר, הפך את האינטרנט לספריה הגדולה וגם היעילה ביותר בעולם.

עם הופעת מנועי חיפוש יעילים, נהיה אפילו יותר קל למצוא ספר ברשת מאשר לגשת לחדר הסמוך ולחפש אותו על המדפים. ולבטח שיותר קל למצוא קטע ספציפי בטקסט הרשת מאשר בספר, גם אם הספר כבר מונח פיזית על ברכיך. אבל בשביל שזה יקרה, הספר היה צריך להיות בפורמט של טקסט שמחשב יכול לקרוא, לא כתמונה (שאדם יכול לקרוא).

סוג המידע "טקסט" הפך אט אט לאזרח מדרגה שנייה ברשת, שני למידע חזותי: תמונות וסרטי ווידאו. אין כנראה הרבה כסף להרוויח מעיבוד של טקסט. לא כמו שאפשר למשל לעשות מהאפשרות להקפיץ לאנשים לשדה הראיה פרסומת או "מידע שיווקי", מה שדוחף טכנולוגיה כגון זו של מציאות רבודה, Augmented reality. יש ל Augmented reality אמנם מרכיב של טקסט, בעיקר תרגום משפה לשפה המיועד לקהל של תיירים.Text_Recognition_and_augmented_Reality

אותי היחס הזה לטקסט מטריד. ברשומה הזו אני מנסה לדמיין את "הדבר הבא בטקסט".

קצת רקע: אני קורא לא מעט במחשב, ורוב החומר הזה נמצא בפורמט של PDF , פורמט השייך לחברת Adobe. זו שהצליחה לגרום לרוב העולם לאמץ את הפורמט הזה. היא מחלקת בחינם תכנה לקריאת הפורמט הזה, ומנסה לייצר הכנסות מכל מי שמנסה לייצר מסמכים בפורמט הזה.  לפחות זו הייתה הכוונה המקורית, אבל אני סקפטי אם זה עבד עבורם. כי כיום יש אינספור דרכים לייצר מסמכי PDF בלי לשלם לאף אחד. יש גם תכנות לקריאת PDF העולות פי כמה באיכותן של זו של  Adobe.

עדיין, אותה השאיפה הנושנה והנכזבת של Adobe לייצר רווח גורמת לחלק גדול מהטקסט שנמצא בפורמט הזה להיות בלתי שמיש. בנוסף, יש לקבצים האלה אוסף מגוחך של הרשאות שיוצר המסמך יכול לקבוע באופן בלתי הפיך, כמו חסימת האפשרות להעתיק חלק מהטקסט, לשנות בו דברים או להדפיס אותו. שוב, דברים שאולי פעם נראו לאנשים חשובים, אך היום רק כולאים ים של טקסטים בתוך פורמט שלא מאפשר לעשות הרבה דברים חשובים.

ויש עוד דבר מאד מהותי לפורמט של קבצי PDF. בניגוד לקבצים של ספר אלקטרוני, PDF הוא מוכוון נייר. הפורמט משמר הן את סידור הטקסט והן תמונות הנלוות אליו, על דף נייר בגודל מסוים. אפשר להגדיל או להקטין את גודל האותיות על המסך, אבל אורך השורות לא הולך להשתנות – הטקסט או שיגלוש מהמסך אם הגדלת יותר מדי, או לא יתפוס את כל רוחב המסך אם לא הגדלת מספיק. אם יש על הדף כמה טורים של טקסט, אין בנמצא תכנה שאני מכיר שתגלול לך את הטקסט טור אחרי טור על גבי מסך צר למשל, כמו של טלפון. הטורים תמיד ישארו האחד ליד השני, ואתה אמור לסרוק את הדף מעלה-מטה והצידה, כך שכדאי שתהיה לך תפיסה מרחבית טובה…

וכמובן שאין אפשרות לשנות את הגופן לכזה שיותר נוח לך בעין. אם מישהו החליט הפקת מסמך באיזשהו גופן ביזארי (כל מה שהוא עם סריף, לדעתי), אז זה מה שיש. כך תקרא את המסמך.

רוב הטקסטים שיש לי הם בעצם תמונות של טקסט, תוצר של סריקה ברזולוציה נמוכה מדי מכדי שתוכנה תוכל לזהות את מראית האותיות כטקסט בעל משמעות, ולכן אי אפשר למשל לחפש בטקסט מילה כזו או אחרת. אבל ככה זה כשרוצים קבצים שאפשר לשתף בקלות, למשל בדואר אלקטרוני. ברזולוציה קצת יותר גדולה תכנה כן מסוגלת לפחות לזהות את השורות של הטקסט כך שאפשר לפחות "למרקר" קטעי שורות – תהליך החיוני לרבים במהלך של קריאה לצורך הבנה. לפעמים אפשר אפילו לבחור מילים בודדות. אבל זה לא אמין.Fullscreen capture 09042014 110114

אם רוצים שהתכנה תוכל לזהות את הטקסט כטקסט, מה שנקרא OCR(optical character recognition) צריך לסרוק את המקור ברזולוציה ממש גבוהה ולייצר קבצי ענק שקשה לשתף, אבל אם זיהוי הטקסט היה עובד כמו שצריך (והוא לא), אז מיד אחרי הזיהוי, הקובץ היה הופך לקובץ קטן ביותר וקל לשיתוף.

חשבתי על דרכים בהם אפשר להפוך את "טקסט" לאזרח יותר שווה זכויות בעולם הדיגיטלי, זה שכיום עיקר ההשקעה ותשומת הלב בו היא בדימויים – ווידאו ותמונות. אני חושב שרוב המרכיבים של מה שאני הולך לתאר כבר קיימים במקומות אחרים.

אני מודע שמעבר לחסמים הטכנולוגיים, כמו יכולת שרחוקה מלהיות מושלמת של זיהוי ממוחשב של אותיות בתמונה (OCR) ברוב השפות, (קצת יותר טוב באנגלית) ותרגום אוטומטי שמייצר בדרך כלל גיבוב אותיות חסר משמעות, ישנם חסמים לא טכנולוגיים לא מבוטלים, כמו זכויות יוצרים, שקצצו מאד בכנפי פרויקטים מושקעים ועתירי טכנולוגיה כגון google books. ברור לי שכל שירות של טיפול בטקסט חייב לספק תגמול הוגן לאנשים שהשקיעו בכתיבה, תרגום, עריכה והוצאה לאור. אנסה להציע פה פתרונות הוגנים.

מה שהייתי רוצה לראות הוא סוג של שירות, כמו למשל השירותים שחברת google  מציעה: של מפות, או דואר אלקטרוני. או מערכת כמו של tripadvisor שבה קהל הגולשים מדרג בתי מלון, מסעדות ואתרי תיירות. שירות שיאפשר את הדברים הבאים:

0.0 – רוב הטקסטים הסרוקים, נסרקו כאשר ספר מונח, פניו מטה, על משטח הזכוכית של הסורק. מה שאומר שכל שני עמודים מנוגדים, הפכו להיות עמוד אחד מבחינת התכנה. אפשר לראות את זה כ"טורים", ולא פעם גם כל אחד מהעמודים בעצמו מחולק לטורים. כשקוראים ספר שכזה, ורוצים שטור אחד ימלא את כל המסך, משמעות הדבר היא מין דפדוף מסובך, שחלקו הזזה ימינה ושמאלה וחלקו דפדוף מעלה מטה. אבל כל כך פשוט לזהות שכל אחד מהריבועים של טקסט שעל מה שהקובץ המקורי חושב שהוא עמוד, או טור, הוא בעצם עמוד בפני עצמו, וכך לאפשר מעבר פשוט מעמוד לעמוד רק על ידי דפדוף…רלוונטי במיוחד למכשירים בעלי מסך קטן מ 14 אינצ'ים.Presentation1-001

0.1 – בכלל, כל השטות הזו של "עמוד" היא שטות מימי הנייר. כשמסמך נקרא בפורמט אלקטרוני, הרבה יותר פשוט ונוח לקרוא כאשר שורות הטקסט נגללות באופן אחיד. אפשר לשמור את מספרי העמודים המקוריים בשולי הטקסט, למי שרוצה, ואפשר לאפשר למי שרוצה להדפיס את הטקסט על פי העימוד המקורי, או להתאים את ההדפסה לגודל דף הנייר וקנה המידה. אבל בשביל לבטל את החלוקה לדפים, צריך לפחות לזהות את שורות הטקסט, גם ללא זיהוי האותיות שבהן.

0.2 – הפרדת ים הפיקסלים שבכל דף לאלמנטים תחביריים מובחנים: פרקים, פסקאות, שורות ומילים. גם ללא זיהוי של האותיות עצמן שהוא תהליך יותר קשה. עצם הייצוג כמילים ומשפטים מאפשר הצגה גמישה של הטקסט על אמצעי תצוגה שונים, בעלי גדלי מסך שונים: מטלפון, דרך טאבלט, מחשב אישי נייד, מסך מחשב גדול, טלוויזיה. בלי צורך להזיז את תמונת הטקסט ימינה ושמאלה בכל שורה.

1 – שדרוג קבצי טקסט, גם כאלה שנסרקו באיכות ירודה, לטקסט קריא, שבו זוהו האותיות, כך שאפשר לחפש בו ואולי גם לערוך אותו. קשה קצת יותר, אך יש לי רעיונות (בהמשך) איך לעשות את זה.

2 – מערכת לשיתוף של הערות ופרשנות לטקסטים. זו אינה מערכת שיתוף של טקסטים שיש בה בעייתיות חוקית. זו מערכת שבה לכל מי שיש עותק של טקסט מסויים, יש גישה לכל ההערות והפרשנות שאנשים הוסיפו לטקסט זה,  עם מערכת דירוג שתוכל לעזור לאנשים לדעת בקלות לאיזה הערות כדאי להם להתייחס.

3 – אפשרות לקַשֵר בין גרסאות של הטקסט בשפות שונות; ברמת המילה או לפחות ברמת המשפט, עם יחס מיוחד לשפת המקור. כולל אפשרות להתמודד עם מספר תרגומים לאותה השפה או עם מספר גרסאות של הטקסט – אפילו בשפת המקור. (הכוונה כאן אינה לתרגום ממוחשב של טקסטים – הטכנולוגיה לזה לא באמת קיימת.)

כדי שאפשר לעשות את 2 ו 3, על ה"טקסט" לחזור ולהיות טקסט, בפורמט שמחשב יכול לקרוא – כלומר – אותיות ולא פיקסלים. קבצים שבהם הטקסט הוא רק תמונה לא מאפשרים את זה. אבל כדי שתמונה תהפוך טקסט, עליה להיות באיכות מספיק טובה ורוב קבצי הטקסט הם לא כאלה. חלקם אפילו נסרקו כשספר הונח פתוח על זכוכית הסורק, לא מפורק, וקצות השורות בעותק הסרוק מתפתלות כלפי מטה (או מעלה), כך שאפילו לבני אדם קצת קשה לקרוא את האותיות שבקצה השורה. לא אחת, יש חלקים של הדף שחסרים, או ששורות הטקסט לא מקבילות לקצה העותק הסרוק. בעיה.

בעיה שיכולה להיפתר על ידי ריבוי משתמשים. יש הקוראים לזה "מיקור המון" (crowd sourcing).

למחשב קשה אמנם לזהות באמינות גבוהה כל אות ואות בדף, אבל יחסית קל לו לזהות שדף מסוים בעותק של ספר שהוכנס למערכת על ידי משתמש אחד, זהה לדף שמשתמש אחר הכניס בעותק אחר של אותו הספר. שני הקבצים לא חייבים היו להיסרק באותו כושר הפרדה (רזולוציה), ואפילו לא חייבים להכיל בדיוק אותו מספר עמודים. אבל אם יש את אותו הדף בשני קבצים שונים, גם אם באחד מהם הדף אולי הונח קצת עקום ובשני חלק מהשורות נקצצו או מתעקלות לקראת סופן, אפשר לגלות באופן אוטומטי שמדובר באותו הדף. ישנם מספר אלגוריתמים בתחום הראיה הממוחשבת המאפשרים לייצר "חתימה" ייחודית מתמונה, וכל דף של טקסט אפשר לראות אותו כתמונה, כך שעותקים שונים של אותו הדף, גם אם הם נסרקו אחרת (למשל כפי שתואר מעלה) יפיקו חתימות שהן מספיק קרובות בכדי שאפשר יהיה למצוא את כל העותקים של כל דף, מתוך כל העותקים שבכל הקבצים שכל המשתתפים "הביאו" אל המערכת. פה דווקא באה לעזרה העובדה שבקבצי PDF איו למשתמש יכולת לשלוט בעיצוב, כמו למשל להחליף גופן או לשנות את רוחב השוליים.

כעת, די בכך שאחד העותקים של הדף הוא כבר בפורמט של טקסט של ממש, או לפחות תמונה באיכות ממש גבוהה כך שאפשר לזהות בה כל אות ואות באמינות גבוהה, אזי אפשר "לפענח" בהצלחה גם כל עותק אחר של הדף, גם אם הוא באיכות ירודה, חסר או עקום. אפשר להחזיר למשתמש שסיפק עותק ירוד שכזה, את הטקסט שהושג מהגרסה הכי איכותית של אותו הדף. אם יש תמונות או דימויים בדף, גם איכות אלה יכולה להיות משופרת בעותק המשודרג.

נקודה חשובה היא שאין מספקים לאף משתמש טקסט שלא היה לו מלכתחילה, רק גרסה משודרגת של הטקסט שכבר יש לו, שאותו הוא יכול היה לקרוא גם קודם – רק לא באופן ממוחשב. ואין זה מעניינה של המערכת איך הושג אותו העותק. מרגע שלמשתמש יש עותק כלשהו של דף, הוא קנה לעצמו את הזכות לשדרג את איכות הטקסט בדף זה, וליהנות מכל התכונות שהמערכת שתתואר כאן מספקת.

גם אם כל הדפים הקיימים במערכת, שזוהו כעותקים של דף מסוים קיימים רק בגרסאות של תמונה (image), אזי יש עדיין טכניקות, שוב מתחום הראיה הממוחשבת או טכניקות המשמשות להגדלת האיכות של וידאו ולהפקת תמונות איכותיות ממנו (super-resolution) המאפשרות, על ידי מיזוג המידע התמונתי ממספק עותקים של הדף, לייצר תמונה מאוחדת של הדף שבה יש יותר פרטים ושאת האותיות בה אפשר לזהות באמינות יותר גבוהה. ככל שיהיו יותר משתמשים, שיספקו יותר עותקים של אותו דף טקסט, כך יקל יותר יהיה לייצר עותק איכותי של הדף. וכך, כל אחד מהמשתמשים שסיפקו עותק, יקבל עותק משודרג, קריא יותר, כזה שבתכולתו אפשר לחפש, אפשר לסמן, אפשר להעביר למעבד תמלילים ולערוך.

וכאן אני מגיע לחלק היותר משמעותי של המערכת – מה אפשר לעשות עם הטקסט כשהוא כבר נגיש כטקסט, כאותיות, לא רק כתמונה.

אפשר כאמור להעביר אותו למעבד תמלילים, ואז להכניס לתוכו תוכן נוסף, הערות, קישורים רלוונטיים, פרשנות. אבל אז, הטקסט מאבד את הקשר עם קהילת הקוראים שלו. מאותו הרגע, כל איש לעצמו. כל הכוח של "חכמת ההמונים", של הרשת, כבר לא זמין יותר לקורא אותו טקסט מרגע זה.

לכן, חייבים מערכת המספקת את הכלים להוספה של "מטא-טקסט" לטקסט: הערות, הסברים, קישורים, הדגשות של קטעים משמעותיים, מילון מונחים המוזכרים בטקסט ועוד, אבל כך שאפשר להפריד בבירור בין המקור לתוספות, שיהיה ברור מיהו המחבר של כל אלמנט טקסטואלי. במערכת שכזו, כל מי שניגש למערכת עם עותק כלשהו של הטקסט, יכול ליהנות מכל העושר המצטבר של כל אותו ערך מוסף שהוסף לטקסט על ידי כל קהיליית הקוראים שלו. אלא שכדי שהקורא לא יטבע בים של תוספות חסרות ערך, חייבת להיות מערכת של דירוג איכות ההערות, על ידי קהילת הקוראים עצמה. לא רעיון חדש, דווקא כזה המיושם ברוב השירותים של תוכן המסופק על ידי "הגולשים", המשתמשים בעצם.

סוג אחד של מטא-טקסט שבו אני משתמש לא מעט, והייתי רוצה לראות יותר ממנו, הוא האזכור בסוגריים בתוך הטקסט (או בהערות שוליים, או בהערות בסוף הספר) של המונח בשפת המקור שהמתרגם חשב, בדרך כלל בצדק, שהבאתו תסביר יותר טוב את הדברים. בעיקר כאשר אין מילה מקבילה בשפה אליה תורגם הטקסט כולו. דוגמאות רבות לכך יש בטקסטים של פילוסופים גרמניים ששפתם עשירה בתחיליות וסיומות המאפשרות ליצור משורש אחד ריבוי גדול של מילים שמשמעותן שונה אך כולן קשורות בטבורן לאותו שורש. ברוב השפות האחרות, מילה אחת מסוג זה מיתרגמת לשלוש-ארבע מילים, תכופות מחוברות במקפים, ועדיין, זה לא ממש זה.

אם נדקדק, אין באמת בשום תרגום, משום שפה לשום שפה, שום מילה שיש לה מקבילה זהה לחלוטין בשפה השנייה. יש תמיד הבדלי ניואנסים הנובעים מהבדלי התרבות בין דוברי השפות השונות. וולטר בנימין, כשהוא כותב על "שליחותו של המתרגם" (שתורגם כ"משימתו של המתרגם") מביע כדוגמה את המילה "לחם" בגרמנית וצרפתית. חישבו על זה, מה עובר לגרמני ולצרפתי בראש כשכל אחד מהם חושב על המילה "לחם" בשפתו שלו. אין להשוות.

אחד הדברים שאני מוצא מאירי עיניים במיוחד הוא לקרוא את "הקדמת המתרגם" לספר. ההתעכבות הזו על לבטיו של המתרגם היא לא אחת הקדמה מצוינת לספר עצמו. היא מאפשרת הבנה טובה ביותר של הטקסט המתורגם. אבל לפעמים אין ברירה, ואני מוצא את עצמי יושב עם התרגום לעברית ולידו "פתוחים" (בחלונות. טוב, זה במחשב) התרגום לאנגלית ולפעמים גם המקור בגרמנית או בצרפתית. שפות שאני לא ממש קורא. עדיין, ראיית המונחים במקור, או בתרגום האחר, מוסיפה המון להבנת הטקסט, גם כאשר התרגום סביר. כאשר התרגום היה סביר לזמנו אך כבר לא סביר היום, כמו הרבה מאותם "תרגומי המופת" לעברית שנעשו לפני חמישים ושישים שנה, ההשוואה לתרגום עדכני יותר, אפילו בשפה אחרת, היא כלי מצוין.

וכאן אני מגיע לחלק השלישי של המערכת שהייתי רוצה שמישהו יבנה. האפשרות לקשר בין גרסאות שונות של אותו הטקסט, באותה השפה או בשפות אחרות. ראיתי דוגמה לא רעה לממשק כזה כאשר google translate  מתרגם דף אינטרנט.Fullscreen capture 02042014 165435

כאן צריכה לבוא הסתייגות: הרבה יותר קל לשייך משפט מתורגם למשפט בשפת המקור כאשר התרגום הוא ממוחשב – למרות שהתרגום הממוחשב כלל אינו קריא ובעל משמעות ברוב המקרים, הוא לפחות מתרגם משפט למשפט, ומאפשר לשמור על הקשר ביניהם. תרגום אנושי לא תמיד ישמר את סימני הפיסוק כך שיהיה יותר קשה להצמיד מקור לתרגום. קשה, אבל אפשרי, אם לא ברמת המילה אז ברמת המשפט. אם לא ברמת המשפט, אז ברמת הפיסקה. איך לעשות את זה? על בסיס אותם העקרונות של תרגום ממוחשב, אפשר באופן אוטומטי, באחוזי הצלחה לא רעים לדעתי, להתאים שורה מתורגמת לשורת מקור. ביחוד באם עוברים על הטקסט מתחילתו, ומניחים שברמת הפרק יש תיאום מלא בין המקור לתרגום וברוב המקרים גם ברמת הפיסקה. זה לא יהיה מושלם, אך במערכת המשלבת תכנה עם חוכמתם השיתופית של המשתתפים, שבה המערכת מסמנת את המקומות שבהם היא לא בטוחה בהתאמה ומאפשרת למשתמשים לתקן, להוסיף או להעיר, אפשר להגיע לאחוזים גבוהים של התאמה. אין צורך בהתאמה מלאה כי עדיין, כל גרסה של הטקסט עומדת בפני עצמה, וההתאמה לשפה האחרת היא משהו מאד מועיל, אך אי התאמה פה ושם לא גורעת משמעותית. כי אין מדובר פה בתרגום אוטומטי – התרגום כבר קיים, ונעשה ביד אנוש.

מערכת כזו שבה כל הגרסאות, בכל השפות, קשורות זו בזו בקשר בלתי אמצעי יכולה לקרב את חזונו המיסטי משהו של וולטר בנימין, של התקרבות לאותה שפה מושלמת שאבדה לנו עם התמוטטות הפרויקט של מגדל בבל. בנימין רואה כאידאל את הגרסאות של כתבי הקודש שבהן משולבות גרסת המקור והתרגום ברמה של שורה -שורה. או בלשונו:

Denn in irgendeinem Grade enthalten alle große Schriften, im höchsten aber die heiligen, zwischen den Zeilen ihre virtuelle Übersetzung. Die Interlinearversion des heiligen Textes ist das Urbild oder Ideal aller Übersetzung.

אפשר לחשוב גם על מערכת כמו זו המתוארת מעלה שתאפשר תרגום מבוזר של טקסטים, בעזרת ציבור גדול של גולשים. אבל זה דורש מחשבה נוספת. רק רעיון, קצת יותר בוסרי מהאחרים שפה.

ואחרון אחרון חביב: איך לגרום לבעלי הזכויות על הטקסט המקורי ועל תרגומיו לרצות להיות חלק מהמערכת הזו ולא לחסום אותה?

נתחיל בזה שבמערכת הזו, לא נוצרים עותקים חדשים של טקסטים. לכל משתמש יש גישה רק לדפים שהוא "הביא עמו מהבית". אין טעם להידרש לשאלה אין הוא השיג אותם, והמערכת צריכה להניח שהוא הגיע לידיו כחוק: קנה ספר, וסרק אותו. או שקיבל אותו ממערכת הטקסטים של אוניברסיטה, כחוק, לצורך לימודיו (אפשר לסרוק עד 20% מהספר, וברוב המקרים, יש הקפדה על כלל זה.) המשתמש מקבל עותק משודרג בהרבה של הדפים שאתם הגיע, אבל זה עדיין אותו החומר.

ועדיין, מערכת כזו צריכה לתמרץ את בעלי הזכויות לשתף בה חומר. למשל, אם מו"ל מעלה למערכת גרסת טקסט מלאה (אותיות) של ספר, והוא היחידי שעשה כן, אזי המערכת יכולה לגבות מהמשתמשים תשלום קטן עבור ההמרה של דפים מתמונה לאותיות ולהעביר אותו למו"ל. ועדיין, אף אחד לא מקבל דפים של טקסט שאין לו מלכתחילה. העותק השלם של הספר נשאר מוגן במערכת.

המו"ל מקבל בנוסף אפשרות למַעֵן בחומר פרסומי את הקהל המעוניין בטקסטים שאותם הוא מוציא לאור, ויכול גם להציע להם לרכוש את החלקים של ספרים שעדיין אין להם (כמו שהוצאת Lonely Planet מציעה לרכוש פרקים בודדים של מדריכי הנסיעות שלה). יתירה מזאת, כל אותו ה"מטא-טקסט" שהמשמשים יוסיפו מוסיף ערך לספר שהמו"ל השקיע כסף בהוצאתו לאור.

אם המוציאים לאור היו ממספרים את העותקים המודפסים, הייתה גם אפשרות להעלות למערכת דף המכיל את המספר הסידורי של הספר, ובכך להוכיח בעלות שתאפשר למו"ל לתת או למכור לך במחיר סמלי, עותק דיגיטלי של הספר.

יש מודלים אחרים, כמו למשל ה Kindle של אמזון, שמיועדים למי שמוכר טקסטים. אבל הם לא ממש רלוונטיים לכאן, כי המערכת של שדרוג טקסטים לא מיועדת להפצת טקסטים או מכירתם, רק לשדרוגם של טקסטים קיימים, בעיקר כאלה שהחלו את חייהם כעותק מודפס.

האם זה יספיק? לא יודע. צריך אולי מישהו כמו סטיב ג'ובס (איפה הוא כשצריך אותו…) לשכנע את בעלי הזכויות לטקסטים להסתגל לעולם החדש הזה. זו הייתה הגאונות האמתית שלו, לא יכולת המצאה טכנית. Google books הסתבך קשות עם הפרויקט הזה, של המרת כל אותה אות מתה לאות דיגיטלית, שאתה אפשר לעשות דברים. והם עשו זאת בתקציבי ענק. אבל גוגל היא (לדעתי) פשוט חברת התכנה הגרועה בעולם.

עד שיגיע חזון אחרית הימים הזה, אפשר לפחות להשתמש בתכנה יותר מוצלחת מזו של אדובי לקריאת ויצירת קבצי PDF, שיש לה גם גרסה חינמית לא רעה. נסו את PDF-XChange Editor.

והנה כמה ספרים בפורמט PDF שהצטברו אצלי.

6 מחשבות על “להציל את האות המתה

  1. פינגבק: על מצוקת מדעי הרוח | דרכי עצים

  2. פינגבק: למה ההקדמה ממוספרת בספרות רומיות | דרכי עצים

  3. פינגבק: נשמע טוב, אבל נראה רע | דרכי עצים

להשארת תגובה