בס"ד

 

מבוא למדגמי "כותרת"

מאת דורון ויצטום

 

ההרצאה לפני האקדמיה באביב התשנ"ו, כללה דיווח על כמה עבודות חשובות שנעשו על מדגמים מטיפוס חדש. אכן, קיימים מדגמים טבעיים רבים, שאינם מטיפוס P (ראה הגדרה ב"מבחן הראנדומיזציה"). מהם, בעל מבנה פשוט במיוחד הוא "מדגם כותרת", שבו ביטוי מסוים משמש כ"כותרת", בעוד יתר ביטויי המדגם קשורים אליו.
לדוגמא: ביומן של כיתה ה2 בבית ספר פלוני רשומים שמות התלמידים. הבה ניצור בעזרת היומן רשימת ביטויים כזו, שתהווה בסיס למדגם כותרת. ביטוי ה"כותרת" יהיה: כיתה ה2 בבית ספר פלוני, ואילו ביטויי גוף הרשימה יהיו שמות התלמידים.
כדי לקבל מדגם כותרת מרשימת הביטויים, יש ליצור קבוצה של זוגות ביטויים. הביטוי הראשון בכל זוג יהיה ביטוי הכותרת, ואילו הביטוי השני יהיה שֵם תלמיד מן היומן.
נשים לב, כי כל תלמיד קשור לכותרת, שֶכן לומד הוא בכיתה זו. לעומת זאת, אין הכרח לקיום קשר בין התלמיד ראובן לתלמיד שמעון נוסף על הקשר שהם תלמידי כיתה אחת.

אם נשוב מן הדוגמא אל המקרה הכללי, הרי "מדגם כותרת" ותכליתו הוגדרו במאמרנו על הצופן החבוי בספר בראשית (שנלווה להרצאה באקדמיה) באופן הבא:

- - - מדגם של זוגות ביטויים, שבכל אחד מהם משתתף אותו ביטוי (שיכונה "הכותרת"), ושאר הביטויים קשורים אליו מושגית. המדגם מהווה בסיס לבדיקת מפגשים בין "הכותרת" לכל אחד מן הביטויים האחרים, המופיעים בדילוג שווה.

ההגדרה של מדגמי "כותרת" – אשר שמם הפורמאלי הוא "מדגמים אסימטריים מטיפוס S" – וכן דרך מדידתם, הוכרזו על ידינו כבר באדר התשנ"ד (פברואר 1994 למניינם), במכתב משותף של פרופסור אליהו ריפס ושלי לארבעה מתמטיקאים נודעים שהיו מעורבים קודם לכן בדיונים על מבחן הראנדומיזציה: י. אומן, ק. ג'. ארו (K. J. Arrow), ה. צ'רנוב (H. Chernoff) ומ. קלאס (M. Klass). אכן, אסימטריה היא תכונה בולטת של מדגמים אלה: ישנו ביטוי מועדף – הוא ביטוי הכותרת. לתכונה זו יש כמה השלכות.

מצד אחד, תכונה זו מאפשרת לעשות שינוי מסוים בשיטת הכיול של "מידת הקִרבה" של המפגשים בין "הכותרת" לבין יתר הביטויים המצומדים לה. הפרטים הטכניים ניתנים ב"מדידת מדגמי כותרת". כאן נציין רק זאת, כי הדבר משחרר את ביטוי הכותרת מ"כתונת הכפייה" של הגבלת 5-8 האותיות (שהיא תולדת שיטת הכיול הרגילה).
מצד שני, דווקא אסימטריה זו והמבנה המיוחד של מדגם מטיפוס S גורמים לכך, שאי אפשר ליישם את מבחן הראנדומיזציה שתוכנן על ידי פרופסור דיאקוניס במיוחד עבור מדגם מטיפוס P . אבל, פיתחנו פתרון עבור המצב החדש, וכאשר הכרזנו על מדגמי כותרת, הצבענו גם על הדרך למדוד את המובהקות שלהם, וזאת באמצעות מבחן רנדומיזציה חדש המושתת על עקרונותיו של המבחן המקורי.

במאמרנו הנ"ל היו כמה עבודות חשובות מסוג זה. עיקר תיאורן מיועד לכרך הבא של "צופן בראשית", ואילו כאן יוצגו שתי דוגמאות למדגמי כותרת קטנים, שצצו ועלו בעקבות הניסוי על אישי ספר בראשית ותוך כדי כתיבת "צופן בראשית".

 

א. "בתשרי"

כאשר סרקתי את מקורות חז"ל שבתקליטור "פרוייקט השו"ת" כדי להגיע לתאריכי הלידה והפטירה של אישי ספר בראשית, התקדמתי בחיפוש לפי חודשי השנה. בין השאר מצאתי את המדרש הבא בתלמוד הבבלי:

בתשרי נברא העולם, בתשרי נולדו אבות, בתשרי מתו אבות (מסכת ראש השנה דף י' ע"ב).

ובמקביל, מצאתי בתלמוד הירושלמי את המאמר הבא:

בירח האיתנים שבו נולדו האבות, מתו אבות, נפקדו אימהות (מסכת ראש השנה דף ו' ע"א).

המידע במאמרים אלה מעניין, אך אינו שייך למסגרת הניסוי שערכתי. לאחר שסיימתי את הניסוי הפורמלי על אישי ספר בראשית, עלה בדעתי לערוך ניסוי קטן נוסף, המבוסס על הנתונים בשני המאמרים המשלימים הנ"ל. הגדרתי מדגם מטיפוס 'כותרת', כפי שאפרט לקמן.

הנה הביטויים המבטאים את המאורעות בשני מאמרי חז"ל הנ"ל:

  1. נברא.
  2. העולם.
  3. נולדו.
  4. אבות.
  5. מתו.
  6. אבות.
  7. נולדו.
  8. האבות.
  9. מתו.
  10. אבות.
  11. נפקדו.
  12. אמהות ("אימהות" תוקן ל"אמהות", בהתאם לכללי הכתיב הדקדוקי ששימשו בניסויים הקודמים.)

יש כאן כמה חזרות, וכן כמה ביטויים קצרים מ- 5 אותיות, שאינם יכולים לשמש למדגם (ראה "מדידת מפגשים" סוף סעיף ב').

לאחר ניפוי הביטויים החוזרים והקצרים, רשימת ביטויי המדגם היא:

א. העולם.
ב. נולדו.
ג. האבות.
ד. נפקדו.
ה. האמהות

הכותרת למדגם היא 'בתשרי' – לפי המאמר בתלמוד הבבלי, או 'בירח האיתנים' – על פי המאמר בירושלמי. אבל האפשרות השניה אינה מופיעה כמד"ש בספר בראשית, אף לא כרצף אותיות בטקסט, כך שהיא אינה מעשית. האפשרות הראשונה – "בתשרי" – נמצאת בספר בראשית רק כמד"ש. על כן, נבחרה הכותרת: בתשרי (בדילוג אותיות).

מדגם קטן זה הצליח במובהקות חזקה. אחת משתי הסטטיסטיקות הצליחה בהסתברות של p=0.000173, כך שהמובהקות הכוללת היא p=0.000346, המדידה נעשתה כבכל מדגם כותרת. ראה "מדידת מדגמי כותרת".

 

ב. "רחל"

מתברר כי מדגם "בתשרי" שימש מבוא לרעיון הבא. בסמיכות מקום בתלמוד הבבלי, ישנו מאמר נוסף ובו נאמר כי רחל נפקדה בראש השנה (וכן שרה וחנה). כן מבואר שם, כי פקידת רחל נלמדת מן הביטוי "ויזכר א/להים את רחל - - - " (בראשית ל', כ"ב). בניתי את מדגם הכותרת הבא. ככותרת בחרתי את הביטוי בכתוב "ויזכר א/להים את רחל", ואת רשימת הביטויים קבעתי כדלקמן.

  1. א' תשרי.
  2. בא' תשרי.
  3. א' בתשרי.
  4. נפקדה.
  5. נפקדת.
  6. הנפקדת.
  7. תִפקֵד.
  8. ביוסף.

הסבר: הביטויים מתארים את המאורע ואת עיתויו. שלושת הביטויים הראשונים מביעים את התאריך בדיוק באותן תצורות כמו במדגמים הקודמים. במדגם זה, איני בודק תאריך לידה או פטירה (כפי שנהגתי במדגמים הגדולים) שהם "התמרורים" הטבעיים בכניסתו של אדם לעולם וביציאתו ממנו, ועל כן צירפתי לתאריך את ציון המאורע הנדון – שרחל נפקדה ביוסף. מידת החופש מצטמצמת לבחירת צורת הפועל. לכן בחרתי בכל הצורות: עבר, הווה, עתיד ואף בינוני פעול – ואלה ארבעת הביטויים הבאים ברשימה. הביטוי האחרון, "ביוסף", משלים את תיאור המאורע. כמובן, גם כאן נמדדים רק ביטויים בני 5-8 אותיות, לכן רשימת הביטויים הסופית היא:

א. א' תשרי.
ב. בא' תשרי.
ג. א' בתשרי.
ד. נפקדה.
ה. נפקדת.
ו. הנפקדת.
ז. ביוסף.

אחת משתי הסטטיסטיקות הצליחה בצורה חדה: ההסתברות לדירוג הגבוהה שלה היה p=0.0000295, כך, שלאחר פירעון 'מס בונפרוני' (הכפלה ב-2) מתקבלת מובהקות כוללת של p=0.000059. (ראה ב"מדידת מדגמי כותרת" את פרטי המדידה).

 

חזור לראש הדף


 
אודות האתר אודות המחקר פרסומים מדעיים מאמרי מחקר ספרים ההתנגדות למחקר מה חדש? English
© כל החומר באתר זה, בעברית ובאנגלית, שחובר בידי דורון ויצטום, נכתב במקורו בעברית.
זכויות היוצר של החומר המוצג באתר זה [למעט חומר שיוצר(י)ו האחר(ים) יוזכר(ו) במפורש],
הן של דורון ויצטום, ת.ד. 16409 ירושלים, ישראל.