top of page
חיפוש

איך Tolan בנתה אפליקציית קול המותאמת לשיחות פתוחות ומתמשכות באמצעות GPT-5.1

חברת OpenAI דיווחה כי הסטארט אפ Tolan, מבית Portola, בנה אפליקציית קול שמכוונת לשיחות פתוחות ומתמשכות על בסיס GPT-5.1. החברה תכננה את המוצר סביב שיחה חיה ומתפתחת ולא סביב רצף פקודות קצרות. הממצאים כוללים שיפורי ביצועים מדידים, ירידה של 30% בהחמצות זיכרון ועלייה של יותר מ 20% בשימור משתמשים ליום המחרת.


איך Tolan בנתה אפליקציית קול באמצעות GPT-5.1

חברת Tolan מיקדה את הארכיטקטורה ב 3 נקודות חיכוך שמאפיינות שיחות קול: תנודתיות גבוהה בנושא, רגישות קיצונית להשהיה, והצורך בזיכרון עקבי לאורך זמן. החברה בחרה לעבור מגישה שממחזרת הנחיות בין סבבים לגישה שמרכיבה מחדש הקשר בכל תור. גישה זאת נועדה להתמודד עם מצב שבו משתמש משנה נושא באמצע משפט ועדיין מצפה לרצף, לטון עקבי ולהבנה של פרטים אישיים שנאמרו בעבר.

חברת Tolan בונה בכל פנייה חלון הקשר מחדש מאפס. החברה משלבת בכל חלון הקשר תקציר עדכני של השיחה, כרטיס פרסונה יציב, זיכרונות שנשלפו ממאגר וקטורי, הנחיות טון, ואותות בזמן אמת שמגיעים מהאפליקציה. החברה דיווחה כי השחזור התורי מצמצם סטיות בטון ומאפשר מעבר חלק בין נושאים בלי לאבד רצף ובלי לנפח פרומפטים לאורך זמן.

חברת OpenAI ציינה כי המעבר ל GPT-5.1 ול Responses API קיצר את זמן התחלת הדיבור ביותר מ 0.7 שניות. החברה התייחסה למדד זה כמדד מורגש ישירות בשטף השיחה, מפני שמשתמשים תופסים השהיות כגמגום מערכתי ולא כחשיבה. החברה השתמשה ביעד תגובתיות תת שנייתית כחלק מתכנון חוויית המוצר ולא רק כיעד תשתיתי.


זיכרון וקטורי מהיר, שליפה ממוקדת ודחיסה לילית

חברת Tolan מטמיעה את מודל ההטמעות text-embedding-3-large של OpenAI ושומרת את הווקטורים ב Turbopuffer כדי לאפשר שאילתות מתחת ל 50 מילי שנייה. החברה לא מנסה לשמור זיכרון כטקסט גולמי ארוך, אלא כמאגר שליפה שמחזיר רק את הפריטים הרלוונטיים לרגע הנתון. החברה מפעילה שליפה בכל תור באמצעות ההודעה האחרונה של המשתמש וגם באמצעות שאלות סינתטיות שהמערכת מייצרת, למשל מי בן הזוג ומה היעד הבא.

חברת Tolan מאחדת את תוצאות השליפה ומדרגת אותן לפי Mean Reciprocal Rank. החברה מריצה בלילות תהליך דחיסה שמנקה פרטים שוליים ומיישב סתירות כדי לשמור על איכות זיכרון גבוהה לאורך זמן. החברה דיווחה כי השילוב בין שליפה מהירה לדחיסה יזומה מפחית הצטברות רעש בזיכרון ומגן על חוויית השיחה גם אחרי שבועות של שימוש.


אישיות כמרכיב מוצר, ולא כקישוט תוכן

חברת Tolan תיארה ניהול אישיות באמצעות שלד דמות שנכתב על ידי סופר מדע בדיוני ונבחן עם חוקרת התנהגות. החברה הוסיפה מנגנון שמנטר את האפקט הרגשי ומאזן בין שובבות לאיפוק בהתאם לרמזי המשתמש. החברה טענה כי GPT-5.1 שומר טוב יותר על הנחיות רב שכבתיות, כולל פחות סטיות בטון, כיבוד עקבי של תכונות הדמות והיצמדות טובה יותר לזיכרון.

חברת Portola מדדה את ההשפעה המעשית בשני מדדים תפעוליים. החברה דיווחה על ירידה של 30% בהחמצות זיכרון על בסיס אותות תסכול באפליקציה. החברה דיווחה גם על עלייה של יותר מ 20% בשימור משתמשים ליום המחרת לאחר השקת הפרסונות החדשות.

חברת Tolan דיווחה כי מאז ההשקה בפברואר 2025 היא הגיעה ליותר מ 200 אלף משתמשים חודשיים פעילים. החברה דיווחה על דירוג 4.8 כוכבים ועל יותר מ 100 אלף ביקורות ב App Store. החברה הציגה נתונים אלה כעדות להתאמת המוצר להרגל שימוש יומיומי ולחוויית שיחה שמחזיקה לאורך זמן.


מה ארגונים יכולים ללמוד ואיך משכפלים לתהליכים דומים

חברת Tolan מדגימה שינוי פרדיגמה שמתחבר ישירות לתהליכים עסקיים מבוססי שיחה, כמו שירות לקוחות, מכירות, תיאום תורים ותמיכה פנימית. חברה שמבקשת לשכפל תוצאות דומות יכולה להתחיל מ 4 החלטות תכנון: בניית הקשר מחדש בכל תור במקום הצמדת פרומפטים, טיפול בהשהיה כמדד מוצר, הפיכת הזיכרון למערכת שליפה עם דחיסה מחזורית, ותכנון פרסונה כסטנדרט תפעולי שמפחית חריגות ומייצר אמון.

חברה יכולה למדוד הצלחה בצורה דומה למקרה של Tolan באמצעות מדדים שניתנים לאיסוף באפליקציה או במוקד. חברה יכולה להגדיר החמצות זיכרון באמצעות אותות תסכול, חזרות משתמש, או תיקוני משתמש לאחר תשובה שגויה. חברה יכולה לקשור השהיה למדדי נטישה בשיחה, זמן טיפול ממוצע והסלמה לנציג אנושי. חברה יכולה לבנות ניסוי מבוקר שבו בוחנים שינוי פרסונות מול קוהורט, בדומה להשקה שהובילה אצל Tolan ליותר מ 20% שיפור בשימור ליום המחרת.

חברה צריכה לסייג כי ביצועי קול בעברית עדיין דורשים ולידציה רחבה יותר, במיוחד בשילוב STT ו TTS לאורך שיחות ארוכות, במבטאים שונים וברעשי רקע. מהניסיון שלנו בשטח, הטמעות מודלי STT ו TTS במספר פרויקטים כבר מתחילות להיראות טוב גם בעברית, אך עדיין נדרשת עבודה על יציבות, השהיה, וזיהוי ישויות ושמות פרטיים. חברה שמיישמת את העקרונות של Tolan יכולה להתקדם מהר יותר גם בעברית, בתנאי שמקימים שכבת מדידה, בדיקות איכות ושיפור מתמיד על נתוני אמת.

חברת Tolan הצהירה כי הצעד הבא מתמקד בהיגוי מדויק וזיקוק הזיכרון, כולל דחיסות טובה יותר, לוגיקת שליפה משופרת וכיוונון פרסונות מורחב. החברה מכוונת לסוכני קול רב מצביים שמאחדים קול, ראייה והקשר למערכת אחת שאפשר להכווין בעדינות. חברת Portola ציטטה את המנכ ל קווינטן פארמר שאמר כי GPT-5.1 נתן לחברה את יכולת ההיגוי שהייתה נחוצה כדי להביא את הדמויות לחיים.

חברה שמעוניינת ליישם סוכן קול לשיחות מתמשכות יכולה להתחיל בפיילוט ממוקד תהליך אחד, למדוד השהיה מקצה לקצה, להקים מאגר זיכרון וקטורי עם מדיניות דחיסה, ולהגדיר פרסונה וסט כללים למדיניות שיחה. ארגון שמטמיע זאת נכון עשוי לראות שיפור מוחשי בשימור, באמון וביעילות תפעולית, במיוחד כאשר השיחה מחליפה תפריטים, טפסים ושיחות חוזרות.

bottom of page