ניתוח טבלאות מורכבות עם AI: המדריך לייעול דוחות

Kuzmanko Team
25 במרץ
זמן קריאה 4 דקות

טבלאות ארגוניות נראות על פניו כמו נתונים מסודרים, אבל במציאות חלק גדול מהמידע הקריטי נמצא בדוחות אקסל ו- PDF עם כותרות מרובות שורות, תאים ממוזגים, היררכיות ותתי קטגוריות. צוותי כספים, תפעול ורכש משקיעים שעות בהבנה ידנית של מה הטבלה באמת אומרת, ואז עוד שעות בהכנה למערכת BI, או בבדיקות ידניות מול מספרי אמת.

שיטות AI נפוצות מתקשות בדיוק בנקודה הזאת. גישת המרה לשאילתות SQL דורשת להפוך את הטבלה למבנה קשיח ולעיתים מאבדת הקשרים שמופיעים רק בפריסה. גישת מודל שפה שמקבל טבלה כתמונה או כטקסט מחזירה תשובות שנראות סבירות, אבל עלולות להחמיץ יחסי הורה ילד, או לפרש לא נכון עמודות שמוגדרות תחת כותרת על. אז איך ניתן לבצע ניתוח טבלאות עם AI בצורה יעילה ואפקטיבית? זווית של טבלאות חצי מובנות.

מחקר חדש מציג את ST Raptor, מערכת סוכנית למענה על שאלות מעל טבלאות חצי מובנות, שבה המשמעות נשענת גם על הפריסה והמבנה. גישה זו מכוונת להפוך שאלות נקודתיות על טבלאות מורכבות למשהו שניתן לעשות בשירות עצמי, עם דיוק גבוה יותר ויכולת בקרה אנושית כשצריך.

ניתוח טבלאות עם AI או איך AI משנה עבודה עם דוחות ו- BI

טבלה חצי מובנית היא טבלה מורכבת שבה המבנה הוא חלק מהמידע. כותרת על שמכסה כמה עמודות, כותרת שמופיעה בשתי שורות, הערות שוליים שמסבירות חריגה, או תא ממוזג שמגדיר קבוצה, כל אלה מייצרים לוגיקה שלא מופיעה כשדות ברורים. ארגונים פוגשים את זה בדוחות הנהלה, דוחות תקציב מול ביצוע, דוחות ספקים, טבלאות רגולציה, ודוחות איכות ותפעול שמופקים ממערכות שונות.

החידוש המרכזי ב- ST Raptor הוא תפיסה מערכתית ולא טריק מודלי. מערכת זו לא מנסה לנחש תשובה מיד, אלא בונה סביבת ניתוח אינטראקטיבית שמאפשרת לתקן את פירוש המבנה ואז להפעיל סוכן שפותר את השאלה בשלבים. שילוב זה נועד לצמצם טעויות, בעיקר בשאלות שבהן התשובה תלויה בהבנת היררכיות כותרות ובקשרים מרומזים.

המחברים מדווחים על שיפור הן בדיוק והן בשימושיות ביחס לשיטות קיימות, על סטי מדידה סטנדרטיים וגם על נתוני עולם אמיתי. ארגונים צריכים לשים לב לנקודה החשובה. מודל שמחזיר תשובה אחת לא מספיק כשמדובר בדוח עסקי שמזין החלטה תקציבית, ולכן מנגנון שמייצר תהליך חקירה עם ראיות ותיקון מהיר הוא יתרון תפעולי ולא רק שיפור אקדמי.

מה בארכיטקטורה מאפשר דיוק גבוה יותר

מערכת ST Raptor בנויה משלושה רכיבים משלימים. רכיב ראשון הוא עריכה חזותית שמאפשרת למשתמש לתקן זיהוי כותרות, גבולות תאים, מיזוגים ופיצולים, כדי שהמערכת תבין נכון מה שייך למה. רכיב שני הוא מידול מבני מבוסס עץ שמנסה לשחזר היררכיות וקיבוצים לוגיים כפי שהם משתקפים בפריסה. רכיב שלישי הוא פתרון שאילתה מונחה סוכן, שבו הסוכן מפרק את הבקשה, מאתר אזורים רלוונטיים, עוקב אחרי נתיבי היררכיה, שולף תאים, ואז בונה תשובה שמבוססת על ראיות מתוך הטבלה.

המשמעות העסקית היא מעבר מהימור לתהליך נשלט. משתמש עסקי יכול לראות מתי המבנה לא זוהה נכון ולהשקיע תיקון קצר שמעלה אמינות לכל השאלות הבאות על אותו דוח. ארגון יכול גם להגדיר מדיניות שבה שאלות בעלות השפעה כספית גבוהה מחייבות בדיקת ראיות והצלבת תאים, בעוד ששאלות תפעוליות יומיומיות יכולות לרוץ אוטומטית.

איפה זה מייצר ROI בארגון

ארגונים נוטים למדוד ערך של אוטומציה בטבלאות דרך שני צירים. ציר ראשון הוא חיסכון זמן אנליזה, כלומר פחות שעות של ניקוי, פירוק והבנה לפני שמגיעים לתשובה. ציר שני הוא הפחתת טעויות בדיווח, כלומר פחות תיקונים בדיעבד, פחות גרסאות סותרות של אותו מספר, ופחות דיוני הנהלה סביב למה המספר השתנה.

מהניסיון בשטח, נקודת הכאב הגדולה מופיעה כשאותה טבלה משמשת כמה צוותים. יחידת כספים מחזיקה קובץ מקור, יחידת תפעול שומרת גרסה משלה, וצוות BI ממיר לפורמט אחר כדי להכניס למחסן נתונים. מערכת שמאפשרת לשאול שאלות בשפה טבעית על הטבלה המקורית, תוך הבנת היררכיות פריסה, יכולה לקצר את זמן ההגעה לתשובה ולצמצם תלות בבקשות אד הוק לצוות BI.

הערך גדל במיוחד כשיש מחזוריות. ארגון שמקבל בכל חודש דוח ספקים בפורמט קבוע למחצה, או שמפיק דוח תקציבי עם מבנה חוזר, יכול להשקיע פעם אחת בתיקון מבני ולהרוויח שיפור מתמשך. ארגון יכול גם להגדיר תרחיש שבו הסוכן מוציא תשובה יחד עם תאי המקור ששימשו לחישוב, כדי לאפשר ביקורת מהירה לפני הפצה.

המלצה פרקטית להטמעה בשלושה שלבים

שלב ראשון צריך להתחיל במיפוי טבלאות בעייתיות עם השפעה עסקית גבוהה. צוותים צריכים לאתר עשרה דוחות שמייצרים הכי הרבה שאלות, הכי הרבה גרסאות, או הכי הרבה תיקונים, ולסווג את מקור הקושי, כלומר כותרות מורכבות, מיזוגים, הערות, או היררכיות. צוותים צריכים להגדיר סט שאלות קבוע שמייצג שימוש אמיתי, למשל חריגות בתקציב לפי תת קטגוריה, שיעור שינוי רבעוני, או איתור ספקים עם חריגת מחיר.

שלב שני צריך לבנות לולאת בקרה עם תיקון מבני מינימלי. צוותים יכולים להפעיל מערכת בסגנון ST Raptor, לאפשר למשתמשים לתקן פירוש כותרות ותאים רק כשמופיעה אי התאמה, ולתעד את התיקונים כדי לשפר את הייצוג המבני. צוותים צריכים למדוד שני מדדים תפעוליים, זמן עד תשובה וזמן עד אימות, ולבחון איך הם משתנים לפני ואחרי התיקון.

שלב שלישי צריך לחבר את התוצאות לממשל נתונים ולמדיניות שימוש. צוותים צריכים להגדיר רמות אמון, כך שתשובות שמבוססות על תאים ברורים ומבנה יציב יופצו אוטומטית, ותשובות שמושפעות מכותרות עמומות ידרשו אישור. צוותים צריכים גם לשמור קישורים לראיות, כלומר אילו תאים שימשו לתשובה, כדי לאפשר ביקורת ועמידה בדרישות ביקורת פנימית.

המחקר על ST Raptor מצביע על כיוון ברור. עולם ה Table QA מתקדם ממודלים שמנסים לענות בתשובה אחת, למערכות סוכניות שמבינות מבנה, מספקות ראיות, ומאפשרות תיקון אנושי ממוקד. ארגונים שמנהלים דוחות מורכבים יכולים להרוויח מזה דרך קיצור זמן אנליזה, צמצום טעויות, והרחבת שירות עצמי לצוותים עסקיים בלי להעמיס על צוותי נתונים.

צוותים שרוצים לבחון את הכיוון יכולים להתחיל בפיילוט קצר על דוח אחד חוזר, עם סט שאלות קבוע ומדידת זמן ודיוק. צוותים יכולים גם לבדוק את הקוד הפתוח של הפרויקט ולבחון התאמה למקורות הדאטה הארגוניים. צוותים שמעוניינים בתכנון פיילוט כזה יכולים לפנות אלינו, כדי להגדיר תרחיש, מדדי הצלחה וארכיטקטורה בטוחה לפריסה.