ד"ר יוחנן ועקנין · שירותי מחקר

ממשל, ביטחון ורשויות Synthetic Data Architecture הסקה סיבתית ו-OSINT
ד"ר יוחנן ועקנין, שירותי מחקר

שילוב דיסציפלינות ייחודי.

מתודולוגיית מחקר קפדנית המשלבת קוד, ראייה מבצעית ויכולות מתקדמות לפתרון בעיות נתונים מורכבות במגזר הציבורי.

  • 01
    נתונים סינתטיים ומדיניותהכנת סביבות מחקר, הערכת תוכניות ומדיניות מבוססת-ראיות לממשל ורשויות.
  • 02
    סטטיסטיקה ואקדמיהמודלים סטטיסטיים מתקדמים, שיטות מחקר וליווי חוקרים ודוקטורנטים.
  • 03
    תשתיות OSINT ומורשתארכוב רשתות, עיבוד שפה טבעית ואונומסטיקה חישובית.

ד"ר יוחנן ועקנין שירותי מחקר

חיזוי מבוסס-נתונים, הערכת מודלים שיקומיים ומחקרי מדיניות ענישה וביטחון בסביבות מורכבות.

ייעוץ אסטרטגי לגופים ממשלתיים, עמית מחקר ומרצה באקדמיה, ומפתח תשתיות קוד ופלטפורמות נתונים מתקדמות (Data-for-Good) ה

  • עמית מחקר, DHSS Hub, האוניברסיטה הפתוחה · מתמקד במחקרי תגאוגרפיה של שמות משפחה ואונומסטיקה כמותית.
  • מרצה (אוניברסיטת אריאל, המכללה האקדמית אשקלון)

איך עורכים מחקר כשאסר להוציא נתונים מחוץ לארגון? הפתרון - נתונים סינתטיים! (Synthetic Data)

גופי ממשל, רשויות אכיפה ומערכות בריאות מחזיקים בנתונים בעלי ערך מחקרי עצום, אך חסומים לשימוש עקב מגבלות פרטיות ורגולציה מחמירה (GDPR, חוק הגנת הפרטיות). הפתרון עוקף את המגבלה מבלי לסכן את המידע: בניית מודל נתונים סינתטי השומר על ההתפלגויות הסטטיסטיות של הארגון, פיתוח הקוד בסביבת אפס חשיפה, והרצתו On-Premises בתוך השרתים המאובטחים שלכם.

הנתונים המקוריים נשארים בפנים. המחקר מתבצע בבטחה בחוץ.

תשתית עבודה תקדימית ומאושרת במדינות המערב (Occidental Frameworks)

השימוש במודלים סינתטיים מהווה כיום סטנדרט רגולטורי מחייב בגופי הממשל המובילים בעולם המערבי, ומספק מענה מלא לחוקי הגנת הפרטיות. המתודולוגיה מיושמת באופן מובנה על פי עקרונות הנדסת הפרטיות של מכון התקנים האמריקאי (US NIST), מדריכי הגנת המידע והאנונימיזציה של לשכת הסטטיסטיקה הלאומית בבריטניה (UK ONS), ונציבות המידע הממשלתית (UK ICO), וכן תואמת את מסגרות העבודה וסביבות הבדיקה המאובטחות (Sandboxes) המוגדרות ב- חוק הבינה המלאכותית של האיחוד האירופי (EU AI Act).

Data Governance & Compliance
מתודולוגיה מבוססת תקנים בינלאומיים המובילים בעולם
מודל Five Safes · ניהול פרויקטים, סביבות ותוצרים בהתאם לתקני ה-ONS הבריטי.
הבאת הקוד אל הנתונים · פיתוח מלא מחוץ לארגון, והרצה מקומית לצד הרשומות המקוריות בלבד.
מחוללי נתונים כמותיים ואיכותניים · שמירה על מתאמים וקשרים רב-משתנים ללא אף רשומה אמיתית.

תהליך העבודה ארבעה שלבים ליישום מאובטח

1

אפיון ומיפוי סכמה (Zero-Knowledge)

עבודה מול ספרי קוד, מילוני משתנים וסטטיסטיקה תיאורית מצרפית. תהליך זה מאפשר ללמוד את מבנה הנתונים מבלי להיחשף לרשומות הגולמיות או המסווגות.

2

ייצור מצע נתונים כמותי ואיכותני סינתטי

פיתוח מערך נתונים סינתטי המדמה במדויק את התנהגות המקור. למחקרים איכותניים, שימוש במודלי פאנל ייעודיים (interview.ois.co.il) לבדיקת כלי מחקר והעלאת השערות בסביבה מבוקרת.

3

פיתוח וניפוי המודלים בחוץ

ביצוע המחקר, כתיבת האלגוריתמים והרצת מודלי הניתוח על גבי המצע הסינתטי באופן מלא מחוץ לקירות הארגון, ללא כל סיכון זליגה.

4

הרצה מקומית ואימות תוצרים (On-Premises Run)

מסירת סקריפטים מוגמרים ומתועדים (Python / R). הצוות שלכם מריץ את הקוד בשרתי הארגון המאובטחים, ורק התוצאות הסטטיסטיות המצרפיות יוצאות החוצה, לאחר אישורכם.

פרויקטים בטוחיםאנשים מוסמכיםסביבות מוגנותנתונים חסוייםתוצרים מבוקרים
סביבות נתונים סינתטיות המותאמות להתפלגויות המשתנים שלכם.
סימולציית ראיונות ומודלים איכותניים לבדיקת כלי מחקר והדרכה.
סקריפטים מאומתים, נקיים ומתועדים לניתוח ב-Python או R.
פרוטוקול הרצה עצמאי ומאובטח לצוות האנליסטים הפנימי.
בחינת סיכוני חשיפה ואימות רמת האנונימיזציה של התוצרים.
לתיאום פגישת אפיון מאובטחת
התחלת פרויקט

בואו נדבר על אתגר הנתונים שלכם

ספרו לי בקצר על מבנה הפרויקט, האילוצים ולוחות הזמנים שלכם. אשוב אליכם תוך 48 שעות עם מענה ענייני והערכה ראשונית.

שליחת תקציר פרויקט

כל השדות המסומנים ב-* הם שדות חובה.