עוזר אישי בווטסאפ ב-5 דק ואיך הוא באמת עובד

איור של עוזר אישי בווטסאפ שמחובר לשרת ענן ולסוכן קוד

לפני כמה חודשים, בערך ביום ש OpenClaw יצא, ניסיתי לשחק איתו.

הרעיון תפס אותי: עוזר אישי שאני יכול לכתוב לו בווטסאפ, והוא באמת יכול לעבוד בשבילי.

לא רק לענות על שאלות, אלא גם לבדוק קוד, לקרוא logs, להריץ פקודות, לכתוב סיכומים, להזכיר לי דברים, ולעדכן את ההתנהגות שלו כשאני מבקש.

אבל בפועל זה הרגיש לי לא יציב.

זה נתקע, קרס, ולא נתן לי מספיק ביטחון בשביל לחבר לזה דברים אישיים. אז נטשתי את זה.

בשבוע האחרון חזרתי קצת לשחק עם עוזרי AI.

ניסיתי שוב את OpenClaw. ניסיתי גם את Hermes. בשניהם לא קיבלתי את החוויה שדמיינתי.

בסוף החוויה הכי חלקה הייתה עם NanoClaw.

ה setup שבסוף עבד לי הוא NanoClaw + WhatsApp + Codex. בפוסט הזה אסביר איך הייתי מקים את זה היום.


למה דווקא NanoClaw

האתר של הפרויקט: https://nanoclaw.dev

הקוד בגיטהאב: https://github.com/nanocoai/nanoclaw

מה ששכנע אותי לנסות אותו הוא לא רשימת פיצ׳רים ארוכה, אלא הכיוון: פחות מערכת ענקית עם מיליון קונפיגורציות, ויותר משהו קטן יחסית שאפשר להבין, להריץ, ולשנות עם coding agent.

יש פה גם סיפור ישראלי נחמד. מאחורי NanoClaw עומד גבריאל כהן, ו NanoCo הוקמה על ידי האחים גבריאל ולייזר כהן. לפי מה שהם כותבים, NanoClaw נולד בדיוק מהבעיה הזאת: לתת ל agent גישה לדברים אישיים ורגישים, בלי לסמוך רק על בדיקות הרשאה בתוך אפליקציה גדולה.

בפועל זה אומר שה agent רץ בתוך container, עם גישה רק למה שמחברים לו. זה לא הופך את זה לקסם אבטחתי, ועדיין צריך להבין מה מתקינים, אבל זה כיוון שהרגיש לי הרבה יותר נכון מעוזר אישי שרץ בתוך תהליך אחד ענק עם יותר מדי הרשאות.


הרעיון

העוזר רץ על VM ומחובר לווטסאפ.

כשאני שולח לו הודעה, NanoClaw מקבל אותה, מעביר אותה ל agent, וה agent מחזיר תשובה לווטסאפ.

בהמשך אני מפרט יותר לעומק על הארכיטקטורה, אבל ברמה הפשוטה זה נראה ככה:

WhatsApp
  ↓
NanoClaw
  ↓
Codex / agent
  ↓
WhatsApp

היתרון הוא שהעוזר לא תלוי בלפטופ שלי.

אם הוא רץ על VM, הוא זמין כל הזמן.


איזה VM לקחת

אם רוצים להתחיל בחינם, הייתי מתחיל מ Oracle Cloud Always Free.

יש שם מכונות Ampere די נדיבות ביחס למה שצריך בשביל להריץ agent אישי. בפועל זה הרבה יותר נוח ממכונה קטנה של 1GB.

Oracle Cloud Free Tier: https://www.oracle.com/cloud/free/

החיסרון: לפעמים אין capacity באזור שבחרתם, וצריך לנסות אזור אחר או לחכות.

בכל מקרה, הייתי בוחר Ubuntu עם לפחות 4GB RAM.

אפשר כמובן להריץ את זה גם על כל VM אחר שכבר יש לכם. העיקר שהוא יהיה זמין כל הזמן ושיהיה לכם נוח להתחבר אליו.


מספר ווטסאפ נפרד

אני ממליץ לתת לעוזר מספר משלו.

אפשר לקנות SIM זול, למשל מ 019. יש להם מסלולים שמתחילים סביב 10 ש״ח, ו eSIM ללא עלות. בפועל זה די נוח: אחרי שקונים את המנוי מקבלים הודעה עם לינק, והלינק עושה את ההתקנה של ה eSIM על המכשיר.

למה מספר נפרד?

  • לא מערבבים את הווטסאפ האישי עם ה agent
  • יותר קל להבין מתי מדברים עם העוזר
  • אפשר לתת את המספר גם לקבוצות או לאנשים אחרים
  • אם משהו נשבר, מנתקים רק את המספר של העוזר

אחרי שקונים SIM, מפעילים עליו WhatsApp רגיל.

זה יכול להיות על טלפון ישן, מכשיר שני, או WhatsApp Business על אותו טלפון. ככה אפשר להחזיק שני חשבונות WhatsApp במקביל: אחד באפליקציה הרגילה, ואחד ב Business.

בשביל האקטיבציה של NanoClaw צריך להיות זמינים עם החשבון הזה, כי צריך לסרוק QR או להשתמש ב pairing code. אחרי שהחיבור עובד, העוזר רץ על ה VM ולא על הטלפון עצמו. מדי פעם WhatsApp יכולה לנתק Linked Device, ואז פשוט מחברים מחדש.

הערה קטנה על הסיכון: NanoClaw מתחבר ל WhatsApp דרך Baileys, ספרייה שמדמה חיבור של WhatsApp Web. זה עובד טוב, אבל זה לא API רשמי של WhatsApp. במילים אחרות, WhatsApp יכולה לשנות משהו, החיבור יכול להישבר, ובמקרה קיצוני גם חשבון יכול להיחסם. זו עוד סיבה להשתמש במספר נפרד ולא במספר האישי.


התקנת NanoClaw

מבחינתי הדרך הכי פשוטה להתקין היא לא לעקוב אחרי מדריך ארוך.

פותחים Claude Code או Codex בתיקייה ריקה על ה VM, ונותנים לו משימה:

Install NanoClaw on this machine from:
https://github.com/nanocoai/nanoclaw

Set it up as a personal WhatsApp assistant.
Walk me through anything that needs manual approval.

זה חלק מהפואנטה.

לא צריך לזכור את כל הפקודות. נותנים ל coding agent לעשות את העבודה: להריץ התקנה, להתקין dependencies, לקרוא שגיאות, ולשאול כשצריך אישור ידני.

אם אתם רוצים להריץ ידנית, הפקודה הבסיסית היא:

git clone https://github.com/nanocoai/nanoclaw.git
cd nanoclaw
bash nanoclaw.sh

בשלב בחירת הערוץ, בוחרים WhatsApp.

NanoClaw יציע שתי דרכים להתחבר:

  • סריקת QR מהטרמינל
  • pairing code

אצלי QR היה הכי פשוט.

פותחים WhatsApp במספר של העוזר:

Settings → Linked devices → Link a device

סורקים את ה QR שמופיע בטרמינל.

אחרי זה NanoClaw ישאל מאיזה מספר אתם הולכים לדבר עם העוזר. שם שמים את המספר האישי שלכם.

בסוף אתם אמורים לקבל הודעת welcome בווטסאפ.


חיבור Codex

אני ממליץ לחבר את העוזר ל Codex.

אני עשיתי את זה עם חשבון ChatGPT שלי, לא עם API key.

מבחינת עלות, אני ממליץ להתחיל לפחות מ ChatGPT Plus, שעולה כרגע בערך 20 דולר בחודש. אפשר תיאורטית לשחק גם עם פחות מזה, אבל זה ייגמר מהר. הכמות בפועל תלויה בתוכנית ובגודל המשימות. משימות קטנות כמעט לא מורגשות, וסשנים ארוכים על קודבייס גדול יאכלו יותר מה quota.

על ה VM מריצים:

codex login

בוחרים התחברות עם ChatGPT, משלימים את ה login בדפדפן, וחוזרים לשרת.

אחרי ההתקנה, אומרים ל Claude או Codex לאיזה coding agent לחבר את NanoClaw ובאיזה מודל להשתמש.

אני הייתי מתחיל מהמודל הכי חזק שזמין לכם ב Codex. אצלי כרגע זה GPT-5.5.

ה prompt שלי היה בערך כזה:

Install and configure the /add-codex provider for this NanoClaw setup.
Use my existing ChatGPT Codex login.
Make the WhatsApp agent use Codex by default.
Use the strongest available Codex model as the default model for the agent.

זה כל היופי ב setup הזה.

כל דבר שאני רוצה לשנות בעוזר האישי, אני פשוט מבקש מ Codex שיעשה.

רוצה לשנות את השם שלו? מבקש מ Codex.

רוצה שיזכור סגנון תגובה מסוים? מבקש מ Codex.

רוצה לחבר תיקייה, cron job, סיכום יומי, או התנהגות מיוחדת בקבוצה? מבקש מ Codex.

במקום ללמוד מערכת קונפיגורציה גדולה, עובדים ישירות מול הקוד.


טלגרם במקום ווטסאפ

אם אתם מעדיפים Telegram, זה אפילו יותר פשוט מבחינת אינטגרציה.

ב setup בוחרים Telegram במקום WhatsApp, או מוסיפים אחר כך עם:

/add-telegram

המדריך הרשמי:

https://docs.nanoclaw.dev/integrations/telegram


מה עושים אחרי שזה עובד

אחרי שהעוזר עונה בווטסאפ, כדאי להתחיל קטן.

למשל:

  • תבדוק מה מצב השרת ותסכם לי בקצרה
  • כל בוקר ב 9 תשלח לי סיכום של המשימות הפתוחות
  • תפתח את הפרויקט הזה, תקרא את ה README, ותגיד לי איך מריצים אותו
  • תשנה את עצמך כך שתענה יותר קצר, ותמיד תסיים עם next action אחד

אצלי זה התחיל מדברים של פיתוח, אבל די מהר גלש גם ליומיום.

אני משתמש בו לתזכורות, לניהול לו״ז, למעקב אחרי תשלומים של בייביסיטר, ואפילו לחיבור לקבוצות WhatsApp משפחתיות כשצריך שמישהו יעזור לסכם, להזכיר או לעשות סדר.

הנקודה החשובה היא שזה לא bot סגור.

זה עוזר אישי שאפשר לשנות.

והדרך לשנות אותו היא פשוט לבקש מ Codex.


קצת ארכיטקטורה

החלק שכדאי להבין הוא ש NanoClaw הוא לא “בוט ווטסאפ שקורא למודל”.

הוא יותר דומה למערכת קטנה שמחברת בין ערוצי הודעות לבין agent שרץ בסביבה מבודדת.

במסלול של WhatsApp זה נראה בערך ככה:

WhatsApp account
  ↓
WhatsApp adapter / Baileys
  ↓
NanoClaw host process
  ↓
session inbound.db
  ↓
agent container
  ↓
agent-runner
  ↓
Codex provider → Codex app-server → model
  ↓
session outbound.db
  ↓
NanoClaw delivery
  ↓
WhatsApp

ה host process הוא החלק שרץ על ה VM ומנהל את העולם החיצוני: חיבור ל WhatsApp, ניתוב הודעות, הפעלה של containers, ושליחה חזרה לערוץ שממנו ההודעה הגיעה.

ה agent עצמו רץ בתוך container נפרד. זה חשוב, כי כשהוא מריץ פקודות או קורא קבצים הוא לא אמור לראות את כל השרת, אלא רק את מה שחיברו לו במפורש.

במקום להעביר הודעות בין ה host ל container דרך stdin או איזה socket פנימי, NanoClaw משתמש בקבצי SQLite לכל session. יש inbound DB שה host כותב אליו וה agent קורא ממנו, ויש outbound DB שה agent כותב אליו וה host קורא ממנו.

זה נשמע קצת מוזר בהתחלה, אבל זה די אלגנטי: כל הודעה היא row. גם הודעת WhatsApp, גם משימה מתוזמנת, גם תשובה שה agent רוצה לשלוח החוצה.

עוד דבר חשוב הוא ההפרדה בין agent group לבין session.

agent group הוא האישיות והסביבה: תיקייה, הוראות, skills, mounts, provider, זיכרון וקונפיג של container. session הוא שיחה ספציפית. אפשר לחבר כמה ערוצים לאותו agent, אבל להשאיר להם sessions נפרדים, ואפשר גם להפריד לגמרי בין agents שונים כדי שמידע לא ידלוף בין קבוצות.

במקרה שלי, הצ׳אט הפרטי בווטסאפ מחובר ל agent אחד שיש לו גישה לתיקיות שאני בוחר, למשל ריפו של הבלוג. אם הייתי מחבר אותו לקבוצת WhatsApp אחרת עם אנשים אחרים, הייתי חושב טוב אם זה צריך להיות אותו agent או agent נפרד.

מבחינת Codex, NanoClaw לא שולח ישירות prompt למודל וזהו. ה provider מפעיל Codex app-server בתוך הסביבה של ה agent, פותח או ממשיך thread, ונותן ל Codex לעבוד עם הכלים, הקבצים והפקודות שיש לו.

זה ההבדל בין “צ׳אטבוט” לבין עוזר עבודה: הוא לא רק מנסח תשובה, הוא יכול לקרוא את הפרויקט, להריץ בדיקות, לשנות קבצים, לעשות commit, ואז לשלוח לך סיכום בווטסאפ.

החלק שאני אוהב בארכיטקטורה הזאת הוא שהיא לא מנסה להסתיר הכול מאחורי UI. אם משהו נשבר, אפשר לפתוח את השרת, לראות logs, לראות את ה DB של ה session, לראות איזה container רץ, ולבקש מ Codex לתקן את NanoClaw עצמו.

זה גם מסביר למה זה מרגיש יותר כמו כלי למפתחים מאשר מוצר צרכני סגור. יש פה פחות קסם, אבל הרבה יותר שליטה.


סיכום

ה setup שאני ממליץ עליו:

  • VM עם Ubuntu, למשל Oracle Always Free
  • SIM נפרד וזול, למשל 019
  • NanoClaw על השרת
  • WhatsApp בתור ממשק
  • Codex מחובר דרך חשבון ChatGPT
  • המודל הכי חזק שזמין לכם ב Codex

הדרך הכי פשוטה:

פתחו Claude Code או Codex על השרת, תנו לו את הלינק לריפו של NanoClaw, ובקשו ממנו להתקין ולחבר WhatsApp.

מרגע שזה עובד, כל שינוי ממשיך דרך Codex.

לא צריך לבנות מוצר שלם.

צריך עוזר קטן, מחובר לווטסאפ, שרץ על שרת, ואפשר לבקש ממנו להשתפר תוך כדי עבודה.

תגובות

פוסטים פופולריים מהבלוג הזה

קודמתי לדרגת סיניור במיקרוסופט - מה למדתי בדרך

Rust Builder Pattern

מהם קבצי DLL ואיך להשתמש בהם?