Prompt Engineering
המדריך המלא
הכישור שמפריד בין מי שמקבל תשובות רגילות לבין מי שמקבל תוצאות מרשימות. Zero-shot, CoT, ReAct, System Prompts — הכל כאן, עם דוגמאות אמיתיות.
מה זה Prompt Engineering ולמה זה חשוב?
מודלי שפה כמו GPT-4o, Claude ו-Gemini הם כמו עובד מחונן שלא מכיר אותך — תן לו הנחיות מעורפלות ותקבל תוצאות בינוניות. תן לו הנחיות מדויקות ותקבל עבודה יוצאת מן הכלל. Prompt Engineering הוא אמנות לתקשר עם AI בצורה שמניבה את התוצאות הטובות ביותר.
זאת לא תכנות ולא קסם — זה ידע מובנה שכל אחד יכול לרכוש. מחקרים מראים ששינוי בניסוח בלבד יכול לשפר את איכות התשובה ב-30%–70%. ב-2026, זו אחת המיומנויות הנדרשות ביותר בשוק העבודה.
ההבדל בין prompt טוב לרע
הדוגמה הכי ברורה להבין מיד את ההבדל:
"כתוב מאמר על AI"
תפקיד: מומחה לכתיבת תוכן B2B עם 10 שנות ניסיון. משימה: כתוב מאמר בלוג של 800 מילים על השפעת AI על שוק העבודה. קהל יעד: מנהלי HR בחברות טכנולוגיה ישראליות. טון: מקצועי אך נגיש. מבנה: כותרת + 3 נקודות מרכזיות + מסקנה + CTA. הימנע: ז'רגון טכני ללא הסבר.
4 עקרונות-על של כל prompt מוצלח
- בהירות — מה בדיוק אתה רוצה? ציין מטרה אחת ברורה.
- הקשר — מי הקהל? מה הסיטואציה? מה הרקע?
- פורמט — כמה מילים? JSON? Bullet points? מספרים?
- תפקיד — מי צריך לענות? מומחה? עורך דין? מנכ"ל?
המחקר של Google DeepMind (2023) הראה שאנשים שלמדו Prompt Engineering קיבלו תשובות איכותיות פי 10 בממוצע — ללא שינוי במודל. הכישור הוא בניסוח, לא בכלי.
כדי להבין למה Prompt Engineering חשוב, שקלו: מודל AI מקבל מאות מיליוני tokens ב-training, אבל אינו יודע מה אתם צריכים עכשיו. הוא יכוון על פי ה-prompt שתיתנו לו. prompt ברור = AI ממוקד. prompt מעורפל = AI מנחש.
מפת טכניקות — Overview
לפני שצוללים לפרטים, הנה מפת הדרכים המלאה של כל הטכניקות שנלמד במדריך זה:
| טכניקה | רמת קושי | מתי להשתמש | מודלים |
|---|---|---|---|
| Zero-Shot | מתחיל | משימות פשוטות, סיווג בסיסי | כולם |
| Few-Shot | מתחיל | עקביות, פורמט מדויק | כולם |
| Chain-of-Thought | בינוני | חשיבה, מתמטיקה, לוגיקה | GPT-4, Claude, Gemini |
| System Prompts | בינוני | אפליקציות, chatbots, personas | כולם (API) |
| ReAct | מתקדם | Agents, multi-step tasks | GPT-4o, Claude 3.5+ |
| Structured Output | בינוני | Production, API integration | GPT-4o, Claude, Gemini |
| Meta-prompting | מתקדם | אופטימיזציה אוטומטית | GPT-4o, Claude 3.5+ |
Zero-Shot Prompting — ללא דוגמאות
Zero-shot הוא הטכניקה הנפוצה ביותר: אתה מתאר מה אתה רוצה מבלי לתת למודל דוגמאות. עובדת טוב עם GPT-4o ו-Claude כי הם מאומנים מראש על מיליוני דוגמאות.
Role Framing — "Act as..."
הטריק הפשוט ביותר: הגדר תפקיד מדויק לפני הבקשה. הבדל עצום בתוצאות:
אתה עורך דין מסחרי ישראלי עם 15 שנות ניסיון בהסכמי SaaS. בדוק את סעיף האחריות הבא וציין: 1. סיכונים מרכזיים 2. ניסוח חלופי מאוזן 3. נקודות למשא ומתן סעיף: "הספק לא יישא בכל אחריות לנזקים עקיפים, תוצאתיים או מיוחדים בכל מקרה שהוא."
5 דוגמאות לפני ואחרי Zero-Shot
"כתוב מייל לספק"
"כתוב מייל מקצועי בעברית לספק שאיחר 3 שבועות. טון: אסרטיבי אך לא אגרסיבי. 3 פסקאות. כלול deadline של יומיים."
"תסכם את הדוח"
"סכם את הדוח ל-5 bullet points. קהל: מנהלים ללא רקע טכני. כלול: ממצא מרכזי, המלצה, ROI. הימנע ממונחים טכניים."
"בדוק את הקוד שלי"
"אתה Senior Python developer. בדוק את הפונקציה הבאה: 1. באגים אפשריים 2. בעיות ביצועים 3. הצע refactor קצר."
Few-Shot Prompting — כוח הדוגמאות
Few-shot אומר: תן למודל 2–5 דוגמאות של Input → Output לפני השאלה האמיתית. למה זה עובד? מודלים הם pattern-matchers מעולים. דוגמאות מלמדות אותם בדיוק את הפורמט, הטון והעקביות שאתה רוצה.
Template בסיסי
משימה: סיווג sentiment לביקורות. דוגמה 1: ביקורת: "המוצר מדהים!" Sentiment: חיובי דוגמה 2: ביקורת: "לא שווה את הכסף" Sentiment: שלילי דוגמה 3: ביקורת: "בסדר, עשה את העבודה" Sentiment: נייטרלי כעת: ביקורת: "סביר, יש מה לשפר" Sentiment:
עקרונות Few-Shot שחשוב לדעת
- עקביות הפורמט קריטית — כל דוגמה חייבת להיות מובנית זהה, אחרת המודל יבלבל את הפורמט.
- 2–5 דוגמאות — מחקרים מראים ש-3–4 דוגמאות אופטימליות. יותר מ-8 כמעט לא משפר.
- גיוון הדוגמאות — כלול מקרי קצה ומקרים בסיסיים. דוגמאות מגוונות מייצרות מודל חזק יותר.
- הדוגמה האחרונה = הכי קרובה למקרה שלך — המודל מושפע יותר מהדוגמות האחרונות.
Few-Shot vs Many-Shot
עם מודלים כמו Gemini 2.5 Pro (context 2M tokens), אפשר להכניס מאות דוגמאות. Many-shot prompting מאמן מודל בתוך ה-prompt עצמו — בלי Fine-tuning. זה חסכוני מאוד לעסקים שרוצים להתאים מודל ללא עלות GPU.
אם כל דוגמאות ה-Few-Shot שלך הן "חיובי", המודל יטה לסווג הכל כחיובי. הקפד על איזון בדוגמאות.
Chain-of-Thought (CoT) — חשיבה בשלבים
תגלית מחקרית מ-Google (Wei et al., 2022): כשאתה מבקש מהמודל "חשוב שלב אחר שלב", הדיוק בבעיות מתמטיות ולוגיות עולה ב-40%–60%. המודל "מסביר את עצמו" — ובכך נמנעות קפיצות מסקנה שגויות.
Zero-Shot CoT — הטריק הפשוט
שאלה: אם ל-Sarah יש 5 תפוחים ונתנה 2 ל-John, ואז קנתה עוד 3, כמה יש לה? חשוב צעד אחר צעד לפני שתענה.
תשובת המודל עם CoT:
שלב 1: Sarah מתחילה עם 5 תפוחים.
שלב 2: היא נתנה 2 ל-John: 5 - 2 = 3 תפוחים.
שלב 3: היא קנתה עוד 3: 3 + 3 = 6 תפוחים.
תשובה: ל-Sarah יש 6 תפוחים.
Few-Shot CoT — עם דוגמאות שלבים
עוד חזק יותר: תן למודל דוגמאות של שרשרת חשיבה, לא רק של תשובה:
שאלה: יש לי 12 תפוחים. אכלתי רבע ונתתי 2 לשכן. כמה נשאר?
תשובה שלב-אחר-שלב:
- רבע מ-12 = 3. נשארו: 12 - 3 = 9.
- נתתי 2 לשכן: 9 - 2 = 7.
תשובה: 7 תפוחים.
שאלה: יש לי 20 ביצים. שברתי שליש ומכרתי 4. כמה נשאר?
תשובה שלב-אחר-שלב:
Self-Consistency — הצבעה בין שרשראות
טכניקה מתקדמת: הפעל את אותו prompt מספר פעמים עם temperature > 0, קבל שרשראות חשיבה שונות, ובחר את התשובה שהכי הרבה שרשראות הגיעו אליה. מחקרים מראים שיפור ב-10%–20% על Single CoT.
Tree of Thoughts (ToT)
הרחבה של CoT: המודל מדמיין עץ של אפשרויות ומעריך כל ענף. מתאים לבעיות תכנון מורכבות. יקר יותר חישובית אבל מעולה לפאזלים ואופטימיזציה.
בעיות מתמטיות, לוגיקה, תכנון אסטרטגי, debugging קוד, ניתוח משפטי. לא מתאים לסיווג פשוט, תרגום, או כתיבה יצירתית — שם CoT לפעמים מזיק.
System Prompts — ה"אישיות" של ה-AI
System Prompt הוא ההוראה שנותנים ל-AI לפני כל שיחה. הוא קובע מי הוא, מה הוא יודע ואיך הוא מתנהג. ב-ChatGPT זה "Custom Instructions", ב-Claude זה "System", ב-API זה role: "system".
ההבדל בין system prompt לuser message: system prompt הוא הגדרת האופי, user message הוא הבקשה הספציפית. כשהם בסתירה — system prompt מנצח.
ארכיטקטורת System Prompt מנצח
כל system prompt טוב מכיל 5 שכבות:
# 1. הגדרת תפקיד אתה [תפקיד מדויק] שעובד ב[חברה/הקשר]. # 2. מטרה המטרה שלך: [מטרה עיקרית אחת ברורה]. # 3. יכולות ומגבלות מה אתה יכול: [רשימה] מה אסור לך: [רשימה] # 4. פורמט תשובה תמיד ענה ב[פורמט — markdown/JSON/plain text]. אורך אידיאלי: [X מילים/פסקאות]. # 5. טון וסגנון [מקצועי/חם/טכני/נגיש] — תמיד ב[שפה].
דוגמה מלאה — System Prompt לנציג שירות לקוחות
אתה נציג שירות לקוחות ידידותי של "גאדג'טים ישראל",
חנות אלקטרוניקה מקוונת.
המטרה: לפתור בעיות לקוחות במהירות ולשמור על שביעות רצון.
כללים:
- ענה תמיד בעברית, בטון חם ומקצועי
- אל תבטיח החזרים מעל ₪500 ללא אישור מנהל
- אם שאלה מחוץ לתחום — הפנה למייל support@gadgets.co.il
- תמיד ציין מספר פנייה בסוף כל תשובה
- אל תמציא מידע על מוצרים שאינך בטוח לגביהם
החזרות: עד 30 יום מרכישה, עם חשבונית.
משלוח: 3–5 ימי עסקים, חינם מעל ₪200.
שעות שירות: א'–ה' 9:00–18:00.
XML Tags — Best Practice של Claude
Anthropic ממליצה להשתמש ב-XML tags ב-system prompts עבור Claude. זה מאפשר למודל להבין בדיוק מה שייך לאיזה חלק:
<system>
<role>מומחה שיווק דיגיטלי עם 10 שנות ניסיון בשוק הישראלי</role>
<task>כתיבת תוכן שיווקי לרשתות חברתיות</task>
<constraints>
- תמיד בעברית
- מקסימום 280 תווים לטוויטר
- כלול hashtags רלוונטיים
</constraints>
<tone>מקצועי, נלהב, פרגמטי</tone>
</system>
OpenAI vs Claude — הבדלים בגישה
| היבט | OpenAI (GPT-4o) | Anthropic (Claude) |
|---|---|---|
| מבנה מועדף | Plain text עם כותרות | XML tags |
| עמידה בכללים | טובה | מצוינת |
| דחיית בקשות | שכיח יותר | נדיר יותר |
| context window | 128K tokens | 200K tokens |
ReAct Pattern — Reasoning + Acting
ReAct (Yao et al., 2022) הוא מסגרת לאפשר ל-AI לחשוב, לפעול, ולהתבונן בתוצאות — בלולאה. משמש בעיקר ב-AI Agents. הרעיון הבסיסי: בכל שלב, המודל מחליט מה לעשות, מבצע פעולה (Search/Calculate/API), רואה את התוצאה ומחליט שוב.
מחזור ReAct
ReAct Prompt Template
אתה סוכן AI שפותר בעיות מורכבות.
לכל שלב, כתוב:
Thought: [מה אתה חושב כרגע]
Action: [מה אתה עושה — Search/Calculate/Answer]
Observation: [מה קיבלת מהפעולה]
...חזור על Thought/Action/Observation עד שיש לך תשובה...
Final Answer: [התשובה הסופית]
שאלה: {user_question}
דוגמה ב-Action — חיפוש מחיר מניה
שאלה: מה מחיר מניית אפל כרגע ומה ה-P/E שלה?
Thought: אני צריך מחיר מניה עדכני וגם נתון P/E. צריך לחפש.
Action: search("Apple AAPL stock price PE ratio 2026")
Observation: AAPL: $198.40 | P/E: 32.1 (עדכון: לפני 3 דקות)
Thought: יש לי את שני הנתונים. אוכל לענות.
Final Answer: מניית Apple (AAPL) נסחרת ב-$198.40.
מכפיל הרווח (P/E) הוא 32.1 — גבוה יחסית לסקטור.
ReAct vs Chain-of-Thought — מתי להשתמש במה?
| קריטריון | Chain-of-Thought | ReAct |
|---|---|---|
| מידע חיצוני? | לא נדרש | כן — search/API |
| שלבים | חשיבה בלבד | חשיבה + פעולה |
| מורכבות | פשוט לבינוני | מורכב / multi-step |
| עלות | נמוכה | גבוהה יותר |
| שימוש נפוץ | מתמטיקה, לוגיקה | Research, debug, agents |
Structured Output — JSON, XML, Pydantic
ברוב מקרי ה-Production, אתה רוצה שה-AI יחזיר JSON מובנה ולא פסקה חופשית. כל ה-APIs הגדולים תומכים ב-JSON Mode. זה מבטיח parsing אוטומטי ומניע הזיות פורמט.
בקשת JSON פשוטה
חלץ את פרטי האדם מהטקסט הבא.
החזר JSON בלבד עם המבנה:
{
"name": string,
"email": string | null,
"phone": string | null,
"company": string | null
}
טקסט: "שלום, אני דני לוי מחברת Tech-IL.
אפשר ליצור קשר: danny@tech-il.com או 050-1234567"
{
"name": "דני לוי",
"email": "danny@tech-il.com",
"phone": "050-1234567",
"company": "Tech-IL"
}
OpenAI Structured Output עם Pydantic
from openai import OpenAI
from pydantic import BaseModel
class Article(BaseModel):
title: str
summary: str
keywords: list[str]
sentiment: str
word_count: int
client = OpenAI()
response = client.beta.chat.completions.parse(
model="gpt-4o-2024-08-06",
messages=[{"role": "user", "content": f"Analyze: {text}"}],
response_format=Article,
)
article = response.choices[0].message.parsed
print(article.title) # "כותרת המאמר"
print(article.keywords) # ["AI", "automation", "Israel"]
XML Output — לסיכומים מורכבים
נתח את הסכם השכירות המצורף והחזר XML:
<analysis>
<risk_level>[גבוה/בינוני/נמוך]</risk_level>
<key_dates>
<start>[תאריך]</start>
<end>[תאריך]</end>
</key_dates>
<red_flags>
<flag>[בעיה 1]</flag>
<flag>[בעיה 2]</flag>
</red_flags>
<recommendation>[המלצה קצרה]</recommendation>
</analysis>
Markdown Formatting Requests
לא תמיד צריך JSON. לפעמים מספיק לבקש Markdown מובנה. זה מעולה לדוחות, תיעוד ופוסטים:
כתוב ניתוח SWOT לחנות אופנה מקוונת.
פורמט: Markdown עם כותרות H2 לכל קטגוריה.
כל קטגוריה: 3–5 bullet points.
הוסף טבלת סיכום בסוף.
טכניקות מתקדמות
Meta-Prompting — Prompt שכותב Prompts
Meta-prompting: אתה נותן ל-AI תיאור של המשימה ומבקש ממנו לכתוב את ה-prompt האופטימלי עבורה. אפשר לעשות לולאה: AI כותב prompt → AI מריץ אותו → AI משפר → חוזר.
אני צריך לסכם ישיבות עבודה לפעולות (Action Items) בצורה ברורה.
כתוב עבורי prompt מיטבי לביצוע המשימה הזו.
הפרט: context, פורמט פלט, כללים ועצות לשיפור עקביות.
Self-Reflection — "האם תשובתך נכונה?"
לאחר קבלת תשובה, תשאל את ה-AI לבדוק את עצמו. זה כמעט תמיד משפר:
[קבלת תשובה ראשונה]
כעת בדוק את תשובתך:
1. האם יש טעויות עובדתיות?
2. האם הפורמט עמד בדרישות?
3. מה אפשר לשפר?
ספק גרסה משופרת אם נחוץ.
Prompt Chaining — Pipeline של Prompts
במקום prompt ענק אחד שמנסה לעשות הכל, חלק את המשימה לשלבים. הפלט של כל שלב נכנס לשלב הבא. יותר מהימן, קל יותר ל-debug.
Negative Prompting — מה לא לעשות
ציין במפורש מה אינך רוצה. זה מונע תוצאות לא רצויות יעילות מאוד:
כתוב פוסט LinkedIn על השקת המוצר שלנו.
אל תשתמש במילות buzzwords: "מהפכני", "game-changer", "חסר תקדים".
אל תפתח עם "אני שמח לשתף".
אל תשתמש באימוג'ים.
מקסימום 3 פסקאות קצרות.
Persona + Audience Calibration
שלב: הגדרת תפקיד וגם קהל היעד. שניהם ביחד נותנים את הכוונה המדויקת ביותר:
אתה: CTO עם ניסיון בסטארטאפים ישראליים.
קהל: משקיעי VC בפגישת Series A.
הסבר: למה הארכיטקטורה הטכנית שלנו מאפשרת סקלביליות ל-10M משתמשים.
אורך: 3 דקות דיבור.
הימנע: פרטים טכניים עמוקים שלא רלוונטיים לכספים.
Constitutional AI Hints
טכניקה ש-Anthropic פיתחה: הגדר עקרונות בתוך ה-prompt. המודל ישתמש בהם כמסגרת חשיבה:
עקרונות תשובתך:
- דיוק עובדתי על-פני ביטחון מדומה
- אם אינך בטוח — אמור זאת
- הצג שתי נקודות מבט לפחות בנושאים שנויים במחלוקת
- קצרות: עדיפה על פרטנות מיותרת
שאלה: האם AI יחליף מתכנתים ב-5 שנים הקרובות?
Temperature ו-Parameters — לא בprompt, אבל חשוב
Temperature 0 — תשובות דטרמיניסטיות, עקביות. לקוד, JSON, עובדות.
Temperature 0.7–1 — יצירתי, מגוון. לכתיבה יצירתית, רעיונות.
Top-P (nucleus sampling) — שולט בגיוון הוקבולרי. Top-P=0.9 בדרך כלל מספיק.
Max Tokens — הגבל את אורך התשובה בצורה מפורשת. שמור על עלויות.
הערכת Prompts — LLM-as-Judge
אחת הטכניקות החזקות ביותר: גרום ל-AI אחד לבדוק את תשובות ה-AI השני. זה נקרא LLM-as-Judge:
# System prompt של ה-Judge:
אתה מומחה להערכת איכות תשובות AI.
דרג את התשובה הבאה בסולם 1–10 לפי:
- דיוק עובדתי (30%)
- עמידה בפורמט המבוקש (30%)
- איכות כתיבה (20%)
- שלמות (20%)
ציין ציון מספרי ו-2 משפטים להסבר.
תשובה להערכה: [...]
הנחיות המקוריות: [...]
בנוסף, שמור Prompt Versioning — גם prompts צריכים version control. תיעד שינויים ובדוק A/B בין גרסאות. metrics לעקוב: accuracy, consistency, format compliance, latency.
5 פרויקטים לתרגול
מה שמפריד בין תיאוריה למיומנות אמיתית הוא תרגול. הנה 5 פרויקטים מדורגים:
Prompt Optimizer
מתחילתן prompt חלש → קבל prompt משופר אוטומטית.
system = """אתה מומחה Prompt Engineering. קבל prompt חלש ושפר אותו לפי 5 עקרונות: 1. הוסף role framing 2. הגדר פורמט פלט 3. ציין אורך 4. הוסף טון 5. הוסף negative constraints החזר: הprompt המשופר + הסבר קצר לשינויים."""
System Prompt Library
בינוניבנה ספריה של 10 system prompts לעסק שלך:
- ◆ נציג שירות לקוחות
- ◆ עוזר כתיבת תוכן שיווקי
- ◆ מנתח נתונים עסקיים
- ◆ מאמן ראיון עבודה
- ◆ יועץ משפטי (disclaimer: לא תחליף לעורך דין)
CoT Solver
בינוניPython script שפותר בעיות מורכבות עם CoT ומחזיר JSON מובנה.
import openai, json
def cot_solve(problem: str) -> dict:
prompt = f"""פתור: {problem}
חשוב שלב אחר שלב.
החזר JSON:
{{"steps": [...], "answer": "...", "confidence": 0-100}}"""
r = openai.chat.completions.create(
model="gpt-4o",
messages=[{"role":"user","content":prompt}],
response_format={"type":"json_object"}
)
return json.loads(r.choices[0].message.content)
ReAct Agent
מתקדםPython agent עם Thought/Action/Observation loop ו-tool calling.
tools = {
"search": lambda q: web_search(q),
"calculate": lambda x: eval(x),
"lookup": lambda k: knowledge_base[k]
}
def react_agent(question: str, max_steps=5):
history = [{"role":"system","content":REACT_SYSTEM}]
history.append({"role":"user","content":question})
for _ in range(max_steps):
response = llm(history)
if "Final Answer:" in response:
return extract_answer(response)
action = parse_action(response)
obs = tools[action.type](action.input)
history.append({"role":"assistant","content":response})
history.append({"role":"user","content":f"Observation: {obs}"})
Auto-Prompt Engineer
מתקדםLLM שמשפר prompts אוטומטית לפי LLM-as-Judge feedback. לולאת שיפור עצמי.
def auto_improve(prompt, task, n_iterations=3):
for i in range(n_iterations):
output = run_prompt(prompt, task)
score = judge_output(output, task) # LLM judge
if score >= 9: break
prompt = improve_prompt(prompt, output, score)
print(f"Iteration {i+1}: score={score}")
return prompt, output
גיליון עזר — Cheatsheet
טבלת השוואת טכניקות
| טכניקה | עלות tokens | שיפור דיוק | מתי? |
|---|---|---|---|
| Zero-Shot | נמוכה | base | תמיד כנקודת התחלה |
| Few-Shot | בינונית | +30–50% | פורמט / עקביות |
| CoT Zero-Shot | נמוכה | +40% | לוגיקה / מתמטיקה |
| CoT Few-Shot | בינונית | +60% | בעיות מורכבות |
| Self-Consistency | גבוהה | +70% | דיוק קריטי |
| ReAct | גבוהה | מידע חיצוני | Agents / research |
10 Templates מוכנים לשימוש
אתה [תפקיד כותב]. כתוב [סוג תוכן] על [נושא]. קהל: [תאר קהל]. טון: [מקצועי/יצירתי/שיחתי]. אורך: [X מילים]. כלול: [אלמנטים]. הימנע: [X].
נתח את הנתונים הבאים: [נתונים] מצא: 1) מגמות עיקריות 2) אנומליות 3) המלצות. פורמט: טבלה + 3 bullet insights + המלצה אחת.
אתה Senior [שפה] developer. בדוק: [קוד] ציין: 1) באגים 2) security issues 3) performance 4) refactor suggestions. דרג חומרה: Critical/High/Low.
תרגם מ[שפה] לעברית ישראלית מודרנית. שמור על: טון מקצועי, מונחים מקצועיים בלועזית, ניבים טבעיים בעברית. אל תתרגם ישירות ביטויים אידיומטיים.
בעיה: [תיאור] הקשר: [מידע רלוונטי] חשוב שלב אחר שלב, שקול לפחות 2 גישות, ובחר את האופטימלית. הסבר למה.
טעויות נפוצות — ואיך להימנע
"כתוב מאמר על AI ותסביר גם כיצד להשתמש בו" — תקבל משהו לא מלוכד. פתרון: שאלה אחת לprompt.
"כתוב מייל ללקוח" — לאיזה לקוח? על מה? פתרון: Context = מי, מה, למה.
"כתוב קצר" — קצר = 2 שורות? 200 מילים? פתרון: ציין מספר מילים/פסקאות.
Prompt Engineering הוא איטרציה. פתרון: נסה → ראה מה לא עובד → שפר → חזור.
ב-API כל קריאה עצמאית. פתרון: כלול הקשר מחדש ב-System Prompt.
Temperature=1 לחישוב מתמטי = תוצאות שגויות. פתרון: T=0 לעובדות, T=0.7+ ליצירתיות.
Model-Specific Tips
| מודל | חזקות | טיפ מיוחד |
|---|---|---|
| GPT-4o | קוד, JSON, פורמט | השתמש ב-response_format: json_object |
| Claude 3.5+ | עקביות, ניתוח, בטיחות | XML tags בsystem prompt |
| Gemini 2.5 | context ארוך, multimodal | Many-shot עם 2M context |
| Llama 3+ | מהיר, חינמי, פרטי | System prompt קצר ומדויק |
הצעד הבא — יישום בפרויקט אמיתי
רוצה לקחת את ה-Prompt Engineering צעד קדימה? בנה AI Agent שמשלב את כל הטכניקות שלמדת — System Prompt + ReAct + Structured Output.