עודכן: אפריל 2026 — GPT-4o + o3 + o4-mini

מדריך ChatGPT המלא
GPT-4o, API ואוטומציה

מהיסודות ועד שליטה מלאה: Prompt Engineering, Custom GPTs, OpenAI API ו-Function Calling — הכל בעברית עם דוגמאות קוד מפורטות.

scheduleקריאה של 25 דקות
trending_upמתחיל עד מתקדם
codeדוגמאות Python

מה זה ChatGPT?

ChatGPT הוא ממשק שיחה של חברת OpenAI, הפועל על גבי משפחת מודלי GPT (Generative Pre-trained Transformer). זה לא רק "AI שעונה על שאלות" — זו פלטפורמה שלמה לכתיבה, ניתוח, קידוד, יצירת תמונות וקול, בניית אפליקציות ואוטומציה. מאז השקתו בנובמבר 2022 הוא שינה את אופן העבודה של מיליוני אנשים ברחבי העולם.

לב המוצר הוא מודל שפה גדול (LLM) שאומן על כמויות עצומות של טקסט והשלים את האימון עם RLHF (Reinforcement Learning from Human Feedback) — טכניקה שהופכת אותו לשימושי, בטוח ומוכוון לעזרה.

GPT-4o vs מודלי o-series vs GPT-3.5 — מה ההבדל?

מודל Context Vision מחיר (1M input) מומלץ ל-
GPT-4o 128K כן $2.50 כל שימוש כללי, ברירת מחדל
GPT-4o mini 128K כן $0.15 volume גבוה, עלות נמוכה
o3 200K כן $10.00 reasoning, מתמטיקה, קוד מורכב
o4-mini 200K כן $1.10 reasoning במחיר סביר
GPT-3.5 Turbo 16K לא $0.50 legacy — לא מומלץ לפרויקטים חדשים

מה אפשר לעשות עם ChatGPT?

lightbulb ChatGPT Free vs Plus vs Team

Free — GPT-4o עם מגבלות קצב, DALL-E מוגבל. Plus ($20/חודש) — גישה מלאה ל-GPT-4o, o3, o4-mini, DALL-E 3, Web Search, Code Interpreter, Custom GPTs. Team ($30/משתמש) — data privacy, context ארוך יותר, ניהול ארגוני. Enterprise — SSO, audit logs, SLA מובטח.

מפת הדרכים לשליטה ב-ChatGPT

המסע מ"משתמש מתחיל" ל"מאסטר" עובר דרך 5 שלבים ברורים. כל שלב בונה על הקודם — אל תדלג.

Stage 1 Foundations — יסודות 1–2 שבועות
ממשק הצ'אט
ניווט, היסטוריה, שיתוף שיחות, העלאת קבצים, Custom Instructions
System Prompts
Custom Instructions (My ChatGPT), הגדרת "אישיות" המודל לכל שיחה
Prompting בסיסי
שאלות ברורות, קונטקסט, הגדרת פורמט הפלט הרצוי
Stage 2 Core Skills — כישורי ליבה 2–4 שבועות
Prompt Engineering
Zero-shot, Few-shot, Chain-of-Thought, Persona technique
DALL-E 3
יצירת תמונות, בחירת סגנונות, aspect ratios, image editing
Code Interpreter
ניתוח CSV, יצירת גרפים, עיבוד קבצים, מחשבונים מורכבים
Stage 3 Intermediate — ביניים 1–2 חודשים
Custom GPTs
בניית GPT מותאם עם Instructions, Knowledge Files ו-Actions
Memory
שמירת זיכרון לאורך שיחות, ניהול context ועדכון ידני
Web Search
חיפוש בזמן אמת, Grounding עובדות, שילוב מקורות
Stage 4 Advanced — מתקדם 2–3 חודשים
OpenAI API
Authentication, completions, parameters, error handling
Function Calling
Tool Use, structured JSON responses, tool orchestration
Fine-Tuning
אימון על דאטה מותאמת, dataset preparation, evaluation
Batch API
עיבוד כמויות גדולות עם הנחה 50%, async processing
Stage 5 Mastery — שליטה מלאה מתמשך
OpenAI Agents SDK
multi-step agents, tool orchestration, handoffs בין agents
Production Deployment
rate limits, retry logic, monitoring, cost optimization
RAG + Embeddings
מערכות חיפוש סמנטי עם Vector DB, pipeline מלא

הנדסת פרומפטים — Prompt Engineering

Prompt Engineering היא האמנות לנסח הוראות שמוציאות מהמודל את התוצאה הטובה ביותר. ההבדל בין פרומפט גרוע לטוב יכול להיות ההבדל בין פלט חסר תועלת לפלט שחוסך שעות עבודה. זה לא קסם — זה מיומנות הניתנת ללמידה.

Zero-shot vs Few-shot vs Chain-of-Thought

Zero-shot

שאלה ישירה ללא דוגמאות. עובד טוב לפעולות פשוטות וברורות.

"תרגם לאנגלית:
שלום עולם"
Few-shot

מספר דוגמאות לפני הבקשה. מאמן את המודל על הפורמט הרצוי.

"חיובי → 😊
שלילי → 😞
ניטרלי → 😐
סווג: 'אהבתי!'"
Chain-of-Thought

בקש מהמודל לחשוב בקול. מייעל reasoning, מתמטיקה והיגיון.

"פתור שלב אחר שלב.
הצג את החשיבה שלך
לפני התשובה."

Persona Technique — "Act as..."

אחת הטכניקות החזקות ביותר היא הגדרת פרסונה — בקש מהמודל לפעול כמומחה בתחום מסוים. זה משפר את איכות, עומק ואגנון הפלט באופן משמעותי. הנה template מוכן לשימוש:

System Prompt Template — Persona
SYSTEM: פעל כמומחה [תחום] עם [X] שנות ניסיון.
הסגנון שלך: [מקצועי/חברותי/טכני].
המשתמש: [תיאור הקהל].
פורמט הפלט: [JSON/Markdown/רשימות].
שפה: עברית בלבד, מונחים טכניים באנגלית.
אם אינך בטוח — אמור זאת במפורש. אל תמציא מידע.

Structured Output — JSON Mode

כשצריך פלט מובנה לעיבוד קוד, ישנן שתי גישות: הגדרת response_format: { type: "json_object" } ב-API, או שימוש ב-Structured Outputs — הגדרת JSON Schema מדויק שהמודל חייב לעמוד בו. Structured Outputs מבטיח 100% ציות לסכמה.

Structured Outputs עם Pydantic
from openai import OpenAI
from pydantic import BaseModel

client = OpenAI()

class ArticleAnalysis(BaseModel):
    title: str
    main_topic: str
    sentiment: str  # "positive" | "negative" | "neutral"
    key_points: list[str]
    word_count: int

response = client.beta.chat.completions.parse(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "נתח את המאמר ופרט JSON מובנה."},
        {"role": "user",   "content": "מאמר: [טקסט המאמר כאן]"}
    ],
    response_format=ArticleAnalysis,
)

analysis = response.choices[0].message.parsed
print(f"נושא: {analysis.main_topic}")
print(f"נקודות מפתח: {analysis.key_points}")

Temperature ו-Top-p — שליטה בגיוון

Temperature (0–2)
0.0–0.3
קוד, JSON, עובדות
0.5–0.8
כתיבה מקצועית
0.9–1.2
כתיבה יצירתית
1.5+
ניסויי בלבד
Top-p (Nucleus Sampling)

מגדיר את מאגר המילים שהמודל בוחר ממנו. 0.1 = רק המילים המסתברות ביותר (פחות גיוון, יותר עקביות). 0.9 = מגוון רחב יותר.

המלצה: שנה רק Temperature. אל תשנה גם Top-p וגם Temperature יחד — הם מתקשרים ויוצרים תוצאות בלתי צפויות.

warning 5 טעויות נפוצות בפרומפטינג
  • פרומפט ארוך מדי ללא מיקוד — פרק לשלבים נפרדים, שלח הוראות ממוקדות
  • לא לציין פורמט הפלט הרצוי — תמיד הגדר: רשימה/JSON/פסקה/טבלה
  • לבקש "תהיה יצירתי" ללא קונסטריינטים — זה מביא תוצאות גנריות
  • חוסר קונטקסט — "תכתוב מאמר" vs "תכתוב מאמר ל-LinkedIn על AI לקהל B2B מנהלים"
  • לא לאמת את הפלט — ChatGPT עשוי להמציא מידע. תמיד וודא עובדות קריטיות

יכולות GPT-4o

GPT-4o ("omni") הוא המודל הרב-מודלי של OpenAI — הוא מבין ומייצר טקסט, תמונות וקול בשיחה אחת רציפה. זו קפיצה משמעותית ממודלים קודמים שטיפלו בכל מודאליות בנפרד עם latency גבוה.

Vision — ניתוח תמונות ומסמכים

שלח כל תמונה, screenshot, PDF, דיאגרמה או גרף — GPT-4o יתאר, ינתח ויענה על שאלות לגביה. הממשק תומך ב-URL ובקבצים מקומיים (base64). שימושים עיקריים בעבודה:

Vision API — ניתוח תמונה
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "נתח את הגרף הזה: מה המגמה הכללית? אילו חריגים יש?"},
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/chart.png"}
                    # או: "url": f"data:image/jpeg;base64,{base64_image}"
                }
            ]
        }
    ]
)
print(response.choices[0].message.content)
tips_and_updates Vision: טיפ מקצועי

כשמנתחים PDF מורכב, פרק אותו לדפים בודדים (PDF לתמונות PNG) ושלח דף אחד בכל פעם. GPT-4o מסתדר עם מסמכים עד כ-20 עמודים ישירות, אבל האיכות יורדת בקבצים ארוכים. השתמש ב-pypdf + pdf2image בפייתון לפיצול אוטומטי.

DALL-E 3 — יצירת תמונות

ב-ChatGPT Plus יש גישה מובנית ל-DALL-E 3. פשוט בקש "צור תמונה של..." — GPT-4o אפילו משפר אוטומטית את הפרומפט שלך לפני שליחתו ל-DALL-E. דרך ה-API ניתן לשלוט על גודל, איכות וסגנון:

from openai import OpenAI
client = OpenAI()

response = client.images.generate(
    model="dall-e-3",
    prompt="לוגו מינימליסטי לחברת AI, צבעי כחול וסגול, סגנון flat design, רקע לבן",
    size="1024x1024",   # 1024x1024 | 1792x1024 | 1024x1792
    quality="hd",       # "standard" | "hd"
    style="vivid",      # "vivid" | "natural"
    n=1
)
print(response.data[0].url)
print(response.data[0].revised_prompt)  # הפרומפט שהשתפר ע"י GPT

Code Interpreter — מנוע Python מובנה

Code Interpreter (Advanced Data Analysis) מריץ קוד Python בזמן אמת בסנדבוקס מבודד. השלך קובץ CSV, Excel, JSON — וקבל ניתוח, גרפים ותובנות. זה כלי בעל ערך אדיר לאנשי נתונים, אנליסטים ומנהלים.

Voice Mode — שיחה אנושית

GPT-4o Voice Mode מאפשר שיחה מדוברת עם זמן תגובה של פחות משנייה — קרוב לשיחה אנושית טבעית. המודל מזהה אינטונציה, יכול להיות מופסק באמצע משפט, ומשלב מגוון קולות מובנים. זמין ב-ChatGPT Plus דרך האפליקציה הנייידת. שימושים: תרגול שפות, פגישות יד-ראשונה, הכנת נאומים.

Memory — זיכרון לאורך שיחות

ChatGPT יכול לשמור עובדות עליך לאורך שיחות שונות ולהשתמש בהן בעתיד. ניתן לנהל את הזיכרון ידנית: "זכור שאני CTO, מפתח Python, ועובד על פרויקט SaaS בתחום הבריאות". Memory זמין ב-Plus ו-Team, וניתן לכבות אותו דרך Settings > Personalization > Memory.

Custom GPTs

Custom GPTs מאפשרים לבנות גרסה מותאמת אישית של ChatGPT עם הוראות, ידע ויכולות ספציפיות — בלי לכתוב שורת קוד אחת. אפשר לשתף אותם בציבור ב-GPT Store או להשאיר אותם פרטיים לשימוש אישי או ארגוני.

שלושת הרכיבים של Custom GPT

description
Instructions

הוראות System Prompt קבועות. מגדירות פרסונה, התנהגות, מגבלות ופורמט. עד ~8,000 תווים. הלב של ה-GPT.

folder_open
Knowledge Files

העלה PDF, Word, TXT — המודל ישתמש בהם כבסיס ידע. אידיאלי לתיעוד מוצר, FAQ ארגוני, נהלים, מחירונים.

electric_plug
Actions

חיבור ל-APIs חיצוניים דרך OpenAPI spec. המודל קורא API, שולח נתונים, מריץ webhooks — הכל בשיחה.

דוגמה: Custom GPT למנהל פרויקטים

# Instructions לדוגמה — Custom GPT "מנהל הפרויקטים שלי"

אתה מנהל פרויקטים בכיר עם 15 שנות ניסיון ב-Agile, Scrum ו-Kanban.
תפקידך לעזור לתכנן, לעקוב ולספק משוב על פרויקטים.

כאשר מתוארת בעיה או פרויקט חדש, תמיד שאל על:
- Timeline ו-Deadline
- גודל הצוות ומיומנויות
- Dependencies ו-Blockers אפשריים
- Budget constraints

תמיד ספק:
1. חלוקה ל-Milestones עם תאריכים
2. רשימת Risks עם ה-Impact וה-Mitigation
3. KPIs מדידים להצלחה

פורמט: Markdown עם headers ברורים.
שפה: עברית, מונחים מקצועיים באנגלית.
אל תספק הערכות זמן ללא מידע על גודל הצוות.
store GPT Store — לפני שבונים בעצמנו

ב-GPT Store יש מיליוני Custom GPTs ציבוריים. לפני שתבנה אחד בעצמך — חפש שם. קטגוריות פופולריות: Productivity, Research, Coding, Creative Writing, Education. חיפוש פשוט: chatgpt.com/gpts

ChatGPT API למפתחים

ה-OpenAI API מאפשר לשלב את יכולות GPT ישירות באפליקציות שלך. זהו ה-API הנפוץ ביותר ל-AI בעולם — עם תיעוד מצוין, SDKs ל-Python, JavaScript, Go, Java ועוד, ו-community ענק.

התחלה מהירה — Python SDK

התקנה והגדרת API Key
# התקנה
pip install openai

# הגדרת API Key (מומלץ כמשתנה סביבה)
export OPENAI_API_KEY="sk-proj-..."  # Linux/Mac
# או ב-.env file עם python-dotenv
קריאה בסיסית — Chat Completion
from openai import OpenAI

# SDK מזהה את OPENAI_API_KEY אוטומטית
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "אתה עוזר מקצועי. ענה בעברית תמיד."},
        {"role": "user",   "content": "סכם את המסמך הזה ב-3 נקודות: [טקסט המסמך]"}
    ],
    temperature=0.7,
    max_tokens=1000,
    top_p=1.0,
    frequency_penalty=0.0,
    presence_penalty=0.0
)

# קריאת התשובה
print(response.choices[0].message.content)

# מידע על שימוש ב-tokens
print(f"Input tokens:  {response.usage.prompt_tokens}")
print(f"Output tokens: {response.usage.completion_tokens}")
print(f"Total tokens:  {response.usage.total_tokens}")

Function Calling / Tool Use

Function Calling מאפשר למודל לקרוא לפונקציות מוגדרות מראש — GPT יחליט מתי לקרוא לאיזו פונקציה, ויחזיר את הארגומנטים בפורמט JSON. זה הבסיס לבניית AI Agents שמבצעים פעולות בעולם האמיתי.

import json
from openai import OpenAI

client = OpenAI()

# הגדרת הכלים הזמינים למודל
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "קבל מידע מזג אוויר לעיר ותאריך נתונים",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {
                        "type": "string",
                        "description": "שם העיר, לדוגמה: תל אביב, ירושלים"
                    },
                    "unit": {
                        "type": "string",
                        "enum": ["celsius", "fahrenheit"],
                        "description": "יחידת טמפרטורה"
                    }
                },
                "required": ["city"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "search_web",
            "description": "חפש מידע עדכני ברשת",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {"type": "string", "description": "שאילתת החיפוש"}
                },
                "required": ["query"]
            }
        }
    }
]

messages = [{"role": "user", "content": "מה מזג האוויר בתל אביב היום?"}]

response = client.chat.completions.create(
    model="gpt-4o",
    messages=messages,
    tools=tools,
    tool_choice="auto"  # "auto" | "required" | "none"
)

# בדוק אם המודל רוצה לקרוא לפונקציה
choice = response.choices[0]
if choice.finish_reason == "tool_calls":
    tool_call = choice.message.tool_calls[0]
    args = json.loads(tool_call.function.arguments)
    print(f"קריאה ל: {tool_call.function.name}")
    print(f"ארגומנטים: {args}")
    # כאן תריץ את הפונקציה האמיתית ותחזיר תוצאה

Streaming — תגובות בזמן אמת

from openai import OpenAI

client = OpenAI()

# Streaming מחזיר chunks בזמן אמת — כמו ChatGPT
with client.chat.completions.stream(
    model="gpt-4o",
    messages=[{"role": "user", "content": "כתוב שיר קצר על ים התיכון"}]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

print()  # שורה חדשה בסוף

Assistants API + Threads

Assistants API מיועד לאפליקציות שצריכות לנהל שיחות ארוכות, לשמור history, ולהשתמש בכלים — כל זה מנוהל על ידי OpenAI. מתאים לצ'אטבוטים, עוזרים אישיים, ומערכות Q&A.

from openai import OpenAI
client = OpenAI()

# שלב 1: יצירת Assistant (פעם אחת)
assistant = client.beta.assistants.create(
    name="עוזר ניהול משימות",
    instructions="אתה עוזר לניהול משימות יומיות. ענה בעברית.",
    model="gpt-4o",
    tools=[
        {"type": "code_interpreter"},
        {"type": "file_search"}
    ]
)

# שלב 2: יצירת Thread לכל שיחה
thread = client.beta.threads.create()

# שלב 3: הוספת הודעה לשיחה
client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="ארגן את המשימות לפי עדיפות: כתיבת דוח, פגישה עם לקוח, עדכון README, code review"
)

# שלב 4: הרצה וחכייה לתוצאה
run = client.beta.threads.runs.create_and_poll(
    thread_id=thread.id,
    assistant_id=assistant.id
)

# שלב 5: קריאת תשובה
if run.status == "completed":
    messages = client.beta.threads.messages.list(thread_id=thread.id)
    print(messages.data[0].content[0].text.value)

תמחור — מה זה עולה?

מודל Input (1M) Output (1M) הערה
GPT-4o$2.50$10.00הכי פופולרי
GPT-4o mini$0.15$0.60volume גבוה
o3$10.00$40.00reasoning מורכב
o4-mini$1.10$4.40reasoning חסכוני
text-embedding-3-small$0.02RAG, חיפוש סמנטי
Whisper (STT)$0.006/דקהתמלול אודיו
savings 3 דרכים לחסוך בעלויות API
  • 1.Prompt Caching — 50% הנחה על tokens שנשמרו ב-cache. עובד אוטומטית על prompts זהים.
  • 2.Batch API — עיבוד כמויות גדולות בהנחה 50% עם SLA של 24 שעות.
  • 3.max_tokens מדויק — הגדר לפי הצורך האמיתי. כל token שלא צריך — עלות מיותרת.

5 פרויקטים מעשיים

למידה אמיתית קורה דרך בנייה. הנה 5 פרויקטים מדורגים לפי קושי — כל אחד עם scope ברור, זמן אמיתי ומיומנויות שתרוויח.

🟢 מתחיל צ'אטבוט שירות לקוחות בסיסי

צ'אטבוט Python עם CLI שעונה על שאלות לפי FAQ מוגדר, שומר history ומפנה לתמיכה אנושית כשצריך.

זמן
2–3 שעות
כלים
openai, python
עלות API
~$0.01
מיומנות
Chat API, Prompts
# מה תבנה:
1. System Prompt עם מידע ה-FAQ של החברה
2. לולאה שמנהלת היסטוריית שיחה (messages list)
3. Validation — מסרב לענות על שאלות off-topic
4. Fallback: "שאלה זו מחוץ לתחום שלי — פנה לתמיכה"
🟡 בינוני כלי ניתוח PDF + Vision

אפליקציה שמקבלת דוח פיננסי (PDF) ומחלצת תובנות, מגמות וגרף ויזואלי אוטומטית.

זמן
4–6 שעות
כלים
Assistants API
עלות API
~$0.10
מיומנות
Files, Threads
# שלבים:
1. העלה PDF דרך Files API: client.files.create()
2. צור Assistant עם code_interpreter + file_search
3. בקש: "ספק 5 תובנות וצור גרף מגמות חודשי"
4. הורד את התמונה שנוצרה דרך client.files.content()
🟡 בינוני Custom GPT לכתיבת תוכן שיווקי

GPT מותאם לכתיבת פוסטים ל-LinkedIn, מיילים ומודעות בסגנון מותג ספציפי — ללא קוד.

זמן
3–4 שעות
כלים
Custom GPTs, ללא קוד
עלות
ChatGPT Plus
מיומנות
Instructions, Knowledge
# שלבים ב-GPT Builder:
1. Instructions: Brand Voice, Tone, Do/Don't
2. Knowledge: העלה Brand Guidelines PDF
3. Conversation Starters: "כתוב פוסט LinkedIn על..."
4. בדוק עם 10 דוגמאות מגוונות ואמן את ה-Instructions
🔴 מתקדם Workflow Agent עם Function Calling

Agent שמקבל משימה בשפה טבעית ומבצע אותה ע"י קריאה ל-APIs חיצוניים: Notion, Gmail, Slack.

זמן
1–2 ימים
כלים
Function Calling
עלות
~$0.50/יום
מיומנות
Tool Orchestration
def run_agent(user_task: str) -> str:
    messages = [
        {"role": "system", "content": "אתה agent לאוטומציה. יש לך כלים."},
        {"role": "user",   "content": user_task}
    ]

    while True:
        response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            tools=AVAILABLE_TOOLS,
            tool_choice="auto"
        )
        msg = response.choices[0].message
        messages.append(msg)  # שמור את תגובת ה-agent

        if msg.tool_calls:
            # בצע כל כלי שה-agent ביקש
            for tc in msg.tool_calls:
                args = json.loads(tc.function.arguments)
                result = execute_tool(tc.function.name, args)
                messages.append({
                    "role": "tool",
                    "tool_call_id": tc.id,
                    "content": json.dumps(result)
                })
        else:
            # המודל סיים — אין tool_calls
            return msg.content
🔴 מתקדם מערכת RAG עם Embeddings + Vector DB

מערכת Q&A על מסמכים פרטיים — ChatGPT עונה רק על בסיס הידע הארגוני שלך, ולא ממציא.

זמן
2–3 ימים
כלים
Embeddings, Pinecone
עלות הגדרה
~$5
מיומנות
RAG Pipeline
# שלב 1: Indexing — Embedding המסמכים
def index_documents(chunks: list[str]) -> list:
    response = client.embeddings.create(
        model="text-embedding-3-small",
        input=chunks
    )
    # שמור ב-Pinecone / Chroma / pgvector
    return [e.embedding for e in response.data]

# שלב 2: RAG Query
def rag_query(question: str) -> str:
    # Embed את השאלה
    q_vec = client.embeddings.create(
        model="text-embedding-3-small",
        input=question
    ).data[0].embedding

    # חפש את ה-chunks הרלוונטיים (top-5)
    results = vector_db.query(vector=q_vec, top_k=5)
    context = "\n\n".join([r["metadata"]["text"] for r in results])

    # GPT עונה רק על בסיס הקונטקסט
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {
                "role": "system",
                "content": f"ענה רק על בסיס המידע הבא. "
                           f"אם התשובה לא במידע — אמור 'לא יודע'.\n\n{context}"
            },
            {"role": "user", "content": question}
        ]
    )
    return response.choices[0].message.content

גיליון עזר — ChatGPT Cheat Sheet

כל מה שצריך בהישג יד — טבלאות, templates, endpoints ושגיאות נפוצות.

השוואת מודלים מהירה

מודל מהירות Reasoning עברית Vision עלות
GPT-4oמהירטובמצוין$$
GPT-4o miniמהיר מאודבסיסיטוב$
o3איטימצויןמצוין$$$$
o4-miniבינונימצויןטוב$$

Prompt Templates מוכנים לשימוש

summarizeסיכום מסמך
סכם ב-5 נקודות עיקריות. כל נקודה: 1–2 משפטים. הדגש מסקנות ופעולות נדרשות. טקסט: [...]
codeCode Review
סקור את הקוד. מצא: 1) באגים 2) בעיות ביצועים 3) אבטחה 4) קריאות. ציין שורות ספציפיות. קוד: [...]
lightbulbרעיונות
צור 10 רעיונות ל-[נושא]. מגבלות: [X, Y]. קהל: [תיאור]. דרג כל רעיון 1–5 לפי ישימות וחדשנות.
psychologyChain-of-Thought
פתור שלב אחר שלב. הצג חשיבה מפורטת. בסוף: סכם את התשובה הסופית בבירור. בעיה: [...]
translateתרגום עם הקשר
תרגם לאנגלית עסקית. שמור על Tone המקורי. הסבר 3 בחירות תרגום חלופיות למושגים קשים. טקסט: [...]
securityRed Team
פעל כ-adversary. מצא 5 חולשות ב-[מוצר/תהליך]. לכל חולשה: severity, exploit vector, המלצת תיקון.

API Endpoints עיקריים

Endpoint שימוש Python SDK Method
/chat/completionsשיחות, GPT-4o, Function Callingclient.chat.completions.create()
/embeddingsוקטורים לחיפוש סמנטי ו-RAGclient.embeddings.create()
/images/generationsDALL-E 3 — יצירת תמונותclient.images.generate()
/audio/transcriptionsWhisper STT — תמלול אודיוclient.audio.transcriptions.create()
/audio/speechTTS — טקסט לדיבורclient.audio.speech.create()
/beta/assistantsAssistants API + Threadsclient.beta.assistants.create()
/batchesBatch API — 50% הנחה, asyncclient.batches.create()

שגיאות נפוצות ופתרונות

RateLimitError
הגעת למגבלת בקשות. פתרון: הוסף exponential backoff עם tenacity. לעומס גבוה — שדרג ל-Tier 2+ בדשבורד OpenAI.
ContextLengthError
הפרומפט + היסטוריה ארוכים מדי. פתרון: חתוך הודעות ישנות, השתמש ב-tiktoken לספירת tokens לפני שליחה.
JSON Parse Error
המודל לא החזיר JSON תקני. פתרון: הוסף response_format={"type":"json_object"} ו-"Return ONLY valid JSON" בסיום הפרומפט.
Hallucination
המודל המציא עובדות. פתרון: הוסף "אם אינך בטוח — אמור 'לא יודע'". בנה מערכת RAG כדי לעגן את התשובות במקורות אמיתיים.
AuthenticationError
API Key שגוי או פג תוקף. פתרון: ודא ש-OPENAI_API_KEY מוגדר. בדוק billing בדשבורד platform.openai.com.
TimeoutError
הבקשה לקחה יותר מדי זמן. פתרון: הוסף timeout=30 לקריאת API ו-Streaming במקום חכייה לתשובה שלמה.
rocket_launch

הצעד הבא

עכשיו שיש לך את הבסיס — הגיע הזמן ליישם. צור חשבון ב-platform.openai.com, קבל API Key, והתחל עם דוגמאות הקוד מהמדריך.