מדריך ChatGPT המלא — GPT-4o, API ואוטומציה

מה זה ChatGPT?

ChatGPT הוא ממשק שיחה של חברת OpenAI, הפועל על גבי משפחת מודלי GPT (Generative Pre-trained Transformer). זה לא רק "AI שעונה על שאלות" — זו פלטפורמה שלמה לכתיבה, ניתוח, קידוד, יצירת תמונות וקול, בניית אפליקציות ואוטומציה. מאז השקתו בנובמבר 2022 הוא שינה את אופן העבודה של מיליוני אנשים ברחבי העולם.

לב המוצר הוא מודל שפה גדול (LLM) שאומן על כמויות עצומות של טקסט והשלים את האימון עם RLHF (Reinforcement Learning from Human Feedback) — טכניקה שהופכת אותו לשימושי, בטוח ומוכוון לעזרה.

GPT-4o vs מודלי o-series vs GPT-3.5 — מה ההבדל?

מודל	Context	Vision	מחיר (1M input)	מומלץ ל-
GPT-4o	128K	כן	$2.50	כל שימוש כללי, ברירת מחדל
GPT-4o mini	128K	כן	$0.15	volume גבוה, עלות נמוכה
o3	200K	כן	$10.00	reasoning, מתמטיקה, קוד מורכב
o4-mini	200K	כן	$1.10	reasoning במחיר סביר
GPT-3.5 Turbo	16K	לא	$0.50	legacy — לא מומלץ לפרויקטים חדשים

מה אפשר לעשות עם ChatGPT?

כתיבה: מאמרים, מיילים, קופירייטינג, תסריטים, תרגום, עריכה
קוד: כתיבה, debug, code review, הסבר קוד, המרת שפות תכנות
ניתוח נתונים: Code Interpreter מריץ Python ישירות, יוצר גרפים ומנתח קבצים
תמונות: DALL-E 3 מובנה — יצירה ועריכה מטקסט
קול: Voice Mode עם זמן תגובה נמוך כמו שיחה אנושית אמיתית
מחקר: Web Search בזמן אמת עם Grounding מקורות (ChatGPT Plus)
אוטומציה: Function Calling, Assistants API, multi-step Agents

lightbulb ChatGPT Free vs Plus vs Team

Free — GPT-4o עם מגבלות קצב, DALL-E מוגבל. Plus ($20/חודש) — גישה מלאה ל-GPT-4o, o3, o4-mini, DALL-E 3, Web Search, Code Interpreter, Custom GPTs. Team ($30/משתמש) — data privacy, context ארוך יותר, ניהול ארגוני. Enterprise — SSO, audit logs, SLA מובטח.

מפת הדרכים לשליטה ב-ChatGPT

המסע מ"משתמש מתחיל" ל"מאסטר" עובר דרך 5 שלבים ברורים. כל שלב בונה על הקודם — אל תדלג.

Stage 1 Foundations — יסודות 1–2 שבועות

ממשק הצ'אט

ניווט, היסטוריה, שיתוף שיחות, העלאת קבצים, Custom Instructions

System Prompts

Custom Instructions (My ChatGPT), הגדרת "אישיות" המודל לכל שיחה

Prompting בסיסי

שאלות ברורות, קונטקסט, הגדרת פורמט הפלט הרצוי

Stage 2 Core Skills — כישורי ליבה 2–4 שבועות

Prompt Engineering

Zero-shot, Few-shot, Chain-of-Thought, Persona technique

DALL-E 3

יצירת תמונות, בחירת סגנונות, aspect ratios, image editing

Code Interpreter

ניתוח CSV, יצירת גרפים, עיבוד קבצים, מחשבונים מורכבים

Stage 3 Intermediate — ביניים 1–2 חודשים

Custom GPTs

בניית GPT מותאם עם Instructions, Knowledge Files ו-Actions

Memory

שמירת זיכרון לאורך שיחות, ניהול context ועדכון ידני

Web Search

חיפוש בזמן אמת, Grounding עובדות, שילוב מקורות

Stage 4 Advanced — מתקדם 2–3 חודשים

OpenAI API

Authentication, completions, parameters, error handling

Function Calling

Tool Use, structured JSON responses, tool orchestration

Fine-Tuning

אימון על דאטה מותאמת, dataset preparation, evaluation

Batch API

עיבוד כמויות גדולות עם הנחה 50%, async processing

Stage 5 Mastery — שליטה מלאה מתמשך

OpenAI Agents SDK

multi-step agents, tool orchestration, handoffs בין agents

Production Deployment

rate limits, retry logic, monitoring, cost optimization

RAG + Embeddings

מערכות חיפוש סמנטי עם Vector DB, pipeline מלא

הנדסת פרומפטים — Prompt Engineering

Prompt Engineering היא האמנות לנסח הוראות שמוציאות מהמודל את התוצאה הטובה ביותר. ההבדל בין פרומפט גרוע לטוב יכול להיות ההבדל בין פלט חסר תועלת לפלט שחוסך שעות עבודה. זה לא קסם — זה מיומנות הניתנת ללמידה.

Zero-shot vs Few-shot vs Chain-of-Thought

Zero-shot

שאלה ישירה ללא דוגמאות. עובד טוב לפעולות פשוטות וברורות.

"תרגם לאנגלית:
שלום עולם"

Few-shot

מספר דוגמאות לפני הבקשה. מאמן את המודל על הפורמט הרצוי.

"חיובי → 😊
שלילי → 😞
ניטרלי → 😐
סווג: 'אהבתי!'"

Chain-of-Thought

בקש מהמודל לחשוב בקול. מייעל reasoning, מתמטיקה והיגיון.

"פתור שלב אחר שלב.
הצג את החשיבה שלך
לפני התשובה."

Persona Technique — "Act as..."

אחת הטכניקות החזקות ביותר היא הגדרת פרסונה — בקש מהמודל לפעול כמומחה בתחום מסוים. זה משפר את איכות, עומק ואגנון הפלט באופן משמעותי. הנה template מוכן לשימוש:

System Prompt Template — Persona

SYSTEM: פעל כמומחה [תחום] עם [X] שנות ניסיון.
הסגנון שלך: [מקצועי/חברותי/טכני].
המשתמש: [תיאור הקהל].
פורמט הפלט: [JSON/Markdown/רשימות].
שפה: עברית בלבד, מונחים טכניים באנגלית.
אם אינך בטוח — אמור זאת במפורש. אל תמציא מידע.

Structured Output — JSON Mode

כשצריך פלט מובנה לעיבוד קוד, ישנן שתי גישות: הגדרת response_format: { type: "json_object" } ב-API, או שימוש ב-Structured Outputs — הגדרת JSON Schema מדויק שהמודל חייב לעמוד בו. Structured Outputs מבטיח 100% ציות לסכמה.

Structured Outputs עם Pydantic

from openai import OpenAI
from pydantic import BaseModel

client = OpenAI()

class ArticleAnalysis(BaseModel):
    title: str
    main_topic: str
    sentiment: str  # "positive" | "negative" | "neutral"
    key_points: list[str]
    word_count: int

response = client.beta.chat.completions.parse(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "נתח את המאמר ופרט JSON מובנה."},
        {"role": "user",   "content": "מאמר: [טקסט המאמר כאן]"}
    ],
    response_format=ArticleAnalysis,
)

analysis = response.choices[0].message.parsed
print(f"נושא: {analysis.main_topic}")
print(f"נקודות מפתח: {analysis.key_points}")

Temperature ו-Top-p — שליטה בגיוון

Temperature (0–2)

0.0–0.3

קוד, JSON, עובדות

0.5–0.8

כתיבה מקצועית

0.9–1.2

כתיבה יצירתית

1.5+

ניסויי בלבד

Top-p (Nucleus Sampling)

מגדיר את מאגר המילים שהמודל בוחר ממנו. 0.1 = רק המילים המסתברות ביותר (פחות גיוון, יותר עקביות). 0.9 = מגוון רחב יותר.

המלצה: שנה רק Temperature. אל תשנה גם Top-p וגם Temperature יחד — הם מתקשרים ויוצרים תוצאות בלתי צפויות.

warning 5 טעויות נפוצות בפרומפטינג

✗ פרומפט ארוך מדי ללא מיקוד — פרק לשלבים נפרדים, שלח הוראות ממוקדות
✗ לא לציין פורמט הפלט הרצוי — תמיד הגדר: רשימה/JSON/פסקה/טבלה
✗ לבקש "תהיה יצירתי" ללא קונסטריינטים — זה מביא תוצאות גנריות
✗ חוסר קונטקסט — "תכתוב מאמר" vs "תכתוב מאמר ל-LinkedIn על AI לקהל B2B מנהלים"
✗ לא לאמת את הפלט — ChatGPT עשוי להמציא מידע. תמיד וודא עובדות קריטיות

יכולות GPT-4o

GPT-4o ("omni") הוא המודל הרב-מודלי של OpenAI — הוא מבין ומייצר טקסט, תמונות וקול בשיחה אחת רציפה. זו קפיצה משמעותית ממודלים קודמים שטיפלו בכל מודאליות בנפרד עם latency גבוה.

Vision — ניתוח תמונות ומסמכים

שלח כל תמונה, screenshot, PDF, דיאגרמה או גרף — GPT-4o יתאר, ינתח ויענה על שאלות לגביה. הממשק תומך ב-URL ובקבצים מקומיים (base64). שימושים עיקריים בעבודה:

ניתוח גרפים ותרשימים מעסקיים — מגמות, חריגים, השוואות
קריאת טפסים, קבלות, חשבוניות ומסמכי Word/PDF
Debug של screenshots מ-UI — איתור שגיאות בממשקים
הסבר דיאגרמות ארכיטקטורה ו-ERD
תרגום תמונות עם טקסט, מסמכים סרוקים (OCR)

Vision API — ניתוח תמונה

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "נתח את הגרף הזה: מה המגמה הכללית? אילו חריגים יש?"},
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/chart.png"}
                    # או: "url": f"data:image/jpeg;base64,{base64_image}"
                }
            ]
        }
    ]
)
print(response.choices[0].message.content)

tips_and_updates Vision: טיפ מקצועי

כשמנתחים PDF מורכב, פרק אותו לדפים בודדים (PDF לתמונות PNG) ושלח דף אחד בכל פעם. GPT-4o מסתדר עם מסמכים עד כ-20 עמודים ישירות, אבל האיכות יורדת בקבצים ארוכים. השתמש ב-pypdf + pdf2image בפייתון לפיצול אוטומטי.

DALL-E 3 — יצירת תמונות

ב-ChatGPT Plus יש גישה מובנית ל-DALL-E 3. פשוט בקש "צור תמונה של..." — GPT-4o אפילו משפר אוטומטית את הפרומפט שלך לפני שליחתו ל-DALL-E. דרך ה-API ניתן לשלוט על גודל, איכות וסגנון:

from openai import OpenAI
client = OpenAI()

response = client.images.generate(
    model="dall-e-3",
    prompt="לוגו מינימליסטי לחברת AI, צבעי כחול וסגול, סגנון flat design, רקע לבן",
    size="1024x1024",   # 1024x1024 | 1792x1024 | 1024x1792
    quality="hd",       # "standard" | "hd"
    style="vivid",      # "vivid" | "natural"
    n=1
)
print(response.data[0].url)
print(response.data[0].revised_prompt)  # הפרומפט שהשתפר ע"י GPT

Code Interpreter — מנוע Python מובנה

Code Interpreter (Advanced Data Analysis) מריץ קוד Python בזמן אמת בסנדבוקס מבודד. השלך קובץ CSV, Excel, JSON — וקבל ניתוח, גרפים ותובנות. זה כלי בעל ערך אדיר לאנשי נתונים, אנליסטים ומנהלים.

ניתוח סטטיסטי: ממוצעים, חריגים, מגמות, קורלציות
ויזואליזציה עם matplotlib ו-seaborn — גרפים ותרשימים
עיבוד קבצים: חילוץ טקסט מ-PDF, שינוי Excel, המרת פורמטים
מחשבונים מורכבים: ROI, NPV, המרות מטבע, חישובי פיננסים
ניתוח NLP בסיסי: ספירת מילים, sentiment, חילוץ ישויות

Voice Mode — שיחה אנושית

GPT-4o Voice Mode מאפשר שיחה מדוברת עם זמן תגובה של פחות משנייה — קרוב לשיחה אנושית טבעית. המודל מזהה אינטונציה, יכול להיות מופסק באמצע משפט, ומשלב מגוון קולות מובנים. זמין ב-ChatGPT Plus דרך האפליקציה הנייידת. שימושים: תרגול שפות, פגישות יד-ראשונה, הכנת נאומים.

Memory — זיכרון לאורך שיחות

ChatGPT יכול לשמור עובדות עליך לאורך שיחות שונות ולהשתמש בהן בעתיד. ניתן לנהל את הזיכרון ידנית: "זכור שאני CTO, מפתח Python, ועובד על פרויקט SaaS בתחום הבריאות". Memory זמין ב-Plus ו-Team, וניתן לכבות אותו דרך Settings > Personalization > Memory.

Custom GPTs

Custom GPTs מאפשרים לבנות גרסה מותאמת אישית של ChatGPT עם הוראות, ידע ויכולות ספציפיות — בלי לכתוב שורת קוד אחת. אפשר לשתף אותם בציבור ב-GPT Store או להשאיר אותם פרטיים לשימוש אישי או ארגוני.

שלושת הרכיבים של Custom GPT

description

Instructions

הוראות System Prompt קבועות. מגדירות פרסונה, התנהגות, מגבלות ופורמט. עד ~8,000 תווים. הלב של ה-GPT.

folder_open

Knowledge Files

העלה PDF, Word, TXT — המודל ישתמש בהם כבסיס ידע. אידיאלי לתיעוד מוצר, FAQ ארגוני, נהלים, מחירונים.

electric_plug

Actions

חיבור ל-APIs חיצוניים דרך OpenAPI spec. המודל קורא API, שולח נתונים, מריץ webhooks — הכל בשיחה.

דוגמה: Custom GPT למנהל פרויקטים

# Instructions לדוגמה — Custom GPT "מנהל הפרויקטים שלי"

אתה מנהל פרויקטים בכיר עם 15 שנות ניסיון ב-Agile, Scrum ו-Kanban.
תפקידך לעזור לתכנן, לעקוב ולספק משוב על פרויקטים.

כאשר מתוארת בעיה או פרויקט חדש, תמיד שאל על:
- Timeline ו-Deadline
- גודל הצוות ומיומנויות
- Dependencies ו-Blockers אפשריים
- Budget constraints

תמיד ספק:
1. חלוקה ל-Milestones עם תאריכים
2. רשימת Risks עם ה-Impact וה-Mitigation
3. KPIs מדידים להצלחה

פורמט: Markdown עם headers ברורים.
שפה: עברית, מונחים מקצועיים באנגלית.
אל תספק הערכות זמן ללא מידע על גודל הצוות.

store GPT Store — לפני שבונים בעצמנו

ב-GPT Store יש מיליוני Custom GPTs ציבוריים. לפני שתבנה אחד בעצמך — חפש שם. קטגוריות פופולריות: Productivity, Research, Coding, Creative Writing, Education. חיפוש פשוט: chatgpt.com/gpts

ChatGPT API למפתחים

ה-OpenAI API מאפשר לשלב את יכולות GPT ישירות באפליקציות שלך. זהו ה-API הנפוץ ביותר ל-AI בעולם — עם תיעוד מצוין, SDKs ל-Python, JavaScript, Go, Java ועוד, ו-community ענק.

התחלה מהירה — Python SDK

התקנה והגדרת API Key

# התקנה
pip install openai

# הגדרת API Key (מומלץ כמשתנה סביבה)
export OPENAI_API_KEY="sk-proj-..."  # Linux/Mac
# או ב-.env file עם python-dotenv

קריאה בסיסית — Chat Completion

from openai import OpenAI

# SDK מזהה את OPENAI_API_KEY אוטומטית
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "אתה עוזר מקצועי. ענה בעברית תמיד."},
        {"role": "user",   "content": "סכם את המסמך הזה ב-3 נקודות: [טקסט המסמך]"}
    ],
    temperature=0.7,
    max_tokens=1000,
    top_p=1.0,
    frequency_penalty=0.0,
    presence_penalty=0.0
)

# קריאת התשובה
print(response.choices[0].message.content)

# מידע על שימוש ב-tokens
print(f"Input tokens:  {response.usage.prompt_tokens}")
print(f"Output tokens: {response.usage.completion_tokens}")
print(f"Total tokens:  {response.usage.total_tokens}")

Function Calling / Tool Use

Function Calling מאפשר למודל לקרוא לפונקציות מוגדרות מראש — GPT יחליט מתי לקרוא לאיזו פונקציה, ויחזיר את הארגומנטים בפורמט JSON. זה הבסיס לבניית AI Agents שמבצעים פעולות בעולם האמיתי.

import json
from openai import OpenAI

client = OpenAI()

# הגדרת הכלים הזמינים למודל
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "קבל מידע מזג אוויר לעיר ותאריך נתונים",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {
                        "type": "string",
                        "description": "שם העיר, לדוגמה: תל אביב, ירושלים"
                    },
                    "unit": {
                        "type": "string",
                        "enum": ["celsius", "fahrenheit"],
                        "description": "יחידת טמפרטורה"
                    }
                },
                "required": ["city"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "search_web",
            "description": "חפש מידע עדכני ברשת",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {"type": "string", "description": "שאילתת החיפוש"}
                },
                "required": ["query"]
            }
        }
    }
]

messages = [{"role": "user", "content": "מה מזג האוויר בתל אביב היום?"}]

response = client.chat.completions.create(
    model="gpt-4o",
    messages=messages,
    tools=tools,
    tool_choice="auto"  # "auto" | "required" | "none"
)

# בדוק אם המודל רוצה לקרוא לפונקציה
choice = response.choices[0]
if choice.finish_reason == "tool_calls":
    tool_call = choice.message.tool_calls[0]
    args = json.loads(tool_call.function.arguments)
    print(f"קריאה ל: {tool_call.function.name}")
    print(f"ארגומנטים: {args}")
    # כאן תריץ את הפונקציה האמיתית ותחזיר תוצאה

Streaming — תגובות בזמן אמת

from openai import OpenAI

client = OpenAI()

# Streaming מחזיר chunks בזמן אמת — כמו ChatGPT
with client.chat.completions.stream(
    model="gpt-4o",
    messages=[{"role": "user", "content": "כתוב שיר קצר על ים התיכון"}]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

print()  # שורה חדשה בסוף

Assistants API + Threads

Assistants API מיועד לאפליקציות שצריכות לנהל שיחות ארוכות, לשמור history, ולהשתמש בכלים — כל זה מנוהל על ידי OpenAI. מתאים לצ'אטבוטים, עוזרים אישיים, ומערכות Q&A.

from openai import OpenAI
client = OpenAI()

# שלב 1: יצירת Assistant (פעם אחת)
assistant = client.beta.assistants.create(
    name="עוזר ניהול משימות",
    instructions="אתה עוזר לניהול משימות יומיות. ענה בעברית.",
    model="gpt-4o",
    tools=[
        {"type": "code_interpreter"},
        {"type": "file_search"}
    ]
)

# שלב 2: יצירת Thread לכל שיחה
thread = client.beta.threads.create()

# שלב 3: הוספת הודעה לשיחה
client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="ארגן את המשימות לפי עדיפות: כתיבת דוח, פגישה עם לקוח, עדכון README, code review"
)

# שלב 4: הרצה וחכייה לתוצאה
run = client.beta.threads.runs.create_and_poll(
    thread_id=thread.id,
    assistant_id=assistant.id
)

# שלב 5: קריאת תשובה
if run.status == "completed":
    messages = client.beta.threads.messages.list(thread_id=thread.id)
    print(messages.data[0].content[0].text.value)

תמחור — מה זה עולה?

מודל	Input (1M)	Output (1M)	הערה
GPT-4o	$2.50	$10.00	הכי פופולרי
GPT-4o mini	$0.15	$0.60	volume גבוה
o3	$10.00	$40.00	reasoning מורכב
o4-mini	$1.10	$4.40	reasoning חסכוני
text-embedding-3-small	$0.02	—	RAG, חיפוש סמנטי
Whisper (STT)	$0.006/דקה	—	תמלול אודיו

savings 3 דרכים לחסוך בעלויות API

1.Prompt Caching — 50% הנחה על tokens שנשמרו ב-cache. עובד אוטומטית על prompts זהים.
2.Batch API — עיבוד כמויות גדולות בהנחה 50% עם SLA של 24 שעות.
3.max_tokens מדויק — הגדר לפי הצורך האמיתי. כל token שלא צריך — עלות מיותרת.

5 פרויקטים מעשיים

למידה אמיתית קורה דרך בנייה. הנה 5 פרויקטים מדורגים לפי קושי — כל אחד עם scope ברור, זמן אמיתי ומיומנויות שתרוויח.

🟢 מתחיל צ'אטבוט שירות לקוחות בסיסי

צ'אטבוט Python עם CLI שעונה על שאלות לפי FAQ מוגדר, שומר history ומפנה לתמיכה אנושית כשצריך.

זמן

2–3 שעות

כלים

openai, python

עלות API

~$0.01

מיומנות

Chat API, Prompts

# מה תבנה:

1. System Prompt עם מידע ה-FAQ של החברה
2. לולאה שמנהלת היסטוריית שיחה (messages list)
3. Validation — מסרב לענות על שאלות off-topic
4. Fallback: "שאלה זו מחוץ לתחום שלי — פנה לתמיכה"

🟡 בינוני כלי ניתוח PDF + Vision

אפליקציה שמקבלת דוח פיננסי (PDF) ומחלצת תובנות, מגמות וגרף ויזואלי אוטומטית.

זמן

4–6 שעות

כלים

Assistants API

עלות API

~$0.10

מיומנות

Files, Threads

# שלבים:

1. העלה PDF דרך Files API: client.files.create()
2. צור Assistant עם code_interpreter + file_search
3. בקש: "ספק 5 תובנות וצור גרף מגמות חודשי"
4. הורד את התמונה שנוצרה דרך client.files.content()

🟡 בינוני Custom GPT לכתיבת תוכן שיווקי

GPT מותאם לכתיבת פוסטים ל-LinkedIn, מיילים ומודעות בסגנון מותג ספציפי — ללא קוד.

זמן

3–4 שעות

כלים

Custom GPTs, ללא קוד

עלות

ChatGPT Plus

מיומנות

Instructions, Knowledge

# שלבים ב-GPT Builder:

1. Instructions: Brand Voice, Tone, Do/Don't
2. Knowledge: העלה Brand Guidelines PDF
3. Conversation Starters: "כתוב פוסט LinkedIn על..."
4. בדוק עם 10 דוגמאות מגוונות ואמן את ה-Instructions

🔴 מתקדם Workflow Agent עם Function Calling

Agent שמקבל משימה בשפה טבעית ומבצע אותה ע"י קריאה ל-APIs חיצוניים: Notion, Gmail, Slack.

זמן

1–2 ימים

כלים

Function Calling

עלות

~$0.50/יום

מיומנות

Tool Orchestration

def run_agent(user_task: str) -> str:
    messages = [
        {"role": "system", "content": "אתה agent לאוטומציה. יש לך כלים."},
        {"role": "user",   "content": user_task}
    ]

    while True:
        response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            tools=AVAILABLE_TOOLS,
            tool_choice="auto"
        )
        msg = response.choices[0].message
        messages.append(msg)  # שמור את תגובת ה-agent

        if msg.tool_calls:
            # בצע כל כלי שה-agent ביקש
            for tc in msg.tool_calls:
                args = json.loads(tc.function.arguments)
                result = execute_tool(tc.function.name, args)
                messages.append({
                    "role": "tool",
                    "tool_call_id": tc.id,
                    "content": json.dumps(result)
                })
        else:
            # המודל סיים — אין tool_calls
            return msg.content

🔴 מתקדם מערכת RAG עם Embeddings + Vector DB

מערכת Q&A על מסמכים פרטיים — ChatGPT עונה רק על בסיס הידע הארגוני שלך, ולא ממציא.

זמן

2–3 ימים

כלים

Embeddings, Pinecone

עלות הגדרה

~$5

מיומנות

RAG Pipeline

# שלב 1: Indexing — Embedding המסמכים
def index_documents(chunks: list[str]) -> list:
    response = client.embeddings.create(
        model="text-embedding-3-small",
        input=chunks
    )
    # שמור ב-Pinecone / Chroma / pgvector
    return [e.embedding for e in response.data]

# שלב 2: RAG Query
def rag_query(question: str) -> str:
    # Embed את השאלה
    q_vec = client.embeddings.create(
        model="text-embedding-3-small",
        input=question
    ).data[0].embedding

    # חפש את ה-chunks הרלוונטיים (top-5)
    results = vector_db.query(vector=q_vec, top_k=5)
    context = "\n\n".join([r["metadata"]["text"] for r in results])

    # GPT עונה רק על בסיס הקונטקסט
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {
                "role": "system",
                "content": f"ענה רק על בסיס המידע הבא. "
                           f"אם התשובה לא במידע — אמור 'לא יודע'.\n\n{context}"
            },
            {"role": "user", "content": question}
        ]
    )
    return response.choices[0].message.content

גיליון עזר — ChatGPT Cheat Sheet

כל מה שצריך בהישג יד — טבלאות, templates, endpoints ושגיאות נפוצות.

השוואת מודלים מהירה

מודל	מהירות	Reasoning	עברית	Vision	עלות
GPT-4o	מהיר	טוב	מצוין	✓	$$
GPT-4o mini	מהיר מאוד	בסיסי	טוב	✓	$
o3	איטי	מצוין	מצוין	✓	$$$$
o4-mini	בינוני	מצוין	טוב	✓	$$

Prompt Templates מוכנים לשימוש

summarizeסיכום מסמך

סכם ב-5 נקודות עיקריות. כל נקודה: 1–2 משפטים. הדגש מסקנות ופעולות נדרשות. טקסט: [...]

codeCode Review

סקור את הקוד. מצא: 1) באגים 2) בעיות ביצועים 3) אבטחה 4) קריאות. ציין שורות ספציפיות. קוד: [...]

lightbulbרעיונות

צור 10 רעיונות ל-[נושא]. מגבלות: [X, Y]. קהל: [תיאור]. דרג כל רעיון 1–5 לפי ישימות וחדשנות.

psychologyChain-of-Thought

פתור שלב אחר שלב. הצג חשיבה מפורטת. בסוף: סכם את התשובה הסופית בבירור. בעיה: [...]

translateתרגום עם הקשר

תרגם לאנגלית עסקית. שמור על Tone המקורי. הסבר 3 בחירות תרגום חלופיות למושגים קשים. טקסט: [...]

securityRed Team

פעל כ-adversary. מצא 5 חולשות ב-[מוצר/תהליך]. לכל חולשה: severity, exploit vector, המלצת תיקון.

API Endpoints עיקריים

Endpoint	שימוש	Python SDK Method
/chat/completions	שיחות, GPT-4o, Function Calling	client.chat.completions.create()
/embeddings	וקטורים לחיפוש סמנטי ו-RAG	client.embeddings.create()
/images/generations	DALL-E 3 — יצירת תמונות	client.images.generate()
/audio/transcriptions	Whisper STT — תמלול אודיו	client.audio.transcriptions.create()
/audio/speech	TTS — טקסט לדיבור	client.audio.speech.create()
/beta/assistants	Assistants API + Threads	client.beta.assistants.create()
/batches	Batch API — 50% הנחה, async	client.batches.create()

שגיאות נפוצות ופתרונות

RateLimitError

הגעת למגבלת בקשות. פתרון: הוסף exponential backoff עם tenacity. לעומס גבוה — שדרג ל-Tier 2+ בדשבורד OpenAI.

ContextLengthError

הפרומפט + היסטוריה ארוכים מדי. פתרון: חתוך הודעות ישנות, השתמש ב-tiktoken לספירת tokens לפני שליחה.

JSON Parse Error

המודל לא החזיר JSON תקני. פתרון: הוסף response_format={"type":"json_object"} ו-"Return ONLY valid JSON" בסיום הפרומפט.

Hallucination

המודל המציא עובדות. פתרון: הוסף "אם אינך בטוח — אמור 'לא יודע'". בנה מערכת RAG כדי לעגן את התשובות במקורות אמיתיים.

AuthenticationError

API Key שגוי או פג תוקף. פתרון: ודא ש-OPENAI_API_KEY מוגדר. בדוק billing בדשבורד platform.openai.com.

TimeoutError

הבקשה לקחה יותר מדי זמן. פתרון: הוסף timeout=30 לקריאת API ו-Streaming במקום חכייה לתשובה שלמה.

rocket_launch

הצעד הבא

עכשיו שיש לך את הבסיס — הגיע הזמן ליישם. צור חשבון ב-platform.openai.com, קבל API Key, והתחל עם דוגמאות הקוד מהמדריך.

Prompt Engineering מתקדם בניית מערכת RAG השוואה: Google Gemini

מדריך ChatGPT המלא GPT-4o, API ואוטומציה

מה זה ChatGPT?

GPT-4o vs מודלי o-series vs GPT-3.5 — מה ההבדל?

מה אפשר לעשות עם ChatGPT?

מפת הדרכים לשליטה ב-ChatGPT

הנדסת פרומפטים — Prompt Engineering

Zero-shot vs Few-shot vs Chain-of-Thought

Persona Technique — "Act as..."

Structured Output — JSON Mode

Temperature ו-Top-p — שליטה בגיוון

יכולות GPT-4o

Vision — ניתוח תמונות ומסמכים

DALL-E 3 — יצירת תמונות

Code Interpreter — מנוע Python מובנה

Voice Mode — שיחה אנושית

Memory — זיכרון לאורך שיחות

Custom GPTs

שלושת הרכיבים של Custom GPT

דוגמה: Custom GPT למנהל פרויקטים

ChatGPT API למפתחים

התחלה מהירה — Python SDK

Function Calling / Tool Use

Streaming — תגובות בזמן אמת

Assistants API + Threads

תמחור — מה זה עולה?

5 פרויקטים מעשיים

גיליון עזר — ChatGPT Cheat Sheet

השוואת מודלים מהירה

Prompt Templates מוכנים לשימוש

API Endpoints עיקריים

שגיאות נפוצות ופתרונות

הצעד הבא

מדריך ChatGPT המלא
GPT-4o, API ואוטומציה