מעודכן לאפריל 2026 20 דקות קריאה למתחילים ומתקדמים

Google Gemini 2.5
המדריך המלא בעברית

כל מה שצריך לדעת על Gemini 2.5 Pro ו-Flash — מה הם יכולים, איך הם משתווים ל-GPT-4o, ואיך מתחילים להשתמש ב-API בחינם. כולל multimodal, grounding, thinking mode ו-5 פרויקטים מעשיים.

2M
Context Window
חינם
AI Studio API
#1
בבנצ'מארקים
play_circle
Google Gemini 2.5 — מדריך מלא עם API
YouTube • חפש סרטוני הסבר
open_in_new

מה זה Google Gemini?

Gemini הוא שם משפחה של מודלי שפה (LLM) שפיתחה Google DeepMind. הושק בסוף 2023 והפך תוך שנה לאחד המתחרים הרציניים ביותר ל-GPT-4 של OpenAI. בפברואר 2024 שונה שם Bard ל-Gemini, וכיום הממשק הצרכני זמין בכתובת gemini.google.com.

מה שמיוחד ב-Gemini הוא שהוא multimodal מהיסוד — הוא לא "מודל טקסט שהוסיפו לו ראייה", אלא מודל שנבנה לעבד טקסט, תמונות, אודיו, וידאו וקוד ביחד. בנוסף, לגמיני יש אינטגרציה עמוקה עם שירותי Google — Gmail, Docs, Drive, Search ועוד.

lightbulb
למה Gemini רלוונטי לישראלים?

Google Workspace נפוץ מאוד בחברות ישראליות. Gemini מוטמע ישירות ב-Gmail, Docs ו-Sheets — כך שעובדים רבים כבר "נוגעים" בו יום-יום.

הגרסאות של Gemini — מה ההבדלים?

נכון לאפריל 2026, גוגל מציעה שלושה דגמים עיקריים בסדרת 2.5:

Gemini 2.5 Pro
המודל הכי חזק. Reasoning מתקדם, context של 2M טוקן, מצוין לקוד ולניתוח מורכב.
חינם ב-AI Studio (מוגבל) · Pro בתשלום
Gemini 2.5 Flash
מהיר ומוזל. 90% מביצועי Pro במחיר פי 10 זול יותר. מומלץ ל-Production.
חינם ב-AI Studio · API זול
Gemini 2.0 Flash Lite
הכי מהיר והכי זול. מתאים לאפליקציות עם latency נמוך ונפח גדול.
הכי זול בשוק · Ultra-fast

השוואת גרסאות מפורטת

מאפיין 2.5 Pro 2.5 Flash Flash-8B / Lite
Context Window 2M טוקן 1M טוקן 1M טוקן
מחיר Input (1M tokens) $1.25 $0.15 $0.075
Thinking Mode כן (מתקדם) כן (בסיסי) לא
Multimodal מלא מלא חלקי
Latency ~3-8 שניות ~1-3 שניות <1 שנייה
מתאים ל… ניתוח קובצים, קוד, research Production apps, chatbots סיווג, שאלות פשוטות

Context Window של 2 מיליון טוקן — מה זה אומר בפועל?

2 מיליון טוקן שווים בערך 1,500 ספרים או 10 שעות של וידאו. בפרקטיקה, זה אומר שאפשר להזין לגמיני קוד-בייס שלם, ספר מלא, או תמלול פגישות של שבוע שלם — ולשאול שאלות עליו. זה המקרה בו Gemini Pro מנצח את כולם.

Gemini 2.5 vs GPT-4o vs Claude — השוואה ישירה

קריטריון Gemini 2.5 Pro GPT-4o Claude 3.7
Context Window 2M טוקן 🏆 128K 200K
כתיבת קוד מעולה 🏆 מצוין מצוין
עברית טוב מצוין 🏆 טוב
ניתוח תמונות מעולה 🏆 מצוין טוב
אינטגרציית Google מושלם 🏆 אין אין
מחיר API זול 🏆 בינוני בינוני
הגיון ו-Reasoning מעולה 🏆 מצוין מצוין 🏆

מסקנה: Gemini 2.5 Pro הוא הבחירה הטובה ביותר אם אתה עובד עם קבצים גדולים, קוד-בייסים ארוכים, או מוצרי Google. GPT-4o עדיין מוביל בעברית.

Google AI Studio — נקודת הכניסה החינמית

Google AI Studio (aistudio.google.com) הוא הדרך המומלצת להתחיל עם Gemini. בחינם, ללא כרטיס אשראי, עם 1,500 בקשות ביום.

aistudio.google.com
Stream Realtime Prompt Chat
System Instructions אתה עוזר AI מועיל שעונה תמיד בעברית...
הזן prompt כאן...
Model
gemini-2.5-flash
Temperature
Grounding
כבוי
tips_and_updates
טיפ: השתמש ב-"System Instructions"

ב-AI Studio יש שדה "System Instructions" — זה ה-System Prompt. שים שם את האישיות, הטון והמגבלות של ה-AI שלך. זה ישנה לחלוטין את איכות התשובות.

התחלה עם Gemini API — 5 דקות ל-Hello World

קבל API Key חינם מ-Google AI Studio ואז:

# התקנה
pip install google-generativeai

# קוד בסיסי
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

response = model.generate_content("תסביר לי מה זה Machine Learning בעברית")
print(response.text)

Streaming — תשובות בזמן אמת

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

# Streaming — מדפיס כל מילה ברגע שמגיעה
for chunk in model.generate_content("כתוב סיפור קצר על רובוט בתל אביב", stream=True):
    print(chunk.text, end="", flush=True)

Chat Session — שמירת היסטוריה

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

# פתיחת session שמרת היסטוריה
chat = model.start_chat(history=[])
resp1 = chat.send_message("שמי דניאל ואני מפתח Python")
resp2 = chat.send_message("מה עשיתי לפני שנייה?")
print(resp2.text)  # יזכור שאתה דניאל ומפתח Python

# הצגת היסטוריה
for message in chat.history:
    print(f"{message.role}: {message.parts[0].text[:50]}...")

JSON Mode — פלט מובנה

import google.generativeai as genai
import json

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

response = model.generate_content(
    "תן לי רשימת 3 ערים ישראליות עם אוכלוסייה. JSON בלבד.",
    generation_config={"response_mime_type": "application/json"}
)

data = json.loads(response.text)
# {"cities": [{"name": "ירושלים", "population": 971000}, ...]}

דוגמה מתקדמת: ניתוח מסמך PDF

import google.generativeai as genai
import pathlib

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-pro")

# העלאת PDF
pdf_file = genai.upload_file(pathlib.Path("contract.pdf"))

# שאלה על המסמך
response = model.generate_content([
    pdf_file,
    "תסכם את 3 הסעיפים החשובים ביותר בחוזה הזה"
])
print(response.text)
warning
שים לב: מגבלות Free Tier

ה-Free Tier ב-AI Studio מאפשר 1,500 RPD (Requests Per Day) עבור Flash. לאפליקציות Production — עבור ל-Vertex AI עם חיוב לפי שימוש.

Gemini Multimodal — ראייה, שמיעה ווידאו

אחת מנקודות החוזק הגדולות של Gemini היא היכולת הmultimodal שלו — הוא יכול לעבד תמונות, PDF, אודיו, וידאו ו-YouTube URLs ישירות, ללא כלים חיצוניים.

ניתוח תמונות

import google.generativeai as genai
import PIL.Image

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# תמונה מקובץ מקומי
img = PIL.Image.open('screenshot.png')
response = model.generate_content(["תאר מה אתה רואה בתמונה זו:", img])
print(response.text)

# תמונה כ-Base64
import base64
with open("chart.jpg", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()

response = model.generate_content([
    "ניתח את הגרף הזה — מה המגמה העיקרית?",
    {"mime_type": "image/jpeg", "data": image_data}
])
print(response.text)
aistudio.google.com — Image Analysis
image
תשובת Gemini

התמונה מציגה גרף עמודות המשווה נתוני מכירות על פני 4 רבעונים. ניתן לראות עלייה מתמדת של כ-23% ברבעון הרביעי...

תמונה זוהתה גרף נתונים כמותיים

ניתוח אודיו

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# העלאת קובץ אודיו
audio_file = genai.upload_file("meeting_recording.mp3", mime_type="audio/mp3")

# תמלול + ניתוח
response = model.generate_content([
    audio_file,
    """בצע את הפעולות הבאות:
    1. תמלל את ההקלטה
    2. סכם את הנושאים העיקריים
    3. רשום Action Items שהוזכרו"""
])
print(response.text)

ניתוח וידאו ו-YouTube

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# ניתוח YouTube URL ישירות (ייחודי ל-Gemini!)
response = model.generate_content([
    "https://www.youtube.com/watch?v=VIDEO_ID",
    "סכם את עיקרי הסרטון ב-5 נקודות"
])
print(response.text)

# ניתוח וידאו מקובץ
video_file = genai.upload_file("demo.mp4", mime_type="video/mp4")
response = model.generate_content([
    video_file,
    "תאר מה קורה בסצנה בדקה 2:30"
])
star
יתרון בלעדי: YouTube URLs

רק Gemini תומך בניתוח ישיר של YouTube URLs — לא צריך להוריד, לתמלל ולהעלות בנפרד. פשוט תן לו את ה-URL וה-timestamp.

File API — העלאת קבצים גדולים

ה-File API של Gemini מאפשר להעלות קבצים עד 2GB לשרתי Google ולהשתמש בהם ב-requests מרובים. הקבצים שמורים 48 שעות.

import google.generativeai as genai
import time

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# העלאת קובץ
sample_file = genai.upload_file(
    path="annual_report.pdf",
    display_name="דוח שנתי 2025"
)

# המתנה לעיבוד (לקבצים גדולים)
while sample_file.state.name == "PROCESSING":
    print("מעבד...")
    time.sleep(5)
    sample_file = genai.get_file(sample_file.name)

# שימוש בקובץ
response = model.generate_content([
    sample_file,
    "סכם את הנקודות העיקריות"
])
print(response.text)

# רשימת כל הקבצים שהועלו
for f in genai.list_files():
    print(f.display_name, f.state.name)

# מחיקת קובץ
genai.delete_file(sample_file.name)
aistudio.google.com — File Upload
קבצים שהועלו
picture_as_pdf
annual_report.pdf
4.2 MB · ACTIVE · פג ב-2 ימים
ACTIVE
audio_file
meeting_q1.mp3
18.7 MB · ACTIVE · פג ב-1 יום
ACTIVE

System Instructions — עיצוב אישיות ה-AI

System Instructions הן ה-System Prompt של Gemini. הן מגדירות את האישיות, הטון, שפת התשובה, הגבלות ואת ה"מי" של ה-AI שאתה בונה.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# הגדרת מודל עם System Instructions
model = genai.GenerativeModel(
    model_name='gemini-2.5-pro',
    system_instruction="""אתה עוזר ניתוח נתונים מומחה.
תמיד ענה בעברית בלבד.
השתמש בטבלאות Markdown כשרלוונטי.
הצג נתונים כולל אחוזים ומגמות.
אל תמציא מספרים — אם אינך יודע, אמור "לא ידוע".
הכן תמיד סיכום ב-2-3 משפטים בסוף כל תשובה."""
)

response = model.generate_content("מה המגמות בשוק הנדל"ן הישראלי ב-2025?")
print(response.text)

דוגמה: בניית Support Bot בעברית

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

support_bot = genai.GenerativeModel(
    model_name='gemini-2.5-flash',
    system_instruction="""אתה נציג שירות לקוחות של חברת SaaS ישראלית.
כללים:
- ענה תמיד בעברית, בטון נעים ומקצועי
- אם השאלה טכנית ואינך יודע — כתוב: "אעביר לצוות הטכני"
- לשאלות על תשלומים — תמיד הפנה לאימייל billing@company.com
- אל תבטיח דברים שלא מופיעים בהוראות אלו"""
)

chat = support_bot.start_chat()
response = chat.send_message("אני לא מצליח להתחבר לחשבון שלי")
print(response.text)
psychology
System Instructions vs Prompt

System Instructions נשמרות לאורך כל השיחה ולא "נשכחות". הן מהוות את "ה-DNA" של ה-Agent שלך. כל Prompt שנשלח אחריהן יתנהג לפיהן.

Grounding עם Google Search — מידע בזמן אמת

Grounding הוא היכולת לחבר את Gemini ל-Google Search בזמן אמת — כך שהמודל מחפש ברשת לפני שהוא עונה. זה מבטיח מידע עדכני וצמצום הזיות.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# שימוש ב-Grounding עם Google Search
model = genai.GenerativeModel('gemini-2.5-pro')
response = model.generate_content(
    "מה מחיר Bitcoin ו-Ethereum עכשיו? מה המגמה היומית?",
    tools=[{"google_search_retrieval": {}}]
)

print(response.text)

# Grounding metadata — מקורות המידע
if response.candidates[0].grounding_metadata:
    print("\n--- מקורות ---")
    for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
        print(f"- {chunk.web.title}: {chunk.web.uri}")
aistudio.google.com — Grounding with Search
search מחפש ב-Google...
3 מקורות נמצאו

לפי נתוני Google Finance, Bitcoin נסחר כרגע ב-$67,450 עם עלייה של 2.3% ב-24 שעות האחרונות...

מקורות
linkfinance.google.com
linkcoinmarketcap.com

Dynamic Retrieval — חיסכון בעלויות

# Dynamic Retrieval — Gemini מחליט מתי לחפש
response = model.generate_content(
    "מה ההיסטוריה של תל אביב?",  # ← מידע סטטי, לא יחפש
    tools=[{
        "google_search_retrieval": {
            "dynamic_retrieval_config": {
                "mode": "MODE_DYNAMIC",
                "dynamic_threshold": 0.3  # סף: 0=תמיד, 1=אף פעם
            }
        }
    }]
)
# Gemini יחפש רק אם confidence < threshold

Gemini 2.5 Thinking Mode — חשיבה מורחבת

Thinking Mode הוא מצב מיוחד ב-Gemini 2.5 Pro ו-Flash שבו המודל "חושב בקול" לפני שהוא עונה. בדומה ל-o1 של OpenAI ול-Extended Thinking של Claude, Gemini מקדיש טוקנים נוספים לתהליך reasoning פנימי.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# Thinking Mode עם budget_tokens
model = genai.GenerativeModel('gemini-2.5-pro')

response = model.generate_content(
    "פתור: אם יש לי 3 קופסאות, בכל אחת 7 תפוחים, ונתתי 12 לחברים — כמה נשארו?",
    generation_config=genai.GenerationConfig(
        thinking_config=genai.ThinkingConfig(
            thinking_budget=8000  # טוקנים לחשיבה פנימית
        )
    )
)

print("תשובה:", response.text)

# הצגת תהליך החשיבה (אם זמין)
if hasattr(response.candidates[0], 'thinking_content'):
    print("חשיבה פנימית:", response.candidates[0].thinking_content)

מתי להשתמש ב-Thinking Mode?

מצב Thinking OFF Thinking ON
שאלות פשוטות מומלץ בזבוז
חידות לוגיקה / מתמטיקה שגיאות רבות מומלץ מאוד
כתיבת קוד מורכב בסיסי מומלץ
ניתוח ארגומנטים שטחי מומלץ
תרגום / כתיבה יצירתית מומלץ לא נחוץ
price_change
שים לב: Thinking tokens עולים כסף

טוקני ה-thinking נספרים במחיר מלא. עם budget_tokens=8000, כל בקשה עשויה להוסיף עוד $0.01. השתמש בזה רק לשאלות שבאמת דורשות reasoning מורכב.

טיפים ומקרי שימוש — מה Gemini עושה הכי טוב?

1. ניתוח קוד-בייס שלם

הכנס את כל הקבצים בפרויקט שלך (עד 2M טוקן) ושאל: "מה קורה כש-user נרשם? תתאר את ה-flow". Gemini יעשה את זה ב-30 שניות.

2. עיבוד פגישות ממוקלטות

הכנס קובץ אודיו/וידאו של פגישה — Gemini יפיק תמלול, סיכום, Action Items ונקודות מחלוקת. מצוין לצוותים.

3. Deep Research עם Grounding

הפעל "Grounding with Google Search" ו-Gemini יחפש ברשת בזמן אמת תוך כדי מענה. עדיף ל-research עדכני על GPT-4o WebSearch.

4. אוטומציה ב-Google Workspace

דרך Google Apps Script אפשר לחבר Gemini ל-Gmail, Sheets ו-Docs ללא תשלום נוסף. כתיבת ג'ות סיכום אוטומטי למיילים בעברית.

// Google Apps Script — סיכום Gmail אוטומטי
function summarizeEmail() {
  const threads = GmailApp.getInboxThreads(0, 5);
  const genAI = new GoogleAI("YOUR_API_KEY");

  threads.forEach(thread => {
    const body = thread.getMessages()[0].getBody();
    const prompt = `סכם את המייל הבא בעברית ב-2 משפטים:\n${body}`;
    const summary = genAI.generateContent(prompt).text;
    thread.addLabel(GmailApp.getUserLabelByName("סוכם"));
  });
}

5. יצירת תמונות עם Imagen 3

Gemini מחובר ל-Imagen 3 — מחולל התמונות של Google. דרך ה-API ניתן לייצר תמונות בסגנון פוטוריאליסטי באיכות גבוהה.

5 פרויקטים מעשיים עם Gemini

מפרויקטים פשוטים לבניית Agent מלא — בחר לפי הרמה שלך:

1

Document Analyzer — ניתוח PDF אוטומטי

מתחיל

העלה כל PDF — חוזה, דוח שנתי, מחקר — וקבל סיכום מובנה עם נקודות עיקריות, מסקנות וסעיפים חשובים. בונים ב-Python ב-20 שורות.

File API gemini-2.5-flash JSON output
2

Video Analyzer — ניתוח YouTube

בינוני

תן URL של YouTube וקבל: תמלול, סיכום, ציטוטים בולטים, רשימת נושאים — הכל אוטומטי. שלב Grounding לבדיקת עובדות בזמן אמת.

YouTube URL Multimodal Streaming
3

Visual Q&A — Chatbot עם תמונות

בינוני

בנה chatbot שמשתמשים יכולים לשלוח לו תמונות ולשאול שאלות. נשתמש ב-Gradio לממשק מהיר ו-Chat Session לזיכרון שיחה.

Vision API Chat Session Gradio UI
4

RAG Pipeline — מסמכים + Vector Store

מתקדם

בנה RAG מלא: Gemini Embeddings + Pinecone/ChromaDB + Gemini 2.5 Flash לענות על שאלות מתוך corpus של מסמכים. ניתן לסנן per-document.

Gemini Embeddings Vector DB RAG
5

Research Agent עם Google Search

מתקדם

Agent שחוקר נושא לעומק: שואל שאלות, מחפש ב-Google Search, מסנן מקורות, מסכם ממצאים — ומייצר דוח. מבוסס על Gemini Grounding + Thinking Mode.

Google Search Grounding Thinking Mode
play_circle
Gemini API Projects — Python Tutorial
YouTube • דוגמאות קוד מעשיות
open_in_new

גיליון עזר — Gemini API Quick Reference

השוואת מודלים — לפי Use Case

Use Case מודל מומלץ סיבה
Chatbot ב-Productiongemini-2.5-flashמחיר + מהירות
ניתוח PDF ארוךgemini-2.5-pro2M context
כתיבת קוד מורכבgemini-2.5-pro + thinkingreasoning
סיווג / taggingflash-8b / liteהכי זול
Research עדכני2.5-pro + groundingreal-time search
ניתוח וידאו / YouTubegemini-2.5-promultimodal

פרמטרים עיקריים של generate_content

import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.5-flash')

response = model.generate_content(
    "שאלה כאן",
    generation_config=genai.GenerationConfig(
        temperature=0.7,        # 0=דטרמיניסטי, 2=יצירתי
        top_p=0.95,             # nucleus sampling
        top_k=40,               # top-k tokens
        max_output_tokens=2048, # מקסימום טוקנים בפלט
        stop_sequences=["סוף"], # עצור בטקסט זה
        response_mime_type="application/json",  # JSON mode
    ),
    safety_settings={           # רמות בטיחות
        "HARM_CATEGORY_HARASSMENT": "BLOCK_NONE",
    }
)

דפוסים נפוצים — Copy-Paste Ready

# ── 1. שאלה פשוטה ──
response = model.generate_content("שאלה")
print(response.text)

# ── 2. Streaming ──
for chunk in model.generate_content("שאלה", stream=True):
    print(chunk.text, end="")

# ── 3. Chat עם היסטוריה ──
chat = model.start_chat(history=[
    {"role": "user", "parts": ["שלום"]},
    {"role": "model", "parts": ["שלום! במה אוכל לעזור?"]}
])
resp = chat.send_message("שאלה המשך")

# ── 4. תמונה ──
import PIL.Image
img = PIL.Image.open("image.png")
response = model.generate_content(["תאר:", img])

# ── 5. JSON output ──
response = model.generate_content(
    "תן JSON עם שדות: name, age, city",
    generation_config={"response_mime_type": "application/json"}
)

# ── 6. Grounding ──
response = model.generate_content(
    "חדשות היום בישראל",
    tools=[{"google_search_retrieval": {}}]
)

# ── 7. File upload ──
f = genai.upload_file("doc.pdf")
response = model.generate_content([f, "סכם"])

קודי שגיאה נפוצים ופתרונות

שגיאה סיבה פתרון
RESOURCE_EXHAUSTED עברת מכסת RPM/RPD הוסף retry עם exponential backoff
INVALID_ARGUMENT קובץ גדול מדי / פורמט שגוי בדוק מגבלות גודל (2GB max)
SAFETY_BLOCKED תוכן נחסם על ידי Safety בדוק response.prompt_feedback
DEADLINE_EXCEEDED timeout (קובץ גדול / thinking) הגדל timeout / השתמש ב-streaming
response.text — error Safety block / empty response בדוק response.candidates[0].finish_reason

סיכום — מתי לבחור Gemini?

arrow_forward

הצעד הבא

כנס ל-aistudio.google.com, תנסה Gemini 2.5 Flash חינם, ובדוק עם הדוגמאות מהמדריך הזה. כשתהיה מוכן — עבור ל-Vertex AI לפרויקטים ב-Production.