Google Gemini 2.5 — המדריך המלא בעברית

מה זה Google Gemini?

Gemini הוא שם משפחה של מודלי שפה (LLM) שפיתחה Google DeepMind. הושק בסוף 2023 והפך תוך שנה לאחד המתחרים הרציניים ביותר ל-GPT-4 של OpenAI. בפברואר 2024 שונה שם Bard ל-Gemini, וכיום הממשק הצרכני זמין בכתובת gemini.google.com.

מה שמיוחד ב-Gemini הוא שהוא multimodal מהיסוד — הוא לא "מודל טקסט שהוסיפו לו ראייה", אלא מודל שנבנה לעבד טקסט, תמונות, אודיו, וידאו וקוד ביחד. בנוסף, לגמיני יש אינטגרציה עמוקה עם שירותי Google — Gmail, Docs, Drive, Search ועוד.

lightbulb

למה Gemini רלוונטי לישראלים?

Google Workspace נפוץ מאוד בחברות ישראליות. Gemini מוטמע ישירות ב-Gmail, Docs ו-Sheets — כך שעובדים רבים כבר "נוגעים" בו יום-יום.

הגרסאות של Gemini — מה ההבדלים?

נכון לאפריל 2026, גוגל מציעה שלושה דגמים עיקריים בסדרת 2.5:

Gemini 2.5 Pro

המודל הכי חזק. Reasoning מתקדם, context של 2M טוקן, מצוין לקוד ולניתוח מורכב.

חינם ב-AI Studio (מוגבל) · Pro בתשלום

Gemini 2.5 Flash

מהיר ומוזל. 90% מביצועי Pro במחיר פי 10 זול יותר. מומלץ ל-Production.

חינם ב-AI Studio · API זול

Gemini 2.0 Flash Lite

הכי מהיר והכי זול. מתאים לאפליקציות עם latency נמוך ונפח גדול.

הכי זול בשוק · Ultra-fast

השוואת גרסאות מפורטת

מאפיין	2.5 Pro	2.5 Flash	Flash-8B / Lite
Context Window	2M טוקן	1M טוקן	1M טוקן
מחיר Input (1M tokens)	$1.25	$0.15	$0.075
Thinking Mode	כן (מתקדם)	כן (בסיסי)	לא
Multimodal	מלא	מלא	חלקי
Latency	~3-8 שניות	~1-3 שניות	<1 שנייה
מתאים ל…	ניתוח קובצים, קוד, research	Production apps, chatbots	סיווג, שאלות פשוטות

Context Window של 2 מיליון טוקן — מה זה אומר בפועל?

2 מיליון טוקן שווים בערך 1,500 ספרים או 10 שעות של וידאו. בפרקטיקה, זה אומר שאפשר להזין לגמיני קוד-בייס שלם, ספר מלא, או תמלול פגישות של שבוע שלם — ולשאול שאלות עליו. זה המקרה בו Gemini Pro מנצח את כולם.

Gemini 2.5 vs GPT-4o vs Claude — השוואה ישירה

קריטריון	Gemini 2.5 Pro	GPT-4o	Claude 3.7
Context Window	2M טוקן 🏆	128K	200K
כתיבת קוד	מעולה 🏆	מצוין	מצוין
עברית	טוב	מצוין 🏆	טוב
ניתוח תמונות	מעולה 🏆	מצוין	טוב
אינטגרציית Google	מושלם 🏆	אין	אין
מחיר API	זול 🏆	בינוני	בינוני
הגיון ו-Reasoning	מעולה 🏆	מצוין	מצוין 🏆

מסקנה: Gemini 2.5 Pro הוא הבחירה הטובה ביותר אם אתה עובד עם קבצים גדולים, קוד-בייסים ארוכים, או מוצרי Google. GPT-4o עדיין מוביל בעברית.

Google AI Studio — נקודת הכניסה החינמית

Google AI Studio (aistudio.google.com) הוא הדרך המומלצת להתחיל עם Gemini. בחינם, ללא כרטיס אשראי, עם 1,500 בקשות ביום.

Prompt Testing: תנסה Prompts שונים ישירות בממשק
File Upload: הזנת PDF, תמונות, וידאו ואודיו
Get Code: יצירת קוד Python/JS אוטומטי ל-API call
Tune Models: Fine-tuning בסיסי ללא קוד
Grounding with Search: חיבור לחיפוש Google בזמן אמת

aistudio.google.com

Stream Realtime Prompt Chat

System Instructions אתה עוזר AI מועיל שעונה תמיד בעברית...

הזן prompt כאן...

Model

gemini-2.5-flash

Temperature

Grounding

כבוי

tips_and_updates

טיפ: השתמש ב-"System Instructions"

ב-AI Studio יש שדה "System Instructions" — זה ה-System Prompt. שים שם את האישיות, הטון והמגבלות של ה-AI שלך. זה ישנה לחלוטין את איכות התשובות.

התחלה עם Gemini API — 5 דקות ל-Hello World

קבל API Key חינם מ-Google AI Studio ואז:

# התקנה
pip install google-generativeai

# קוד בסיסי
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

response = model.generate_content("תסביר לי מה זה Machine Learning בעברית")
print(response.text)

Streaming — תשובות בזמן אמת

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

# Streaming — מדפיס כל מילה ברגע שמגיעה
for chunk in model.generate_content("כתוב סיפור קצר על רובוט בתל אביב", stream=True):
    print(chunk.text, end="", flush=True)

Chat Session — שמירת היסטוריה

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

# פתיחת session שמרת היסטוריה
chat = model.start_chat(history=[])
resp1 = chat.send_message("שמי דניאל ואני מפתח Python")
resp2 = chat.send_message("מה עשיתי לפני שנייה?")
print(resp2.text)  # יזכור שאתה דניאל ומפתח Python

# הצגת היסטוריה
for message in chat.history:
    print(f"{message.role}: {message.parts[0].text[:50]}...")

JSON Mode — פלט מובנה

import google.generativeai as genai
import json

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")

response = model.generate_content(
    "תן לי רשימת 3 ערים ישראליות עם אוכלוסייה. JSON בלבד.",
    generation_config={"response_mime_type": "application/json"}
)

data = json.loads(response.text)
# {"cities": [{"name": "ירושלים", "population": 971000}, ...]}

דוגמה מתקדמת: ניתוח מסמך PDF

import google.generativeai as genai
import pathlib

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-pro")

# העלאת PDF
pdf_file = genai.upload_file(pathlib.Path("contract.pdf"))

# שאלה על המסמך
response = model.generate_content([
    pdf_file,
    "תסכם את 3 הסעיפים החשובים ביותר בחוזה הזה"
])
print(response.text)

warning

שים לב: מגבלות Free Tier

ה-Free Tier ב-AI Studio מאפשר 1,500 RPD (Requests Per Day) עבור Flash. לאפליקציות Production — עבור ל-Vertex AI עם חיוב לפי שימוש.

Gemini Multimodal — ראייה, שמיעה ווידאו

אחת מנקודות החוזק הגדולות של Gemini היא היכולת הmultimodal שלו — הוא יכול לעבד תמונות, PDF, אודיו, וידאו ו-YouTube URLs ישירות, ללא כלים חיצוניים.

ניתוח תמונות

import google.generativeai as genai
import PIL.Image

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# תמונה מקובץ מקומי
img = PIL.Image.open('screenshot.png')
response = model.generate_content(["תאר מה אתה רואה בתמונה זו:", img])
print(response.text)

# תמונה כ-Base64
import base64
with open("chart.jpg", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()

response = model.generate_content([
    "ניתח את הגרף הזה — מה המגמה העיקרית?",
    {"mime_type": "image/jpeg", "data": image_data}
])
print(response.text)

aistudio.google.com — Image Analysis

image

תשובת Gemini

התמונה מציגה גרף עמודות המשווה נתוני מכירות על פני 4 רבעונים. ניתן לראות עלייה מתמדת של כ-23% ברבעון הרביעי...

תמונה זוהתה גרף נתונים כמותיים

ניתוח אודיו

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# העלאת קובץ אודיו
audio_file = genai.upload_file("meeting_recording.mp3", mime_type="audio/mp3")

# תמלול + ניתוח
response = model.generate_content([
    audio_file,
    """בצע את הפעולות הבאות:
    1. תמלל את ההקלטה
    2. סכם את הנושאים העיקריים
    3. רשום Action Items שהוזכרו"""
])
print(response.text)

ניתוח וידאו ו-YouTube

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# ניתוח YouTube URL ישירות (ייחודי ל-Gemini!)
response = model.generate_content([
    "https://www.youtube.com/watch?v=VIDEO_ID",
    "סכם את עיקרי הסרטון ב-5 נקודות"
])
print(response.text)

# ניתוח וידאו מקובץ
video_file = genai.upload_file("demo.mp4", mime_type="video/mp4")
response = model.generate_content([
    video_file,
    "תאר מה קורה בסצנה בדקה 2:30"
])

star

יתרון בלעדי: YouTube URLs

רק Gemini תומך בניתוח ישיר של YouTube URLs — לא צריך להוריד, לתמלל ולהעלות בנפרד. פשוט תן לו את ה-URL וה-timestamp.

File API — העלאת קבצים גדולים

ה-File API של Gemini מאפשר להעלות קבצים עד 2GB לשרתי Google ולהשתמש בהם ב-requests מרובים. הקבצים שמורים 48 שעות.

PDF, DOCX, TXT — מסמכים
MP3, WAV, FLAC, OGG — אודיו
MP4, MOV, AVI, WEBM — וידאו
PNG, JPEG, GIF, WEBP — תמונות

import google.generativeai as genai
import time

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')

# העלאת קובץ
sample_file = genai.upload_file(
    path="annual_report.pdf",
    display_name="דוח שנתי 2025"
)

# המתנה לעיבוד (לקבצים גדולים)
while sample_file.state.name == "PROCESSING":
    print("מעבד...")
    time.sleep(5)
    sample_file = genai.get_file(sample_file.name)

# שימוש בקובץ
response = model.generate_content([
    sample_file,
    "סכם את הנקודות העיקריות"
])
print(response.text)

# רשימת כל הקבצים שהועלו
for f in genai.list_files():
    print(f.display_name, f.state.name)

# מחיקת קובץ
genai.delete_file(sample_file.name)

aistudio.google.com — File Upload

קבצים שהועלו

picture_as_pdf

annual_report.pdf

4.2 MB · ACTIVE · פג ב-2 ימים

ACTIVE

audio_file

meeting_q1.mp3

18.7 MB · ACTIVE · פג ב-1 יום

ACTIVE

System Instructions — עיצוב אישיות ה-AI

System Instructions הן ה-System Prompt של Gemini. הן מגדירות את האישיות, הטון, שפת התשובה, הגבלות ואת ה"מי" של ה-AI שאתה בונה.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# הגדרת מודל עם System Instructions
model = genai.GenerativeModel(
    model_name='gemini-2.5-pro',
    system_instruction="""אתה עוזר ניתוח נתונים מומחה.
תמיד ענה בעברית בלבד.
השתמש בטבלאות Markdown כשרלוונטי.
הצג נתונים כולל אחוזים ומגמות.
אל תמציא מספרים — אם אינך יודע, אמור "לא ידוע".
הכן תמיד סיכום ב-2-3 משפטים בסוף כל תשובה."""
)

response = model.generate_content("מה המגמות בשוק הנדל"ן הישראלי ב-2025?")
print(response.text)

דוגמה: בניית Support Bot בעברית

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

support_bot = genai.GenerativeModel(
    model_name='gemini-2.5-flash',
    system_instruction="""אתה נציג שירות לקוחות של חברת SaaS ישראלית.
כללים:
- ענה תמיד בעברית, בטון נעים ומקצועי
- אם השאלה טכנית ואינך יודע — כתוב: "אעביר לצוות הטכני"
- לשאלות על תשלומים — תמיד הפנה לאימייל billing@company.com
- אל תבטיח דברים שלא מופיעים בהוראות אלו"""
)

chat = support_bot.start_chat()
response = chat.send_message("אני לא מצליח להתחבר לחשבון שלי")
print(response.text)

psychology

System Instructions vs Prompt

System Instructions נשמרות לאורך כל השיחה ולא "נשכחות". הן מהוות את "ה-DNA" של ה-Agent שלך. כל Prompt שנשלח אחריהן יתנהג לפיהן.

Grounding עם Google Search — מידע בזמן אמת

Grounding הוא היכולת לחבר את Gemini ל-Google Search בזמן אמת — כך שהמודל מחפש ברשת לפני שהוא עונה. זה מבטיח מידע עדכני וצמצום הזיות.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# שימוש ב-Grounding עם Google Search
model = genai.GenerativeModel('gemini-2.5-pro')
response = model.generate_content(
    "מה מחיר Bitcoin ו-Ethereum עכשיו? מה המגמה היומית?",
    tools=[{"google_search_retrieval": {}}]
)

print(response.text)

# Grounding metadata — מקורות המידע
if response.candidates[0].grounding_metadata:
    print("\n--- מקורות ---")
    for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
        print(f"- {chunk.web.title}: {chunk.web.uri}")

aistudio.google.com — Grounding with Search

search מחפש ב-Google...

3 מקורות נמצאו

לפי נתוני Google Finance, Bitcoin נסחר כרגע ב-$67,450 עם עלייה של 2.3% ב-24 שעות האחרונות...

מקורות

linkfinance.google.com

linkcoinmarketcap.com

Dynamic Retrieval — חיסכון בעלויות

# Dynamic Retrieval — Gemini מחליט מתי לחפש
response = model.generate_content(
    "מה ההיסטוריה של תל אביב?",  # ← מידע סטטי, לא יחפש
    tools=[{
        "google_search_retrieval": {
            "dynamic_retrieval_config": {
                "mode": "MODE_DYNAMIC",
                "dynamic_threshold": 0.3  # סף: 0=תמיד, 1=אף פעם
            }
        }
    }]
)
# Gemini יחפש רק אם confidence < threshold

Gemini 2.5 Thinking Mode — חשיבה מורחבת

Thinking Mode הוא מצב מיוחד ב-Gemini 2.5 Pro ו-Flash שבו המודל "חושב בקול" לפני שהוא עונה. בדומה ל-o1 של OpenAI ול-Extended Thinking של Claude, Gemini מקדיש טוקנים נוספים לתהליך reasoning פנימי.

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

# Thinking Mode עם budget_tokens
model = genai.GenerativeModel('gemini-2.5-pro')

response = model.generate_content(
    "פתור: אם יש לי 3 קופסאות, בכל אחת 7 תפוחים, ונתתי 12 לחברים — כמה נשארו?",
    generation_config=genai.GenerationConfig(
        thinking_config=genai.ThinkingConfig(
            thinking_budget=8000  # טוקנים לחשיבה פנימית
        )
    )
)

print("תשובה:", response.text)

# הצגת תהליך החשיבה (אם זמין)
if hasattr(response.candidates[0], 'thinking_content'):
    print("חשיבה פנימית:", response.candidates[0].thinking_content)

מתי להשתמש ב-Thinking Mode?

מצב	Thinking OFF	Thinking ON
שאלות פשוטות	מומלץ	בזבוז
חידות לוגיקה / מתמטיקה	שגיאות רבות	מומלץ מאוד
כתיבת קוד מורכב	בסיסי	מומלץ
ניתוח ארגומנטים	שטחי	מומלץ
תרגום / כתיבה יצירתית	מומלץ	לא נחוץ

price_change

שים לב: Thinking tokens עולים כסף

טוקני ה-thinking נספרים במחיר מלא. עם budget_tokens=8000, כל בקשה עשויה להוסיף עוד $0.01. השתמש בזה רק לשאלות שבאמת דורשות reasoning מורכב.

טיפים ומקרי שימוש — מה Gemini עושה הכי טוב?

1. ניתוח קוד-בייס שלם

הכנס את כל הקבצים בפרויקט שלך (עד 2M טוקן) ושאל: "מה קורה כש-user נרשם? תתאר את ה-flow". Gemini יעשה את זה ב-30 שניות.

2. עיבוד פגישות ממוקלטות

הכנס קובץ אודיו/וידאו של פגישה — Gemini יפיק תמלול, סיכום, Action Items ונקודות מחלוקת. מצוין לצוותים.

3. Deep Research עם Grounding

הפעל "Grounding with Google Search" ו-Gemini יחפש ברשת בזמן אמת תוך כדי מענה. עדיף ל-research עדכני על GPT-4o WebSearch.

4. אוטומציה ב-Google Workspace

דרך Google Apps Script אפשר לחבר Gemini ל-Gmail, Sheets ו-Docs ללא תשלום נוסף. כתיבת ג'ות סיכום אוטומטי למיילים בעברית.

// Google Apps Script — סיכום Gmail אוטומטי
function summarizeEmail() {
  const threads = GmailApp.getInboxThreads(0, 5);
  const genAI = new GoogleAI("YOUR_API_KEY");

  threads.forEach(thread => {
    const body = thread.getMessages()[0].getBody();
    const prompt = `סכם את המייל הבא בעברית ב-2 משפטים:\n${body}`;
    const summary = genAI.generateContent(prompt).text;
    thread.addLabel(GmailApp.getUserLabelByName("סוכם"));
  });
}

5. יצירת תמונות עם Imagen 3

Gemini מחובר ל-Imagen 3 — מחולל התמונות של Google. דרך ה-API ניתן לייצר תמונות בסגנון פוטוריאליסטי באיכות גבוהה.

5 פרויקטים מעשיים עם Gemini

מפרויקטים פשוטים לבניית Agent מלא — בחר לפי הרמה שלך:

Document Analyzer — ניתוח PDF אוטומטי

מתחיל

העלה כל PDF — חוזה, דוח שנתי, מחקר — וקבל סיכום מובנה עם נקודות עיקריות, מסקנות וסעיפים חשובים. בונים ב-Python ב-20 שורות.

File API gemini-2.5-flash JSON output

Video Analyzer — ניתוח YouTube

בינוני

תן URL של YouTube וקבל: תמלול, סיכום, ציטוטים בולטים, רשימת נושאים — הכל אוטומטי. שלב Grounding לבדיקת עובדות בזמן אמת.

YouTube URL Multimodal Streaming

Visual Q&A — Chatbot עם תמונות

בינוני

בנה chatbot שמשתמשים יכולים לשלוח לו תמונות ולשאול שאלות. נשתמש ב-Gradio לממשק מהיר ו-Chat Session לזיכרון שיחה.

Vision API Chat Session Gradio UI

RAG Pipeline — מסמכים + Vector Store

מתקדם

בנה RAG מלא: Gemini Embeddings + Pinecone/ChromaDB + Gemini 2.5 Flash לענות על שאלות מתוך corpus של מסמכים. ניתן לסנן per-document.

Gemini Embeddings Vector DB RAG

Research Agent עם Google Search

מתקדם

Agent שחוקר נושא לעומק: שואל שאלות, מחפש ב-Google Search, מסנן מקורות, מסכם ממצאים — ומייצר דוח. מבוסס על Gemini Grounding + Thinking Mode.

Google Search Grounding Thinking Mode

play_circle

Gemini API Projects — Python Tutorial

YouTube • דוגמאות קוד מעשיות

open_in_new

גיליון עזר — Gemini API Quick Reference

השוואת מודלים — לפי Use Case

Use Case	מודל מומלץ	סיבה
Chatbot ב-Production	gemini-2.5-flash	מחיר + מהירות
ניתוח PDF ארוך	gemini-2.5-pro	2M context
כתיבת קוד מורכב	gemini-2.5-pro + thinking	reasoning
סיווג / tagging	flash-8b / lite	הכי זול
Research עדכני	2.5-pro + grounding	real-time search
ניתוח וידאו / YouTube	gemini-2.5-pro	multimodal

פרמטרים עיקריים של generate_content

import google.generativeai as genai

model = genai.GenerativeModel('gemini-2.5-flash')

response = model.generate_content(
    "שאלה כאן",
    generation_config=genai.GenerationConfig(
        temperature=0.7,        # 0=דטרמיניסטי, 2=יצירתי
        top_p=0.95,             # nucleus sampling
        top_k=40,               # top-k tokens
        max_output_tokens=2048, # מקסימום טוקנים בפלט
        stop_sequences=["סוף"], # עצור בטקסט זה
        response_mime_type="application/json",  # JSON mode
    ),
    safety_settings={           # רמות בטיחות
        "HARM_CATEGORY_HARASSMENT": "BLOCK_NONE",
    }
)

דפוסים נפוצים — Copy-Paste Ready

# ── 1. שאלה פשוטה ──
response = model.generate_content("שאלה")
print(response.text)

# ── 2. Streaming ──
for chunk in model.generate_content("שאלה", stream=True):
    print(chunk.text, end="")

# ── 3. Chat עם היסטוריה ──
chat = model.start_chat(history=[
    {"role": "user", "parts": ["שלום"]},
    {"role": "model", "parts": ["שלום! במה אוכל לעזור?"]}
])
resp = chat.send_message("שאלה המשך")

# ── 4. תמונה ──
import PIL.Image
img = PIL.Image.open("image.png")
response = model.generate_content(["תאר:", img])

# ── 5. JSON output ──
response = model.generate_content(
    "תן JSON עם שדות: name, age, city",
    generation_config={"response_mime_type": "application/json"}
)

# ── 6. Grounding ──
response = model.generate_content(
    "חדשות היום בישראל",
    tools=[{"google_search_retrieval": {}}]
)

# ── 7. File upload ──
f = genai.upload_file("doc.pdf")
response = model.generate_content([f, "סכם"])

קודי שגיאה נפוצים ופתרונות

שגיאה	סיבה	פתרון
RESOURCE_EXHAUSTED	עברת מכסת RPM/RPD	הוסף retry עם exponential backoff
INVALID_ARGUMENT	קובץ גדול מדי / פורמט שגוי	בדוק מגבלות גודל (2GB max)
SAFETY_BLOCKED	תוכן נחסם על ידי Safety	בדוק response.prompt_feedback
DEADLINE_EXCEEDED	timeout (קובץ גדול / thinking)	הגדל timeout / השתמש ב-streaming
response.text — error	Safety block / empty response	בדוק response.candidates[0].finish_reason

סיכום — מתי לבחור Gemini?

קובץ גדול או מסמך ארוך? Gemini 2.5 Pro — ה-2M context חסר תחרות
מוצר Google Workspace? Gemini — האינטגרציה מובנית
API בתקציב נמוך? Gemini 2.5 Flash — המחיר הטוב ביותר בשוק
עברית איכותית? GPT-4o עדיין מוביל, Gemini בסביבה
Reasoning מורכב? Gemini 2.5 Pro + Thinking Mode
מידע בזמן אמת? Gemini עם Grounding + Google Search
ניתוח וידאו/תמונות? Gemini — multimodal מהיסוד

arrow_forward

הצעד הבא

כנס ל-aistudio.google.com, תנסה Gemini 2.5 Flash חינם, ובדוק עם הדוגמאות מהמדריך הזה. כשתהיה מוכן — עבור ל-Vertex AI לפרויקטים ב-Production.

מדריך Google AI Studio בניית RAG עם Gemini Gemini ב-Make.com

Google Gemini 2.5המדריך המלא בעברית