Google Gemini 2.5
המדריך המלא בעברית
כל מה שצריך לדעת על Gemini 2.5 Pro ו-Flash — מה הם יכולים, איך הם משתווים ל-GPT-4o, ואיך מתחילים להשתמש ב-API בחינם. כולל multimodal, grounding, thinking mode ו-5 פרויקטים מעשיים.
מה זה Google Gemini?
Gemini הוא שם משפחה של מודלי שפה (LLM) שפיתחה Google DeepMind. הושק בסוף 2023 והפך תוך שנה לאחד המתחרים הרציניים ביותר ל-GPT-4 של OpenAI. בפברואר 2024 שונה שם Bard ל-Gemini, וכיום הממשק הצרכני זמין בכתובת gemini.google.com.
מה שמיוחד ב-Gemini הוא שהוא multimodal מהיסוד — הוא לא "מודל טקסט שהוסיפו לו ראייה", אלא מודל שנבנה לעבד טקסט, תמונות, אודיו, וידאו וקוד ביחד. בנוסף, לגמיני יש אינטגרציה עמוקה עם שירותי Google — Gmail, Docs, Drive, Search ועוד.
Google Workspace נפוץ מאוד בחברות ישראליות. Gemini מוטמע ישירות ב-Gmail, Docs ו-Sheets — כך שעובדים רבים כבר "נוגעים" בו יום-יום.
הגרסאות של Gemini — מה ההבדלים?
נכון לאפריל 2026, גוגל מציעה שלושה דגמים עיקריים בסדרת 2.5:
השוואת גרסאות מפורטת
| מאפיין | 2.5 Pro | 2.5 Flash | Flash-8B / Lite |
|---|---|---|---|
| Context Window | 2M טוקן | 1M טוקן | 1M טוקן |
| מחיר Input (1M tokens) | $1.25 | $0.15 | $0.075 |
| Thinking Mode | כן (מתקדם) | כן (בסיסי) | לא |
| Multimodal | מלא | מלא | חלקי |
| Latency | ~3-8 שניות | ~1-3 שניות | <1 שנייה |
| מתאים ל… | ניתוח קובצים, קוד, research | Production apps, chatbots | סיווג, שאלות פשוטות |
Context Window של 2 מיליון טוקן — מה זה אומר בפועל?
2 מיליון טוקן שווים בערך 1,500 ספרים או 10 שעות של וידאו. בפרקטיקה, זה אומר שאפשר להזין לגמיני קוד-בייס שלם, ספר מלא, או תמלול פגישות של שבוע שלם — ולשאול שאלות עליו. זה המקרה בו Gemini Pro מנצח את כולם.
Gemini 2.5 vs GPT-4o vs Claude — השוואה ישירה
| קריטריון | Gemini 2.5 Pro | GPT-4o | Claude 3.7 |
|---|---|---|---|
| Context Window | 2M טוקן 🏆 | 128K | 200K |
| כתיבת קוד | מעולה 🏆 | מצוין | מצוין |
| עברית | טוב | מצוין 🏆 | טוב |
| ניתוח תמונות | מעולה 🏆 | מצוין | טוב |
| אינטגרציית Google | מושלם 🏆 | אין | אין |
| מחיר API | זול 🏆 | בינוני | בינוני |
| הגיון ו-Reasoning | מעולה 🏆 | מצוין | מצוין 🏆 |
מסקנה: Gemini 2.5 Pro הוא הבחירה הטובה ביותר אם אתה עובד עם קבצים גדולים, קוד-בייסים ארוכים, או מוצרי Google. GPT-4o עדיין מוביל בעברית.
Google AI Studio — נקודת הכניסה החינמית
Google AI Studio (aistudio.google.com) הוא הדרך המומלצת להתחיל עם Gemini. בחינם, ללא כרטיס אשראי, עם 1,500 בקשות ביום.
- Prompt Testing: תנסה Prompts שונים ישירות בממשק
- File Upload: הזנת PDF, תמונות, וידאו ואודיו
- Get Code: יצירת קוד Python/JS אוטומטי ל-API call
- Tune Models: Fine-tuning בסיסי ללא קוד
- Grounding with Search: חיבור לחיפוש Google בזמן אמת
ב-AI Studio יש שדה "System Instructions" — זה ה-System Prompt. שים שם את האישיות, הטון והמגבלות של ה-AI שלך. זה ישנה לחלוטין את איכות התשובות.
התחלה עם Gemini API — 5 דקות ל-Hello World
קבל API Key חינם מ-Google AI Studio ואז:
# התקנה
pip install google-generativeai
# קוד בסיסי
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")
response = model.generate_content("תסביר לי מה זה Machine Learning בעברית")
print(response.text)
Streaming — תשובות בזמן אמת
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")
# Streaming — מדפיס כל מילה ברגע שמגיעה
for chunk in model.generate_content("כתוב סיפור קצר על רובוט בתל אביב", stream=True):
print(chunk.text, end="", flush=True)
Chat Session — שמירת היסטוריה
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")
# פתיחת session שמרת היסטוריה
chat = model.start_chat(history=[])
resp1 = chat.send_message("שמי דניאל ואני מפתח Python")
resp2 = chat.send_message("מה עשיתי לפני שנייה?")
print(resp2.text) # יזכור שאתה דניאל ומפתח Python
# הצגת היסטוריה
for message in chat.history:
print(f"{message.role}: {message.parts[0].text[:50]}...")
JSON Mode — פלט מובנה
import google.generativeai as genai
import json
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")
response = model.generate_content(
"תן לי רשימת 3 ערים ישראליות עם אוכלוסייה. JSON בלבד.",
generation_config={"response_mime_type": "application/json"}
)
data = json.loads(response.text)
# {"cities": [{"name": "ירושלים", "population": 971000}, ...]}
דוגמה מתקדמת: ניתוח מסמך PDF
import google.generativeai as genai
import pathlib
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-pro")
# העלאת PDF
pdf_file = genai.upload_file(pathlib.Path("contract.pdf"))
# שאלה על המסמך
response = model.generate_content([
pdf_file,
"תסכם את 3 הסעיפים החשובים ביותר בחוזה הזה"
])
print(response.text)
ה-Free Tier ב-AI Studio מאפשר 1,500 RPD (Requests Per Day) עבור Flash. לאפליקציות Production — עבור ל-Vertex AI עם חיוב לפי שימוש.
Gemini Multimodal — ראייה, שמיעה ווידאו
אחת מנקודות החוזק הגדולות של Gemini היא היכולת הmultimodal שלו — הוא יכול לעבד תמונות, PDF, אודיו, וידאו ו-YouTube URLs ישירות, ללא כלים חיצוניים.
ניתוח תמונות
import google.generativeai as genai
import PIL.Image
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')
# תמונה מקובץ מקומי
img = PIL.Image.open('screenshot.png')
response = model.generate_content(["תאר מה אתה רואה בתמונה זו:", img])
print(response.text)
# תמונה כ-Base64
import base64
with open("chart.jpg", "rb") as f:
image_data = base64.b64encode(f.read()).decode()
response = model.generate_content([
"ניתח את הגרף הזה — מה המגמה העיקרית?",
{"mime_type": "image/jpeg", "data": image_data}
])
print(response.text)
התמונה מציגה גרף עמודות המשווה נתוני מכירות על פני 4 רבעונים. ניתן לראות עלייה מתמדת של כ-23% ברבעון הרביעי...
ניתוח אודיו
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')
# העלאת קובץ אודיו
audio_file = genai.upload_file("meeting_recording.mp3", mime_type="audio/mp3")
# תמלול + ניתוח
response = model.generate_content([
audio_file,
"""בצע את הפעולות הבאות:
1. תמלל את ההקלטה
2. סכם את הנושאים העיקריים
3. רשום Action Items שהוזכרו"""
])
print(response.text)
ניתוח וידאו ו-YouTube
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')
# ניתוח YouTube URL ישירות (ייחודי ל-Gemini!)
response = model.generate_content([
"https://www.youtube.com/watch?v=VIDEO_ID",
"סכם את עיקרי הסרטון ב-5 נקודות"
])
print(response.text)
# ניתוח וידאו מקובץ
video_file = genai.upload_file("demo.mp4", mime_type="video/mp4")
response = model.generate_content([
video_file,
"תאר מה קורה בסצנה בדקה 2:30"
])
רק Gemini תומך בניתוח ישיר של YouTube URLs — לא צריך להוריד, לתמלל ולהעלות בנפרד. פשוט תן לו את ה-URL וה-timestamp.
File API — העלאת קבצים גדולים
ה-File API של Gemini מאפשר להעלות קבצים עד 2GB לשרתי Google ולהשתמש בהם ב-requests מרובים. הקבצים שמורים 48 שעות.
- PDF, DOCX, TXT — מסמכים
- MP3, WAV, FLAC, OGG — אודיו
- MP4, MOV, AVI, WEBM — וידאו
- PNG, JPEG, GIF, WEBP — תמונות
import google.generativeai as genai
import time
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-2.5-pro')
# העלאת קובץ
sample_file = genai.upload_file(
path="annual_report.pdf",
display_name="דוח שנתי 2025"
)
# המתנה לעיבוד (לקבצים גדולים)
while sample_file.state.name == "PROCESSING":
print("מעבד...")
time.sleep(5)
sample_file = genai.get_file(sample_file.name)
# שימוש בקובץ
response = model.generate_content([
sample_file,
"סכם את הנקודות העיקריות"
])
print(response.text)
# רשימת כל הקבצים שהועלו
for f in genai.list_files():
print(f.display_name, f.state.name)
# מחיקת קובץ
genai.delete_file(sample_file.name)
System Instructions — עיצוב אישיות ה-AI
System Instructions הן ה-System Prompt של Gemini. הן מגדירות את האישיות, הטון, שפת התשובה, הגבלות ואת ה"מי" של ה-AI שאתה בונה.
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
# הגדרת מודל עם System Instructions
model = genai.GenerativeModel(
model_name='gemini-2.5-pro',
system_instruction="""אתה עוזר ניתוח נתונים מומחה.
תמיד ענה בעברית בלבד.
השתמש בטבלאות Markdown כשרלוונטי.
הצג נתונים כולל אחוזים ומגמות.
אל תמציא מספרים — אם אינך יודע, אמור "לא ידוע".
הכן תמיד סיכום ב-2-3 משפטים בסוף כל תשובה."""
)
response = model.generate_content("מה המגמות בשוק הנדל"ן הישראלי ב-2025?")
print(response.text)
דוגמה: בניית Support Bot בעברית
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
support_bot = genai.GenerativeModel(
model_name='gemini-2.5-flash',
system_instruction="""אתה נציג שירות לקוחות של חברת SaaS ישראלית.
כללים:
- ענה תמיד בעברית, בטון נעים ומקצועי
- אם השאלה טכנית ואינך יודע — כתוב: "אעביר לצוות הטכני"
- לשאלות על תשלומים — תמיד הפנה לאימייל billing@company.com
- אל תבטיח דברים שלא מופיעים בהוראות אלו"""
)
chat = support_bot.start_chat()
response = chat.send_message("אני לא מצליח להתחבר לחשבון שלי")
print(response.text)
System Instructions נשמרות לאורך כל השיחה ולא "נשכחות". הן מהוות את "ה-DNA" של ה-Agent שלך. כל Prompt שנשלח אחריהן יתנהג לפיהן.
Grounding עם Google Search — מידע בזמן אמת
Grounding הוא היכולת לחבר את Gemini ל-Google Search בזמן אמת — כך שהמודל מחפש ברשת לפני שהוא עונה. זה מבטיח מידע עדכני וצמצום הזיות.
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
# שימוש ב-Grounding עם Google Search
model = genai.GenerativeModel('gemini-2.5-pro')
response = model.generate_content(
"מה מחיר Bitcoin ו-Ethereum עכשיו? מה המגמה היומית?",
tools=[{"google_search_retrieval": {}}]
)
print(response.text)
# Grounding metadata — מקורות המידע
if response.candidates[0].grounding_metadata:
print("\n--- מקורות ---")
for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
print(f"- {chunk.web.title}: {chunk.web.uri}")
לפי נתוני Google Finance, Bitcoin נסחר כרגע ב-$67,450 עם עלייה של 2.3% ב-24 שעות האחרונות...
Dynamic Retrieval — חיסכון בעלויות
# Dynamic Retrieval — Gemini מחליט מתי לחפש
response = model.generate_content(
"מה ההיסטוריה של תל אביב?", # ← מידע סטטי, לא יחפש
tools=[{
"google_search_retrieval": {
"dynamic_retrieval_config": {
"mode": "MODE_DYNAMIC",
"dynamic_threshold": 0.3 # סף: 0=תמיד, 1=אף פעם
}
}
}]
)
# Gemini יחפש רק אם confidence < threshold
Gemini 2.5 Thinking Mode — חשיבה מורחבת
Thinking Mode הוא מצב מיוחד ב-Gemini 2.5 Pro ו-Flash שבו המודל "חושב בקול" לפני שהוא עונה. בדומה ל-o1 של OpenAI ול-Extended Thinking של Claude, Gemini מקדיש טוקנים נוספים לתהליך reasoning פנימי.
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
# Thinking Mode עם budget_tokens
model = genai.GenerativeModel('gemini-2.5-pro')
response = model.generate_content(
"פתור: אם יש לי 3 קופסאות, בכל אחת 7 תפוחים, ונתתי 12 לחברים — כמה נשארו?",
generation_config=genai.GenerationConfig(
thinking_config=genai.ThinkingConfig(
thinking_budget=8000 # טוקנים לחשיבה פנימית
)
)
)
print("תשובה:", response.text)
# הצגת תהליך החשיבה (אם זמין)
if hasattr(response.candidates[0], 'thinking_content'):
print("חשיבה פנימית:", response.candidates[0].thinking_content)
מתי להשתמש ב-Thinking Mode?
| מצב | Thinking OFF | Thinking ON |
|---|---|---|
| שאלות פשוטות | מומלץ | בזבוז |
| חידות לוגיקה / מתמטיקה | שגיאות רבות | מומלץ מאוד |
| כתיבת קוד מורכב | בסיסי | מומלץ |
| ניתוח ארגומנטים | שטחי | מומלץ |
| תרגום / כתיבה יצירתית | מומלץ | לא נחוץ |
טוקני ה-thinking נספרים במחיר מלא. עם budget_tokens=8000, כל בקשה עשויה להוסיף עוד $0.01. השתמש בזה רק לשאלות שבאמת דורשות reasoning מורכב.
טיפים ומקרי שימוש — מה Gemini עושה הכי טוב?
1. ניתוח קוד-בייס שלם
הכנס את כל הקבצים בפרויקט שלך (עד 2M טוקן) ושאל: "מה קורה כש-user נרשם? תתאר את ה-flow". Gemini יעשה את זה ב-30 שניות.
2. עיבוד פגישות ממוקלטות
הכנס קובץ אודיו/וידאו של פגישה — Gemini יפיק תמלול, סיכום, Action Items ונקודות מחלוקת. מצוין לצוותים.
3. Deep Research עם Grounding
הפעל "Grounding with Google Search" ו-Gemini יחפש ברשת בזמן אמת תוך כדי מענה. עדיף ל-research עדכני על GPT-4o WebSearch.
4. אוטומציה ב-Google Workspace
דרך Google Apps Script אפשר לחבר Gemini ל-Gmail, Sheets ו-Docs ללא תשלום נוסף. כתיבת ג'ות סיכום אוטומטי למיילים בעברית.
// Google Apps Script — סיכום Gmail אוטומטי
function summarizeEmail() {
const threads = GmailApp.getInboxThreads(0, 5);
const genAI = new GoogleAI("YOUR_API_KEY");
threads.forEach(thread => {
const body = thread.getMessages()[0].getBody();
const prompt = `סכם את המייל הבא בעברית ב-2 משפטים:\n${body}`;
const summary = genAI.generateContent(prompt).text;
thread.addLabel(GmailApp.getUserLabelByName("סוכם"));
});
}
5. יצירת תמונות עם Imagen 3
Gemini מחובר ל-Imagen 3 — מחולל התמונות של Google. דרך ה-API ניתן לייצר תמונות בסגנון פוטוריאליסטי באיכות גבוהה.
5 פרויקטים מעשיים עם Gemini
מפרויקטים פשוטים לבניית Agent מלא — בחר לפי הרמה שלך:
Document Analyzer — ניתוח PDF אוטומטי
מתחילהעלה כל PDF — חוזה, דוח שנתי, מחקר — וקבל סיכום מובנה עם נקודות עיקריות, מסקנות וסעיפים חשובים. בונים ב-Python ב-20 שורות.
Video Analyzer — ניתוח YouTube
בינוניתן URL של YouTube וקבל: תמלול, סיכום, ציטוטים בולטים, רשימת נושאים — הכל אוטומטי. שלב Grounding לבדיקת עובדות בזמן אמת.
Visual Q&A — Chatbot עם תמונות
בינוניבנה chatbot שמשתמשים יכולים לשלוח לו תמונות ולשאול שאלות. נשתמש ב-Gradio לממשק מהיר ו-Chat Session לזיכרון שיחה.
RAG Pipeline — מסמכים + Vector Store
מתקדםבנה RAG מלא: Gemini Embeddings + Pinecone/ChromaDB + Gemini 2.5 Flash לענות על שאלות מתוך corpus של מסמכים. ניתן לסנן per-document.
Research Agent עם Google Search
מתקדםAgent שחוקר נושא לעומק: שואל שאלות, מחפש ב-Google Search, מסנן מקורות, מסכם ממצאים — ומייצר דוח. מבוסס על Gemini Grounding + Thinking Mode.
גיליון עזר — Gemini API Quick Reference
השוואת מודלים — לפי Use Case
| Use Case | מודל מומלץ | סיבה |
|---|---|---|
| Chatbot ב-Production | gemini-2.5-flash | מחיר + מהירות |
| ניתוח PDF ארוך | gemini-2.5-pro | 2M context |
| כתיבת קוד מורכב | gemini-2.5-pro + thinking | reasoning |
| סיווג / tagging | flash-8b / lite | הכי זול |
| Research עדכני | 2.5-pro + grounding | real-time search |
| ניתוח וידאו / YouTube | gemini-2.5-pro | multimodal |
פרמטרים עיקריים של generate_content
import google.generativeai as genai
model = genai.GenerativeModel('gemini-2.5-flash')
response = model.generate_content(
"שאלה כאן",
generation_config=genai.GenerationConfig(
temperature=0.7, # 0=דטרמיניסטי, 2=יצירתי
top_p=0.95, # nucleus sampling
top_k=40, # top-k tokens
max_output_tokens=2048, # מקסימום טוקנים בפלט
stop_sequences=["סוף"], # עצור בטקסט זה
response_mime_type="application/json", # JSON mode
),
safety_settings={ # רמות בטיחות
"HARM_CATEGORY_HARASSMENT": "BLOCK_NONE",
}
)
דפוסים נפוצים — Copy-Paste Ready
# ── 1. שאלה פשוטה ──
response = model.generate_content("שאלה")
print(response.text)
# ── 2. Streaming ──
for chunk in model.generate_content("שאלה", stream=True):
print(chunk.text, end="")
# ── 3. Chat עם היסטוריה ──
chat = model.start_chat(history=[
{"role": "user", "parts": ["שלום"]},
{"role": "model", "parts": ["שלום! במה אוכל לעזור?"]}
])
resp = chat.send_message("שאלה המשך")
# ── 4. תמונה ──
import PIL.Image
img = PIL.Image.open("image.png")
response = model.generate_content(["תאר:", img])
# ── 5. JSON output ──
response = model.generate_content(
"תן JSON עם שדות: name, age, city",
generation_config={"response_mime_type": "application/json"}
)
# ── 6. Grounding ──
response = model.generate_content(
"חדשות היום בישראל",
tools=[{"google_search_retrieval": {}}]
)
# ── 7. File upload ──
f = genai.upload_file("doc.pdf")
response = model.generate_content([f, "סכם"])
קודי שגיאה נפוצים ופתרונות
| שגיאה | סיבה | פתרון |
|---|---|---|
| RESOURCE_EXHAUSTED | עברת מכסת RPM/RPD | הוסף retry עם exponential backoff |
| INVALID_ARGUMENT | קובץ גדול מדי / פורמט שגוי | בדוק מגבלות גודל (2GB max) |
| SAFETY_BLOCKED | תוכן נחסם על ידי Safety | בדוק response.prompt_feedback |
| DEADLINE_EXCEEDED | timeout (קובץ גדול / thinking) | הגדל timeout / השתמש ב-streaming |
| response.text — error | Safety block / empty response | בדוק response.candidates[0].finish_reason |
סיכום — מתי לבחור Gemini?
- קובץ גדול או מסמך ארוך? Gemini 2.5 Pro — ה-2M context חסר תחרות
- מוצר Google Workspace? Gemini — האינטגרציה מובנית
- API בתקציב נמוך? Gemini 2.5 Flash — המחיר הטוב ביותר בשוק
- עברית איכותית? GPT-4o עדיין מוביל, Gemini בסביבה
- Reasoning מורכב? Gemini 2.5 Pro + Thinking Mode
- מידע בזמן אמת? Gemini עם Grounding + Google Search
- ניתוח וידאו/תמונות? Gemini — multimodal מהיסוד
הצעד הבא
כנס ל-aistudio.google.com, תנסה Gemini 2.5 Flash חינם, ובדוק עם הדוגמאות מהמדריך הזה. כשתהיה מוכן — עבור ל-Vertex AI לפרויקטים ב-Production.