Google AI Studio
המדריך המלא
הדרך הקלה, החינמית והמהירה ביותר להתחיל עם Gemini API — מ-Playground לאינטגרציה מלאה בפייתון, Multimodal, Grounding ו-Fine-tuning.
Google AI Studio vs המתחרים — למה להשתמש בו?
Google AI Studio (aistudio.google.com) הוא ממשק Web ו-API חינמי של Google לגישה ישירה למודלי Gemini. בניגוד ל-Vertex AI שמיועד לארגונים ודורש הגדרת Google Cloud Project מלאה, AI Studio מתחיל בלחיצה אחת עם כל חשבון Google — ללא כרטיס אשראי.
| פלטפורמה | Google AI Studio | Vertex AI | OpenAI Playground |
|---|---|---|---|
| Free Tier | נדיב מאוד | מינימלי | אין |
| הרשמה | Google Account בלבד | GCP Project + billing | כרטיס אשראי |
| Context Window | עד 2M טוקנים | 2M (יקר יותר) | 128K |
| Grounding (Web) | כן, מובנה | כן (עלות נוספת) | לא |
| Multimodal | טקסט/תמונה/וידאו/PDF/אודיו | כן | תמונה בלבד |
| Fine-tuning | כן, בחינם | כן (בתשלום) | כן (בתשלום) |
AI Studio מושלם לפיתוח, Prototyping ופרויקטים אישיים. Vertex AI מתאים לסביבות Production ארגוניות עם SLA, IAM, VPC ודרישות רגולטוריות. לרוב אנשי ה-AI — AI Studio הוא הבחירה הנכונה.
הגדרה ו-API Key — 4 שלבים
כדי להתחיל, בצע ארבעה שלבים פשוטים:
Sign in עם חשבון Google.AIzaSy.... שמור אותו — הוא לא יוצג שוב.Playground — ניסוי לפני קוד
לפני כתיבת שורת קוד אחת, AI Studio מציע Playground ויזואלי שמאפשר לנסות פרומפטים, לכוונן פרמטרים ולהבין את התנהגות המודל. שלושה מצבים עיקריים:
בקשה חד-פעמית. כותבים פרומפט, לוחצים Run, מקבלים תשובה. מיועד לבדיקת פרומפטים ולהפקת תוכן בלחיצה.
שיחה רב-סבביות עם היסטוריה. מאפשר לבנות ולבדוק Chatbots לפני שמקודדים אותם.
Gemini מריץ קוד Python במנוע מובנה. מתאים לחישובים, ניתוח נתונים ויצירת גרפים.
פרמטרים חשובים ב-Playground
- Temperature (0–2): נמוך = עקבי ויציב, גבוה = יצירתי ומגוון. להנחיות מדויקות — 0.1. לכתיבה יצירתית — 0.9.
- Top-K: כמות הטוקנים שנשקלים בכל שלב. ערך נמוך = ממוקד יותר.
- Top-P (Nucleus Sampling): חיתוך על פי הסתברות מצטברת. 0.95 = ברירת מחדל טובה.
- Max Output Tokens: הגדר תמיד כדי לשלוט בעלויות ובאורך התשובה.
API Keys — יצירה, אבטחה ו-.env
API Key הוא הסיסמה שלך לגישה לשירות. אם הוא ידלף, מישהו יכול להשתמש ב-quota שלך (ולעלות לך כסף בחבילות בתשלום). הכללים:
- לעולם אל תכניס API Key ישירות בקוד — גם אם הקוד "private", Git מדליף.
- קובץ .env — שמור את המפתח שם, הוסף
.envל-.gitignore. - הגבל את ה-Key — בקונסולת Google Cloud אפשר להגביל לפי IP או referrer.
- צור Key נפרד לכל פרויקט — כך קל לבטל גישה לפרויקט ספציפי.
# .env (לא מועלה ל-Git!)
GOOGLE_API_KEY=AIzaSy...
# .gitignore
.env
*.env
import os
from dotenv import load_dotenv
import google.generativeai as genai
load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))
Gemini 2.5 Flash בחינם: 15 RPM (requests per minute), 1,500 RPD (requests per day), 1M TPM (tokens per minute). לפרויקטים רציניים — שדרג ל-Pay-as-you-go שעולה $0.075 לכל מיליון טוקני קלט.
Python SDK — המדריך המלא
ספריית google-generativeai היא הדרך הנוחה ביותר לשלב Gemini בפרויקטים. הנה כל מה שצריך:
pip install google-generativeai python-dotenv Pillow
import google.generativeai as genai
import os
from dotenv import load_dotenv
import json
load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))
model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')
# --- בקשה בסיסית ---
response = model.generate_content("הסבר מה זה RAG ב-3 משפטים")
print(response.text)
# --- שיחה רב-סבביות ---
chat = model.start_chat(history=[])
r1 = chat.send_message("מה שמך?")
r2 = chat.send_message("ספר לי על יכולות ה-coding שלך")
print(r2.text)
# --- Streaming (טוקן אחרי טוקן) ---
for chunk in model.generate_content("כתוב שיר על AI", stream=True):
print(chunk.text, end="", flush=True)
# --- JSON Mode ---
response = model.generate_content(
"תן רשימת 5 כלי AI עם שם, חברה ומחיר. JSON בלבד.",
generation_config={"response_mime_type": "application/json"}
)
data = json.loads(response.text)
print(data)
GenerationConfig — שליטה מלאה בפלט
config = genai.GenerationConfig(
temperature=0.7, # יצירתיות (0–2)
top_k=40, # מספר טוקנים לשקול
top_p=0.95, # nucleus sampling
max_output_tokens=2048, # הגבלת פלט
stop_sequences=["---"], # עצור כשפוגש מחרוזת זו
response_mime_type="text/plain" # או "application/json"
)
response = model.generate_content(
"כתוב מדריך קצר ל-Python",
generation_config=config
)
ספירת טוקנים לפני שליחה
# בדוק עלות לפני שליחה
token_count = model.count_tokens("הפרומפט הארוך שלי...")
print(f"טוקנים: {token_count.total_tokens}")
# טיפ: 1 טוקן ≈ 0.75 מילה באנגלית, ≈ 1 תו בעברית
Multimodal — Vision, PDF, YouTube ואודיו
Gemini הוא מודל מולטימודאלי אמיתי — לא רק עיבוד תמונות כ"תוספת", אלא הבנה עמוקה של כל סוגי המדיה. הנה הדרכים המרכזיות:
תמונות — ניתוח ויזואלי
import PIL.Image
import requests
from io import BytesIO
model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')
# תמונה מקובץ מקומי
image = PIL.Image.open('invoice.jpg')
response = model.generate_content([
"נתח את החשבונית: חלץ שם ספק, תאריך, סכום כולל ופרטי פריטים",
image
])
print(response.text)
# תמונה מ-URL
r = requests.get("https://example.com/chart.png")
image_from_url = PIL.Image.open(BytesIO(r.content))
response = model.generate_content(["תאר את הגרף הזה", image_from_url])
print(response.text)
PDF — ניתוח מסמכים
# PDF ישיר (עד 2M טוקנים = כ-1,500 עמודים!)
with open('annual_report.pdf', 'rb') as f:
pdf_bytes = f.read()
response = model.generate_content([
"סכם את הדוח השנתי: 5 נקודות עיקריות + ניתוח סיכונים + הזדמנויות",
{"mime_type": "application/pdf", "data": pdf_bytes}
])
print(response.text)
YouTube Video — ניתוח וידאו
# שליחת URL של YouTube ישירות לGemini!
response = model.generate_content([
"כתוב תמלול ותקציר של הוידאו הזה",
{"file_uri": "https://www.youtube.com/watch?v=VIDEO_ID", "mime_type": "video/youtube"}
])
print(response.text)
File API — קבצים גדולים
import time
# העלאת קובץ גדול (עד 2GB!)
video_file = genai.upload_file(
path="lecture.mp4",
display_name="הרצאה על LLMs",
mime_type="video/mp4"
)
# המתן לעיבוד
while video_file.state.name == "PROCESSING":
time.sleep(5)
video_file = genai.get_file(video_file.name)
response = model.generate_content([video_file, "כתוב תמלול עם חותמות זמן"])
print(response.text)
genai.delete_file(video_file.name) # נקה לאחר שימוש
System Instructions — הגדרת אישיות המודל
System Instructions הן הנחיות שנשלחות לפני כל שיחה ומגדירות את האישיות, הטון, השפה ומגבלות התשובות של המודל. הן חוסכות tokens בכל בקשה ומבטיחות עקביות.
model = genai.GenerativeModel(
model_name='gemini-2.5-flash-preview-04-17',
system_instruction="""
אתה מדריך AI מקצועי של Automation4MI.
כללים:
- ענה תמיד בעברית בלהטים, ברורה וידידותית
- השתמש בדוגמאות קוד Python כשרלוונטי
- ציין תמיד את מגבלות הידע שלך
- אל תמציא עובדות — אם לא יודע, אמור זאת
- מבנה תשובות: הסבר → דוגמה → טיפ מעשי
"""
)
# עכשיו כל שיחה מקבלת את ההנחיות האלה
chat = model.start_chat()
r = chat.send_message("מה זה Fine-tuning?")
print(r.text)
תבניות System Instruction לפי שימוש
"אתה נציג תמיכה מקצועי. ענה בנימוס. אל תבטיח דברים שאינם בידיעתך. הפנה לסוכן אנושי כשהבעיה מורכבת."
"אתה מהנדס בכיר. בדוק קוד: אבטחה, ביצועים, קריאות, best practices. תן דוגמאות לתיקון."
"חלץ מידע מובנה. ענה תמיד ב-JSON בלבד. אם שדה חסר — החזר null. אל תוסיף טקסט נוסף."
Grounding — חיפוש Google בזמן אמת
Grounding הוא אחד היתרונות הייחודיים ביותר של Gemini — האפשרות לחבר את המודל ישירות למנוע החיפוש של Google. כך ניתן לקבל תשובות מעודכנות על אירועים שקרו לאחר ה-Training Cutoff, כולל מחירי מניות, חדשות, ותוצאות ספורט.
from google.generativeai.types import Tool, GoogleSearchRetrieval, DynamicRetrievalConfig
# Grounding בסיסי
model_with_search = genai.GenerativeModel(
model_name='gemini-2.5-flash-preview-04-17',
tools=[Tool(google_search=GoogleSearchRetrieval())]
)
response = model_with_search.generate_content(
"מה מחיר המניה של NVIDIA היום ומה הסנטימנט בשוק?"
)
print(response.text)
# בדיקת ציטוטים
if response.candidates[0].grounding_metadata:
for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
print(f"מקור: {chunk.web.title} — {chunk.web.uri}")
Dynamic Retrieval — שליטה על מתי לחפש
# Dynamic Retrieval — Gemini יחפש רק אם score > threshold
model_smart = genai.GenerativeModel(
model_name='gemini-2.5-flash-preview-04-17',
tools=[Tool(
google_search=GoogleSearchRetrieval(
dynamic_retrieval_config=DynamicRetrievalConfig(
mode="MODE_DYNAMIC",
dynamic_threshold=0.5 # 0=תמיד חפש, 1=לא חפש כמעט
)
)
)]
)
# שאלות כלליות → לא יחפש (חסכון בעלות)
# שאלות על חדשות → יחפש אוטומטית
שום מודל אחר לא מציע חיבור ישיר לGoogle Search חינמי. זה מושלם לאפליקציות שדורשות מידע עדכני: ניתוח שוק, חדשות, מחקר — בלי להחזיק Web Scraper נפרד.
Fine-tuning — אימון מודל מותאם אישית
Fine-tuning מאפשר לאמן גרסה מותאמת של Gemini Flash על הנתונים שלך. זה שימושי כאשר צריך מודל שמדבר בסגנון ספציפי, מכיר טרמינולוגיה עסקית, או מתמחה בתחום צר.
import google.generativeai as genai
# יצירת Tuned Model (דורש כ-100-1000 דוגמאות)
operation = genai.create_tuned_model(
display_name="automation4mi-assistant",
source_model="models/gemini-1.5-flash-001-tuning",
training_data=[
{"text_input": "מה ההבדל בין n8n ל-Make?", "output": "n8n הוא open-source ומתאים למפתחים..."},
{"text_input": "מהו RAG?", "output": "RAG (Retrieval Augmented Generation) הוא..."},
# ... עוד דוגמאות
],
epoch_count=5,
batch_size=8,
learning_rate=0.001
)
# המתן לסיום האימון
tuned_model = operation.result()
print(f"Model ready: {tuned_model.name}")
פורמט Dataset לFine-tuning
# כל דוגמה: input → expected output
training_examples = [
{
"text_input": "שאלה לדוגמה",
"output": "התשובה האידיאלית בפורמט הרצוי"
},
# מינימום: 100 דוגמאות
# מומלץ: 500-1000 דוגמאות לאיכות גבוהה
# מקסימום: 40,000 דוגמאות
]
5 פרויקטים מעשיים
מערכת שמקבלת PDF (חוזה/דוח/מחקר) ומחזירה: סיכום, נקודות מפתח, סיכונים ותובנות — הכל ב-JSON מובנה.
קבלת URL של YouTube, שלוף תמלול, ייצור תקציר עם חותמות זמן, ונקודות מפתח ב-Markdown — אוטומטי.
Chatbot עם זיכרון שיחה מלא, System Instruction מותאמת, Streaming בזמן אמת, ושמירת היסטוריה לקובץ JSON.
שולח קוד Python, מקבל ניתוח מפורט: באגים, בעיות אבטחה, הצעות שיפור וקוד מתוקן — עם ציוני איכות.
שימוש ב-Gemini Embeddings לאנדקוס מסמכים, חיפוש סמנטי עם Cosine Similarity, ותשובות מבוססות-מקורות.
גיליון עזר מהיר
שמות המודלים (אפריל 2026)
| מודל | Context | חינמי? | מחיר (Input) |
|---|---|---|---|
| gemini-2.5-flash-preview-04-17 | 1M | כן | $0.075/1M |
| gemini-2.5-pro-preview-03-25 | 2M | לא | $1.25/1M |
| gemini-2.0-flash | 1M | כן | $0.075/1M |
| text-embedding-004 | 2048 | כן | $0.00/1M |
קודי שגיאה נפוצים
| קוד | משמעות | פתרון |
|---|---|---|
| 429 | Rate Limit | הוסף time.sleep(60) או שדרג plan |
| 400 | Bad Request | בדוק MIME type ופורמט הקובץ |
| 403 | API Key שגוי | בדוק ה-.env ואת הkey עצמו |
| SAFETY | Safety Filter | שנה פרומפט או כוונן Safety Settings |
הצעדים הבאים
ממשיכים? לחבר Pinecone ל-Gemini לRAG מלא, לנסות NotebookLM לניתוח מסמכים, או למסלולי הלמידה לבניית אפליקציות AI שלמות.