arrow_forwardמדריכים / Google AI Studio
כלי פיתוח AI 25 דקות קריאה מעודכן לאפריל 2026

Google AI Studio
המדריך המלא

הדרך הקלה, החינמית והמהירה ביותר להתחיל עם Gemini API — מ-Playground לאינטגרציה מלאה בפייתון, Multimodal, Grounding ו-Fine-tuning.

חינמי
15 RPM, 1M טוקן/יום
2M
Context Window
Gemini
2.5 Flash / Pro

Google AI Studio vs המתחרים — למה להשתמש בו?

Google AI Studio (aistudio.google.com) הוא ממשק Web ו-API חינמי של Google לגישה ישירה למודלי Gemini. בניגוד ל-Vertex AI שמיועד לארגונים ודורש הגדרת Google Cloud Project מלאה, AI Studio מתחיל בלחיצה אחת עם כל חשבון Google — ללא כרטיס אשראי.

פלטפורמה Google AI Studio Vertex AI OpenAI Playground
Free Tierנדיב מאודמינימליאין
הרשמהGoogle Account בלבדGCP Project + billingכרטיס אשראי
Context Windowעד 2M טוקנים2M (יקר יותר)128K
Grounding (Web)כן, מובנהכן (עלות נוספת)לא
Multimodalטקסט/תמונה/וידאו/PDF/אודיוכןתמונה בלבד
Fine-tuningכן, בחינםכן (בתשלום)כן (בתשלום)
lightbulb
מתי לבחור AI Studio ומתי Vertex AI?

AI Studio מושלם לפיתוח, Prototyping ופרויקטים אישיים. Vertex AI מתאים לסביבות Production ארגוניות עם SLA, IAM, VPC ודרישות רגולטוריות. לרוב אנשי ה-AI — AI Studio הוא הבחירה הנכונה.

הגדרה ו-API Key — 4 שלבים

כדי להתחיל, בצע ארבעה שלבים פשוטים:

1
כנס ל-aistudio.google.com
פתח את הדפדפן וגלוש לכתובת. לחץ Sign in עם חשבון Google.
2
לחץ "Get API Key"
בתפריט הצד השמאלי לחץ Get API keyCreate API key → בחר פרויקט Google Cloud (או צור חדש).
3
העתק את המפתח
ה-API Key נראה כך: AIzaSy.... שמור אותו — הוא לא יוצג שוב.
4
שמור בקובץ .env
אל תשמור את המפתח ישירות בקוד — השתמש תמיד במשתני סביבה.
aistudio.google.com/apikey
API Keys
My Project API Key
AIzaSy••••••••••••••••••••••••••••••
play_circle
Google AI Studio — Gemini API Tutorial
YouTube • חפש סרטוני הסבר
open_in_new

Playground — ניסוי לפני קוד

לפני כתיבת שורת קוד אחת, AI Studio מציע Playground ויזואלי שמאפשר לנסות פרומפטים, לכוונן פרמטרים ולהבין את התנהגות המודל. שלושה מצבים עיקריים:

edit_note
Prompt Mode

בקשה חד-פעמית. כותבים פרומפט, לוחצים Run, מקבלים תשובה. מיועד לבדיקת פרומפטים ולהפקת תוכן בלחיצה.

forum
Chat Mode

שיחה רב-סבביות עם היסטוריה. מאפשר לבנות ולבדוק Chatbots לפני שמקודדים אותם.

code
Code Execution

Gemini מריץ קוד Python במנוע מובנה. מתאים לחישובים, ניתוח נתונים ויצירת גרפים.

aistudio.google.com/prompts/new_chat
Prompt
הסבר מה זה RAG ב-3 משפטים
RAG (Retrieval Augmented Generation) הוא טכניקה שמאפשרת למודלי שפה לגשת למידע חיצוני בזמן אמת...
127 tokens 0.8s
Parameters
Model
gemini-2.5-flash
Temperature
Max Tokens
2048

פרמטרים חשובים ב-Playground

API Keys — יצירה, אבטחה ו-.env

API Key הוא הסיסמה שלך לגישה לשירות. אם הוא ידלף, מישהו יכול להשתמש ב-quota שלך (ולעלות לך כסף בחבילות בתשלום). הכללים:

# .env (לא מועלה ל-Git!)
GOOGLE_API_KEY=AIzaSy...

# .gitignore
.env
*.env
import os
from dotenv import load_dotenv
import google.generativeai as genai

load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))
security
Free Tier — מגבלות שכדאי לדעת

Gemini 2.5 Flash בחינם: 15 RPM (requests per minute), 1,500 RPD (requests per day), 1M TPM (tokens per minute). לפרויקטים רציניים — שדרג ל-Pay-as-you-go שעולה $0.075 לכל מיליון טוקני קלט.

Python SDK — המדריך המלא

ספריית google-generativeai היא הדרך הנוחה ביותר לשלב Gemini בפרויקטים. הנה כל מה שצריך:

pip install google-generativeai python-dotenv Pillow
import google.generativeai as genai
import os
from dotenv import load_dotenv
import json

load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))

model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')

# --- בקשה בסיסית ---
response = model.generate_content("הסבר מה זה RAG ב-3 משפטים")
print(response.text)

# --- שיחה רב-סבביות ---
chat = model.start_chat(history=[])
r1 = chat.send_message("מה שמך?")
r2 = chat.send_message("ספר לי על יכולות ה-coding שלך")
print(r2.text)

# --- Streaming (טוקן אחרי טוקן) ---
for chunk in model.generate_content("כתוב שיר על AI", stream=True):
    print(chunk.text, end="", flush=True)

# --- JSON Mode ---
response = model.generate_content(
    "תן רשימת 5 כלי AI עם שם, חברה ומחיר. JSON בלבד.",
    generation_config={"response_mime_type": "application/json"}
)
data = json.loads(response.text)
print(data)

GenerationConfig — שליטה מלאה בפלט

config = genai.GenerationConfig(
    temperature=0.7,          # יצירתיות (0–2)
    top_k=40,                 # מספר טוקנים לשקול
    top_p=0.95,               # nucleus sampling
    max_output_tokens=2048,   # הגבלת פלט
    stop_sequences=["---"],   # עצור כשפוגש מחרוזת זו
    response_mime_type="text/plain"  # או "application/json"
)

response = model.generate_content(
    "כתוב מדריך קצר ל-Python",
    generation_config=config
)

ספירת טוקנים לפני שליחה

# בדוק עלות לפני שליחה
token_count = model.count_tokens("הפרומפט הארוך שלי...")
print(f"טוקנים: {token_count.total_tokens}")
# טיפ: 1 טוקן ≈ 0.75 מילה באנגלית, ≈ 1 תו בעברית

Multimodal — Vision, PDF, YouTube ואודיו

Gemini הוא מודל מולטימודאלי אמיתי — לא רק עיבוד תמונות כ"תוספת", אלא הבנה עמוקה של כל סוגי המדיה. הנה הדרכים המרכזיות:

תמונות — ניתוח ויזואלי

import PIL.Image
import requests
from io import BytesIO

model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')

# תמונה מקובץ מקומי
image = PIL.Image.open('invoice.jpg')
response = model.generate_content([
    "נתח את החשבונית: חלץ שם ספק, תאריך, סכום כולל ופרטי פריטים",
    image
])
print(response.text)

# תמונה מ-URL
r = requests.get("https://example.com/chart.png")
image_from_url = PIL.Image.open(BytesIO(r.content))
response = model.generate_content(["תאר את הגרף הזה", image_from_url])
print(response.text)

PDF — ניתוח מסמכים

# PDF ישיר (עד 2M טוקנים = כ-1,500 עמודים!)
with open('annual_report.pdf', 'rb') as f:
    pdf_bytes = f.read()

response = model.generate_content([
    "סכם את הדוח השנתי: 5 נקודות עיקריות + ניתוח סיכונים + הזדמנויות",
    {"mime_type": "application/pdf", "data": pdf_bytes}
])
print(response.text)

YouTube Video — ניתוח וידאו

# שליחת URL של YouTube ישירות לGemini!
response = model.generate_content([
    "כתוב תמלול ותקציר של הוידאו הזה",
    {"file_uri": "https://www.youtube.com/watch?v=VIDEO_ID", "mime_type": "video/youtube"}
])
print(response.text)

File API — קבצים גדולים

import time

# העלאת קובץ גדול (עד 2GB!)
video_file = genai.upload_file(
    path="lecture.mp4",
    display_name="הרצאה על LLMs",
    mime_type="video/mp4"
)
# המתן לעיבוד
while video_file.state.name == "PROCESSING":
    time.sleep(5)
    video_file = genai.get_file(video_file.name)

response = model.generate_content([video_file, "כתוב תמלול עם חותמות זמן"])
print(response.text)
genai.delete_file(video_file.name)  # נקה לאחר שימוש
aistudio.google.com — Multimodal Prompt
picture_as_pdf
annual_report_2025.pdf • 248 עמודים
סכם את הדוח ב-5 נקודות עיקריות
תוצאות מהדוח:
◆ הכנסות Q4 עלו ב-23% לעומת אשתקד
◆ שוק AI Enterprise צומח ב-47% שנתי
◆ השקה של 3 מוצרים חדשים בתחום הביטחון

System Instructions — הגדרת אישיות המודל

System Instructions הן הנחיות שנשלחות לפני כל שיחה ומגדירות את האישיות, הטון, השפה ומגבלות התשובות של המודל. הן חוסכות tokens בכל בקשה ומבטיחות עקביות.

model = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    system_instruction="""
אתה מדריך AI מקצועי של Automation4MI.
כללים:
- ענה תמיד בעברית בלהטים, ברורה וידידותית
- השתמש בדוגמאות קוד Python כשרלוונטי
- ציין תמיד את מגבלות הידע שלך
- אל תמציא עובדות — אם לא יודע, אמור זאת
- מבנה תשובות: הסבר → דוגמה → טיפ מעשי
"""
)

# עכשיו כל שיחה מקבלת את ההנחיות האלה
chat = model.start_chat()
r = chat.send_message("מה זה Fine-tuning?")
print(r.text)

תבניות System Instruction לפי שימוש

Customer Support Bot
"אתה נציג תמיכה מקצועי. ענה בנימוס. אל תבטיח דברים שאינם בידיעתך. הפנה לסוכן אנושי כשהבעיה מורכבת."
Code Review Assistant
"אתה מהנדס בכיר. בדוק קוד: אבטחה, ביצועים, קריאות, best practices. תן דוגמאות לתיקון."
Data Extraction
"חלץ מידע מובנה. ענה תמיד ב-JSON בלבד. אם שדה חסר — החזר null. אל תוסיף טקסט נוסף."

Grounding — חיפוש Google בזמן אמת

Grounding הוא אחד היתרונות הייחודיים ביותר של Gemini — האפשרות לחבר את המודל ישירות למנוע החיפוש של Google. כך ניתן לקבל תשובות מעודכנות על אירועים שקרו לאחר ה-Training Cutoff, כולל מחירי מניות, חדשות, ותוצאות ספורט.

from google.generativeai.types import Tool, GoogleSearchRetrieval, DynamicRetrievalConfig

# Grounding בסיסי
model_with_search = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    tools=[Tool(google_search=GoogleSearchRetrieval())]
)

response = model_with_search.generate_content(
    "מה מחיר המניה של NVIDIA היום ומה הסנטימנט בשוק?"
)
print(response.text)

# בדיקת ציטוטים
if response.candidates[0].grounding_metadata:
    for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
        print(f"מקור: {chunk.web.title} — {chunk.web.uri}")

Dynamic Retrieval — שליטה על מתי לחפש

# Dynamic Retrieval — Gemini יחפש רק אם score > threshold
model_smart = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    tools=[Tool(
        google_search=GoogleSearchRetrieval(
            dynamic_retrieval_config=DynamicRetrievalConfig(
                mode="MODE_DYNAMIC",
                dynamic_threshold=0.5  # 0=תמיד חפש, 1=לא חפש כמעט
            )
        )
    )]
)
# שאלות כלליות → לא יחפש (חסכון בעלות)
# שאלות על חדשות → יחפש אוטומטית
search
Grounding = הסיבה לבחור Gemini

שום מודל אחר לא מציע חיבור ישיר לGoogle Search חינמי. זה מושלם לאפליקציות שדורשות מידע עדכני: ניתוח שוק, חדשות, מחקר — בלי להחזיק Web Scraper נפרד.

Fine-tuning — אימון מודל מותאם אישית

Fine-tuning מאפשר לאמן גרסה מותאמת של Gemini Flash על הנתונים שלך. זה שימושי כאשר צריך מודל שמדבר בסגנון ספציפי, מכיר טרמינולוגיה עסקית, או מתמחה בתחום צר.

import google.generativeai as genai

# יצירת Tuned Model (דורש כ-100-1000 דוגמאות)
operation = genai.create_tuned_model(
    display_name="automation4mi-assistant",
    source_model="models/gemini-1.5-flash-001-tuning",
    training_data=[
        {"text_input": "מה ההבדל בין n8n ל-Make?", "output": "n8n הוא open-source ומתאים למפתחים..."},
        {"text_input": "מהו RAG?", "output": "RAG (Retrieval Augmented Generation) הוא..."},
        # ... עוד דוגמאות
    ],
    epoch_count=5,
    batch_size=8,
    learning_rate=0.001
)

# המתן לסיום האימון
tuned_model = operation.result()
print(f"Model ready: {tuned_model.name}")

פורמט Dataset לFine-tuning

# כל דוגמה: input → expected output
training_examples = [
    {
        "text_input": "שאלה לדוגמה",
        "output": "התשובה האידיאלית בפורמט הרצוי"
    },
    # מינימום: 100 דוגמאות
    # מומלץ: 500-1000 דוגמאות לאיכות גבוהה
    # מקסימום: 40,000 דוגמאות
]

5 פרויקטים מעשיים

description
1. Document Analyzer

מערכת שמקבלת PDF (חוזה/דוח/מחקר) ומחזירה: סיכום, נקודות מפתח, סיכונים ותובנות — הכל ב-JSON מובנה.

File API + PDF JSON Mode System Instructions
play_circle
2. Video Summarizer

קבלת URL של YouTube, שלוף תמלול, ייצור תקציר עם חותמות זמן, ונקודות מפתח ב-Markdown — אוטומטי.

YouTube URI Multimodal Streaming
forum
3. Multi-turn Chatbot

Chatbot עם זיכרון שיחה מלא, System Instruction מותאמת, Streaming בזמן אמת, ושמירת היסטוריה לקובץ JSON.

start_chat history stream=True
code_blocks
4. Code Reviewer

שולח קוד Python, מקבל ניתוח מפורט: באגים, בעיות אבטחה, הצעות שיפור וקוד מתוקן — עם ציוני איכות.

System Instructions JSON Mode temperature=0.1
hub
5. RAG עם Embeddings

שימוש ב-Gemini Embeddings לאנדקוס מסמכים, חיפוש סמנטי עם Cosine Similarity, ותשובות מבוססות-מקורות.

embedding-004 Cosine Similarity Grounding

גיליון עזר מהיר

שמות המודלים (אפריל 2026)

מודל Context חינמי? מחיר (Input)
gemini-2.5-flash-preview-04-171Mכן$0.075/1M
gemini-2.5-pro-preview-03-252Mלא$1.25/1M
gemini-2.0-flash1Mכן$0.075/1M
text-embedding-0042048כן$0.00/1M

קודי שגיאה נפוצים

קודמשמעותפתרון
429Rate Limitהוסף time.sleep(60) או שדרג plan
400Bad Requestבדוק MIME type ופורמט הקובץ
403API Key שגויבדוק ה-.env ואת הkey עצמו
SAFETYSafety Filterשנה פרומפט או כוונן Safety Settings
rocket_launch

הצעדים הבאים

ממשיכים? לחבר Pinecone ל-Gemini לRAG מלא, לנסות NotebookLM לניתוח מסמכים, או למסלולי הלמידה לבניית אפליקציות AI שלמות.