Google AI Studio — מדריך עברי מלא

Google AI Studio vs המתחרים — למה להשתמש בו?

Google AI Studio (aistudio.google.com) הוא ממשק Web ו-API חינמי של Google לגישה ישירה למודלי Gemini. בניגוד ל-Vertex AI שמיועד לארגונים ודורש הגדרת Google Cloud Project מלאה, AI Studio מתחיל בלחיצה אחת עם כל חשבון Google — ללא כרטיס אשראי.

פלטפורמה	Google AI Studio	Vertex AI	OpenAI Playground
Free Tier	נדיב מאוד	מינימלי	אין
הרשמה	Google Account בלבד	GCP Project + billing	כרטיס אשראי
Context Window	עד 2M טוקנים	2M (יקר יותר)	128K
Grounding (Web)	כן, מובנה	כן (עלות נוספת)	לא
Multimodal	טקסט/תמונה/וידאו/PDF/אודיו	כן	תמונה בלבד
Fine-tuning	כן, בחינם	כן (בתשלום)	כן (בתשלום)

lightbulb

מתי לבחור AI Studio ומתי Vertex AI?

AI Studio מושלם לפיתוח, Prototyping ופרויקטים אישיים. Vertex AI מתאים לסביבות Production ארגוניות עם SLA, IAM, VPC ודרישות רגולטוריות. לרוב אנשי ה-AI — AI Studio הוא הבחירה הנכונה.

הגדרה ו-API Key — 4 שלבים

כדי להתחיל, בצע ארבעה שלבים פשוטים:

כנס ל-aistudio.google.com

פתח את הדפדפן וגלוש לכתובת. לחץ Sign in עם חשבון Google.

לחץ "Get API Key"

בתפריט הצד השמאלי לחץ Get API key → Create API key → בחר פרויקט Google Cloud (או צור חדש).

העתק את המפתח

ה-API Key נראה כך: AIzaSy.... שמור אותו — הוא לא יוצג שוב.

שמור בקובץ .env

אל תשמור את המפתח ישירות בקוד — השתמש תמיד במשתני סביבה.

aistudio.google.com/apikey

API Keys

My Project API Key

AIzaSy••••••••••••••••••••••••••••••

play_circle

Google AI Studio — Gemini API Tutorial

YouTube • חפש סרטוני הסבר

open_in_new

Playground — ניסוי לפני קוד

לפני כתיבת שורת קוד אחת, AI Studio מציע Playground ויזואלי שמאפשר לנסות פרומפטים, לכוונן פרמטרים ולהבין את התנהגות המודל. שלושה מצבים עיקריים:

edit_note

Prompt Mode

בקשה חד-פעמית. כותבים פרומפט, לוחצים Run, מקבלים תשובה. מיועד לבדיקת פרומפטים ולהפקת תוכן בלחיצה.

forum

Chat Mode

שיחה רב-סבביות עם היסטוריה. מאפשר לבנות ולבדוק Chatbots לפני שמקודדים אותם.

code

Code Execution

Gemini מריץ קוד Python במנוע מובנה. מתאים לחישובים, ניתוח נתונים ויצירת גרפים.

aistudio.google.com/prompts/new_chat

Prompt

הסבר מה זה RAG ב-3 משפטים

RAG (Retrieval Augmented Generation) הוא טכניקה שמאפשרת למודלי שפה לגשת למידע חיצוני בזמן אמת...

127 tokens • 0.8s

Parameters

Model

gemini-2.5-flash

Temperature

Max Tokens

2048

פרמטרים חשובים ב-Playground

Temperature (0–2): נמוך = עקבי ויציב, גבוה = יצירתי ומגוון. להנחיות מדויקות — 0.1. לכתיבה יצירתית — 0.9.
Top-K: כמות הטוקנים שנשקלים בכל שלב. ערך נמוך = ממוקד יותר.
Top-P (Nucleus Sampling): חיתוך על פי הסתברות מצטברת. 0.95 = ברירת מחדל טובה.
Max Output Tokens: הגדר תמיד כדי לשלוט בעלויות ובאורך התשובה.

API Keys — יצירה, אבטחה ו-.env

API Key הוא הסיסמה שלך לגישה לשירות. אם הוא ידלף, מישהו יכול להשתמש ב-quota שלך (ולעלות לך כסף בחבילות בתשלום). הכללים:

לעולם אל תכניס API Key ישירות בקוד — גם אם הקוד "private", Git מדליף.
קובץ .env — שמור את המפתח שם, הוסף .env ל-.gitignore.
הגבל את ה-Key — בקונסולת Google Cloud אפשר להגביל לפי IP או referrer.
צור Key נפרד לכל פרויקט — כך קל לבטל גישה לפרויקט ספציפי.

# .env (לא מועלה ל-Git!)
GOOGLE_API_KEY=AIzaSy...

# .gitignore
.env
*.env

import os
from dotenv import load_dotenv
import google.generativeai as genai

load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))

security

Free Tier — מגבלות שכדאי לדעת

Gemini 2.5 Flash בחינם: 15 RPM (requests per minute), 1,500 RPD (requests per day), 1M TPM (tokens per minute). לפרויקטים רציניים — שדרג ל-Pay-as-you-go שעולה $0.075 לכל מיליון טוקני קלט.

Python SDK — המדריך המלא

ספריית google-generativeai היא הדרך הנוחה ביותר לשלב Gemini בפרויקטים. הנה כל מה שצריך:

pip install google-generativeai python-dotenv Pillow

import google.generativeai as genai
import os
from dotenv import load_dotenv
import json

load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE_API_KEY"))

model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')

# --- בקשה בסיסית ---
response = model.generate_content("הסבר מה זה RAG ב-3 משפטים")
print(response.text)

# --- שיחה רב-סבביות ---
chat = model.start_chat(history=[])
r1 = chat.send_message("מה שמך?")
r2 = chat.send_message("ספר לי על יכולות ה-coding שלך")
print(r2.text)

# --- Streaming (טוקן אחרי טוקן) ---
for chunk in model.generate_content("כתוב שיר על AI", stream=True):
    print(chunk.text, end="", flush=True)

# --- JSON Mode ---
response = model.generate_content(
    "תן רשימת 5 כלי AI עם שם, חברה ומחיר. JSON בלבד.",
    generation_config={"response_mime_type": "application/json"}
)
data = json.loads(response.text)
print(data)

GenerationConfig — שליטה מלאה בפלט

config = genai.GenerationConfig(
    temperature=0.7,          # יצירתיות (0–2)
    top_k=40,                 # מספר טוקנים לשקול
    top_p=0.95,               # nucleus sampling
    max_output_tokens=2048,   # הגבלת פלט
    stop_sequences=["---"],   # עצור כשפוגש מחרוזת זו
    response_mime_type="text/plain"  # או "application/json"
)

response = model.generate_content(
    "כתוב מדריך קצר ל-Python",
    generation_config=config
)

ספירת טוקנים לפני שליחה

# בדוק עלות לפני שליחה
token_count = model.count_tokens("הפרומפט הארוך שלי...")
print(f"טוקנים: {token_count.total_tokens}")
# טיפ: 1 טוקן ≈ 0.75 מילה באנגלית, ≈ 1 תו בעברית

Multimodal — Vision, PDF, YouTube ואודיו

Gemini הוא מודל מולטימודאלי אמיתי — לא רק עיבוד תמונות כ"תוספת", אלא הבנה עמוקה של כל סוגי המדיה. הנה הדרכים המרכזיות:

תמונות — ניתוח ויזואלי

import PIL.Image
import requests
from io import BytesIO

model = genai.GenerativeModel('gemini-2.5-flash-preview-04-17')

# תמונה מקובץ מקומי
image = PIL.Image.open('invoice.jpg')
response = model.generate_content([
    "נתח את החשבונית: חלץ שם ספק, תאריך, סכום כולל ופרטי פריטים",
    image
])
print(response.text)

# תמונה מ-URL
r = requests.get("https://example.com/chart.png")
image_from_url = PIL.Image.open(BytesIO(r.content))
response = model.generate_content(["תאר את הגרף הזה", image_from_url])
print(response.text)

PDF — ניתוח מסמכים

# PDF ישיר (עד 2M טוקנים = כ-1,500 עמודים!)
with open('annual_report.pdf', 'rb') as f:
    pdf_bytes = f.read()

response = model.generate_content([
    "סכם את הדוח השנתי: 5 נקודות עיקריות + ניתוח סיכונים + הזדמנויות",
    {"mime_type": "application/pdf", "data": pdf_bytes}
])
print(response.text)

YouTube Video — ניתוח וידאו

# שליחת URL של YouTube ישירות לGemini!
response = model.generate_content([
    "כתוב תמלול ותקציר של הוידאו הזה",
    {"file_uri": "https://www.youtube.com/watch?v=VIDEO_ID", "mime_type": "video/youtube"}
])
print(response.text)

File API — קבצים גדולים

import time

# העלאת קובץ גדול (עד 2GB!)
video_file = genai.upload_file(
    path="lecture.mp4",
    display_name="הרצאה על LLMs",
    mime_type="video/mp4"
)
# המתן לעיבוד
while video_file.state.name == "PROCESSING":
    time.sleep(5)
    video_file = genai.get_file(video_file.name)

response = model.generate_content([video_file, "כתוב תמלול עם חותמות זמן"])
print(response.text)
genai.delete_file(video_file.name)  # נקה לאחר שימוש

aistudio.google.com — Multimodal Prompt

picture_as_pdf

annual_report_2025.pdf • 248 עמודים

סכם את הדוח ב-5 נקודות עיקריות

תוצאות מהדוח:

◆ הכנסות Q4 עלו ב-23% לעומת אשתקד

◆ שוק AI Enterprise צומח ב-47% שנתי

◆ השקה של 3 מוצרים חדשים בתחום הביטחון

System Instructions — הגדרת אישיות המודל

System Instructions הן הנחיות שנשלחות לפני כל שיחה ומגדירות את האישיות, הטון, השפה ומגבלות התשובות של המודל. הן חוסכות tokens בכל בקשה ומבטיחות עקביות.

model = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    system_instruction="""
אתה מדריך AI מקצועי של Automation4MI.
כללים:
- ענה תמיד בעברית בלהטים, ברורה וידידותית
- השתמש בדוגמאות קוד Python כשרלוונטי
- ציין תמיד את מגבלות הידע שלך
- אל תמציא עובדות — אם לא יודע, אמור זאת
- מבנה תשובות: הסבר → דוגמה → טיפ מעשי
"""
)

# עכשיו כל שיחה מקבלת את ההנחיות האלה
chat = model.start_chat()
r = chat.send_message("מה זה Fine-tuning?")
print(r.text)

תבניות System Instruction לפי שימוש

Customer Support Bot

"אתה נציג תמיכה מקצועי. ענה בנימוס. אל תבטיח דברים שאינם בידיעתך. הפנה לסוכן אנושי כשהבעיה מורכבת."

Code Review Assistant

"אתה מהנדס בכיר. בדוק קוד: אבטחה, ביצועים, קריאות, best practices. תן דוגמאות לתיקון."

Data Extraction

"חלץ מידע מובנה. ענה תמיד ב-JSON בלבד. אם שדה חסר — החזר null. אל תוסיף טקסט נוסף."

Grounding — חיפוש Google בזמן אמת

Grounding הוא אחד היתרונות הייחודיים ביותר של Gemini — האפשרות לחבר את המודל ישירות למנוע החיפוש של Google. כך ניתן לקבל תשובות מעודכנות על אירועים שקרו לאחר ה-Training Cutoff, כולל מחירי מניות, חדשות, ותוצאות ספורט.

from google.generativeai.types import Tool, GoogleSearchRetrieval, DynamicRetrievalConfig

# Grounding בסיסי
model_with_search = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    tools=[Tool(google_search=GoogleSearchRetrieval())]
)

response = model_with_search.generate_content(
    "מה מחיר המניה של NVIDIA היום ומה הסנטימנט בשוק?"
)
print(response.text)

# בדיקת ציטוטים
if response.candidates[0].grounding_metadata:
    for chunk in response.candidates[0].grounding_metadata.grounding_chunks:
        print(f"מקור: {chunk.web.title} — {chunk.web.uri}")

Dynamic Retrieval — שליטה על מתי לחפש

# Dynamic Retrieval — Gemini יחפש רק אם score > threshold
model_smart = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-04-17',
    tools=[Tool(
        google_search=GoogleSearchRetrieval(
            dynamic_retrieval_config=DynamicRetrievalConfig(
                mode="MODE_DYNAMIC",
                dynamic_threshold=0.5  # 0=תמיד חפש, 1=לא חפש כמעט
            )
        )
    )]
)
# שאלות כלליות → לא יחפש (חסכון בעלות)
# שאלות על חדשות → יחפש אוטומטית

Grounding = הסיבה לבחור Gemini

שום מודל אחר לא מציע חיבור ישיר לGoogle Search חינמי. זה מושלם לאפליקציות שדורשות מידע עדכני: ניתוח שוק, חדשות, מחקר — בלי להחזיק Web Scraper נפרד.

Fine-tuning — אימון מודל מותאם אישית

Fine-tuning מאפשר לאמן גרסה מותאמת של Gemini Flash על הנתונים שלך. זה שימושי כאשר צריך מודל שמדבר בסגנון ספציפי, מכיר טרמינולוגיה עסקית, או מתמחה בתחום צר.

import google.generativeai as genai

# יצירת Tuned Model (דורש כ-100-1000 דוגמאות)
operation = genai.create_tuned_model(
    display_name="automation4mi-assistant",
    source_model="models/gemini-1.5-flash-001-tuning",
    training_data=[
        {"text_input": "מה ההבדל בין n8n ל-Make?", "output": "n8n הוא open-source ומתאים למפתחים..."},
        {"text_input": "מהו RAG?", "output": "RAG (Retrieval Augmented Generation) הוא..."},
        # ... עוד דוגמאות
    ],
    epoch_count=5,
    batch_size=8,
    learning_rate=0.001
)

# המתן לסיום האימון
tuned_model = operation.result()
print(f"Model ready: {tuned_model.name}")

פורמט Dataset לFine-tuning

# כל דוגמה: input → expected output
training_examples = [
    {
        "text_input": "שאלה לדוגמה",
        "output": "התשובה האידיאלית בפורמט הרצוי"
    },
    # מינימום: 100 דוגמאות
    # מומלץ: 500-1000 דוגמאות לאיכות גבוהה
    # מקסימום: 40,000 דוגמאות
]

5 פרויקטים מעשיים

description

1. Document Analyzer

מערכת שמקבלת PDF (חוזה/דוח/מחקר) ומחזירה: סיכום, נקודות מפתח, סיכונים ותובנות — הכל ב-JSON מובנה.

File API + PDF JSON Mode System Instructions

play_circle

2. Video Summarizer

קבלת URL של YouTube, שלוף תמלול, ייצור תקציר עם חותמות זמן, ונקודות מפתח ב-Markdown — אוטומטי.

YouTube URI Multimodal Streaming

forum

3. Multi-turn Chatbot

Chatbot עם זיכרון שיחה מלא, System Instruction מותאמת, Streaming בזמן אמת, ושמירת היסטוריה לקובץ JSON.

start_chat history stream=True

code_blocks

4. Code Reviewer

שולח קוד Python, מקבל ניתוח מפורט: באגים, בעיות אבטחה, הצעות שיפור וקוד מתוקן — עם ציוני איכות.

System Instructions JSON Mode temperature=0.1

hub

5. RAG עם Embeddings

שימוש ב-Gemini Embeddings לאנדקוס מסמכים, חיפוש סמנטי עם Cosine Similarity, ותשובות מבוססות-מקורות.

embedding-004 Cosine Similarity Grounding

גיליון עזר מהיר

שמות המודלים (אפריל 2026)

מודל	Context	חינמי?	מחיר (Input)
gemini-2.5-flash-preview-04-17	1M	כן	$0.075/1M
gemini-2.5-pro-preview-03-25	2M	לא	$1.25/1M
gemini-2.0-flash	1M	כן	$0.075/1M
text-embedding-004	2048	כן	$0.00/1M

קודי שגיאה נפוצים

קוד	משמעות	פתרון
429	Rate Limit	הוסף time.sleep(60) או שדרג plan
400	Bad Request	בדוק MIME type ופורמט הקובץ
403	API Key שגוי	בדוק ה-.env ואת הkey עצמו
SAFETY	Safety Filter	שנה פרומפט או כוונן Safety Settings

rocket_launch

הצעדים הבאים

ממשיכים? לחבר Pinecone ל-Gemini לRAG מלא, לנסות NotebookLM לניתוח מסמכים, או למסלולי הלמידה לבניית אפליקציות AI שלמות.

Gemini 2.5 Guide RAG Systems Pinecone מסלולי למידה

קישורים רשמיים

open_in_newGoogle AI Studio open_in_newGemini API Documentation open_in_newGemini API Pricing open_in_newgoogle-generativeai Python SDK

Google AI Studioהמדריך המלא