לא היה ספק שזה רק עניין של זמן עד שגוגל, אחת מחברות הטכנולוגיה הגדולות בעולם, זאת שללא ספק מונחלת עמוק מאוד בשימוש היום יומי שלנו מזה שנים ארוכות, תיכנס לתחום הבינה המלאכותית, אבל אין ספק כי את מה שגוגל פרסמה לעולם בשבוע האחרון, אף אחד לא צפה. אז בואו נדבר על זה קצת.
לג'מיני שלושה מודלים, מודל הNANO שבקרוב מאוד צפוי להשתלב על גבי מכשירי אנדרואיד ובקרוב לכולנו תהיה גישה אליו גם דרך הדפדפן, הפרו אשר גם אליו לכולנו תהיה גישה והוא ישתלב בכל היישומים של גוגל, ולאחר מכן האולטרה, שטרם התשחרר אבל צפוי להתשחרר בשנה הקרובה ולשמש בעיקר למרכזי נתונים ענקיים ויישומים ארגוניים.
אחד היתרונות המשמעותיים ביותר של ג'מיני על שאר התמודדים במירוץ הבינה המלאכותית הוא ללא ספק היכולת של ג'מיני לנהל שיחה שותפת גם בעזרת תמונות, סרטונים וקטעי אודיו, בניגוד למתחרים שיודעים כרגע להציג טקסט או אודיו במקרה הטוב, הסרטון הבא מתאר את היכולת של Gemini להבין בלייב מה הלקוח מצייר ומגיב בצורה יוצאת מן הכלל, תוך שניות, ממש כאילו אתה מדבר עם אדם
החברה OpenAi שהביאה לנו בין היתר את ChatGpt, הביאה גם את DALL-E מחולל אומנות שעובד בצורה מדהימה ויוצאת מגדר הרגיל, מספקת לנו את כל כלי הבינה המלאכותית שאנחנו יכולים לבקש, פשוט בנפרד.גוגל שאפה לעשות דברים אחרת, הכל ביחד במקום אחד, בסרטון הבא, ביקש המשתמש מהצ'אט רעיונות ליום הולדת לילדה שלו, אם בChatGpt או קלוד, היינו מקבלים 10 סעיפים בכתב, עם גוגל אנחנו נקבל תמונות שהצ'אט יצר באותו רגע שמראות מספר רעיונות בצורה מוחשית ומעניינת.
בסרטון שראינו עכשיו רואים את המתמש מצייר ברווז, מוסיף לו מים וצובע אותו בכחול, כל עוד הוא עשה דברים נכונים כמו לצייר ברווז או להוסיף לו מים, הצ'אט רק מגיב למה שהוא רואה מבלי להוסיף דבר, אבל כשהוא צבע אותו בכחול, פתאום הצ'אט מגיב," אין דבר כזה ברווז כחול", עד שמהתמש ממש מראה לו ברווז כחול ואז ג'מיני מגיב "אני מניח שטעיתי".
לאחר מכן ג'מיני בוחן את המשתמש, הוא נותן לו כל מיני רמזים שמצביעים על מדינות כלשהי, ואז המשתמש צריך להצביע על מדינה וג'מיני ישר מגיב האם זה נכון או לא, ההבנה המהירה והמדוייקת שלו למתרחש בכל רגע נתון היא מדהימה אבל זה לא נגמר פה, שימו לב….
בשלב השלישי המשתמש מחביא בתוך כוס אחת מתוך שלוש הכוסות שעל השולחן חתיכת נייר, ואז מערבב, היכולת של Gemini להבין ולעקוב אחרי הכוס היא פשוט מדהימה, דבר נוסף ומדהים לא פחות זו העובדה שמיד כשהוא ראה שלוש כוסות הוא הבין שהוא חד אותו ומשחק איתו "מצא את הכדור" ומוסיף "אני מקבל את האתגר".
לאחר מכן הוא מתחיל לעשות צורות של חיות עם הידיים, כאלה שגם אנחנו אולי לא מבינים, אבל ג'מיני לגמרי מבין, ושוב תוך שניות מגיב "נראה שאת פורס את האצבעות של ידך כדי לדמות את הכנפיים של ציפור שעפה"
ואז הוא מחביא מטבע מתחת ליד, ג'מיני מגיב "זה מתחת ליד הימנית" ואז המשתמש מראה לו שזה בעצם מתחת לשמאלית, ואז ישר ג'מיני מגיב "אני מניח שטעיתי, עשית את זה באמצעות טכניקת של מהירות ידיים מדהימה"
אחד הדברים שהכי הדהימו אותי, היה כאשר המשתמש הראה לג'מיני שני כדורי צמר, אחד בצבע כחול, השני וורוד ושאל אותו מה אפשר להכין מזה, ואז בן רגע הוא הוציא לו תמונה (שהוא יצר באותו רגע) של ארנב מצמר בצבעים כחול וורוד, הסרטון הזה שפרסמה גוגל ממש לפני יומיים השאיר אותי עם לסת פעורה, ועם כמה שזה מגניב, זה לגמרי הדבר האחרון עליו חשבתי. אני רק חושב על מה עתיד לבוא, ואיך גוגל תשתמש בכלים המשוגעים האלו בעתיד, כי עם רמת הבנה כזו מדהימה השמיים הם (לא) הגבול!
אותם הכלים והפיצ'רים שראינו בסרטון יהיו זמינים אך ורק בשנה הבאה עם מודל האולטרה של Gemini, כשעד אז נוכל להשתמש במודל הNANO שיגיב לנו בטקסט בלבד.
דמיס, מנכל ואחד ממייסידי Deepmind, אחת מחברות הבינה המלאכותית החזקות בעולם, אמר כי כיום יש לא מעט בעיות, שגיאות ותקלות בGemini אך הוא מוסיף ואומר כי ככל שאנשים ישתמשו יותר כך יהפוך Gemini להיות חכם הרבה יותר והשגיאות והבעיות יחלו להיעלם במהרה.
ג'מיני קיבל ציון של 90.04% ב-MMLU, בדיקה המשלבת 57 תחומים כגון מתמטיקה, פיזיקה, היסטוריה, משפטים, רפואה ואתיקה כדי לבחון את הידע העולמי ואת יכולות פתרון הבעיות אותו הכלי. אין ספק כי זה ציון יוצא מן הכלל, ונדמה כי הוא לגמרי מגיע לGemini.
היכולת שלו להבין אאוטפיט, צורת לבוש, להבין בדיוק מה הוא רואה, להבין מה כל מוצר מסמל ולאן הולכים איתו, מה עושים איתו, ומי משתמש בו בדרך כלל זה פשוט מדהימה! צפו.
בסרטון המצורף פה, רואים את Gemini מצליח לעזור בשיעורי בית בתחום המתמטיקה והפיזיקה בצורה באמת יוצאת מן הכלל.
הסרטונים שפרסמה גוגל בשבועות האחרונים הם באמת בלתי נתפסים ונדמה כי הפחד של "רובוטים בקרוב יהיו יותר חכמים מאיתנו ויכבשו את העולם" צריך להיות חזק יותר מאי פעם…
סתם, יהיה בסדר.
אבל אין ספק כי גוגל חשפה לנו השבוע משהו לגמרי שונה ממה שהכרנו עד עכשיו כזה שלגמרי ישנה את חוקי המשחק ומכאן ההתקדמות רק תהיה מהירה הרבה יותר, מרהיבה הרבה יותר ובאמת באמת שימושית וחזקה.
Comments