מודל השפה של לאמה 3 החדש – כתבה חדשה

על פי דיווח אחרון, Verge.com, חברת מטה, החברה הידועה קודם כן כפייסבוק, מתכוונת לשחרר גרסאות קטנות יותר של מודל השפה הפופולרי שלה, לאמה. תנועה זו משקפת מגמה רחבה בתעשיית המודלים הנוירואליים, כאשר מפתחים מוסיפים דגמים קלים יותר לקו המוצרים האיכותיים שלהם. במטה כבר מציעה גרסה קטנה יותר של מודל הלאמה 2 שלה, הלאמה 2 7B, שזמינה מפברואר שנה שעברה. ספקים נרדפים בשוק כגון גוגל עם משפחת גמה ואת ה־Mistral 7B מחברת המודלים האמיץ הצרפתית Mistral.

המודלים הקטנים הללו עשויים לסבול ממגבלות בטיפול בהוראות משתמש ארוכות, אך הם יתכוננו ליתרונות כגון מהירות משופרת, גמישות ובעיקר יעילות מחירית. למרות גודלם הקומפקטי, הם שומרים על על יכולותיהם לבצע מגוון משימות כמו תקצירי PDF, יצירת קוד והשתתפות בשיחות. לעומת זאת, המודלים הגדולים יותר מתאימים למשימות מורכבות יותר שדורשות משאבים חישוביים משמעותיים, כמו יצירת תמונות ברזולוציה גבוהה או ביצוע מספר הוראות בו זמנית.

על ידי שימוש בפרמטרים פחותים או נתוני למידה, המודלים הקטנים דורשים פחות יכולת חישובית. הביקוש הנמוך למשאבים הזה אינו רק מפחית למשתמשים את המחיר שהם משלמים, אלא גם מאפשר להם לפרוס את המודלים בפרויקטים ספציפיים. לדוגמה, הם יכולים לשמש ביישומי סיוע בקוד או להשתלב במכשירים כמו טלפונים ניידים וניידים מחשבים אשר בדרך כלל מגבילים את השימוש בהם בכוח השימוש.

כלפי מודל הלאמה 3 הבא, Meta מתכוונת לשחררו ביולי. נקודת השיא מעוניינת להיות "רפה" יותר מהקודם, נותנת לו את היכולת לענות על שאלות פולמיות שהמודל הקודם לא תוכנן במיוחד לטיפול בהן.

שאלות נפוצות

The source of the article is from the blog be3.sk

Privacy policy
Contact