U 1960-ima, MIT je predstavio NLP program ELIZA, otvarajući put modernim AI chatbotima. Interes za NLP je pao tokom ‘AI zime’ 1970-ih i 80-ih, ali je njegovo oživljavanje došlo 1980-ih s napredcima poput označavanja dijelova govora i strojnog prevođenja. Istraživači su postavili temelje za jezične modele malog opsega, kasnije razvijenih zahvaljujući GPU-ima i AI tehnologiji.
2010-e su donijele daljnje razvoje u AI, s GAN i Transformer modelima podržavajući današnje napredne AI tehnologije, poput GPT-3.5 i GPT-4. Posebno, izlazak ChatGPT-a 2022. potaknuo je niz ažuriranja i novih usluga jezičnih modela. Nedavno predstavljanje GPT-4 u svibnju 2024. otvorilo je novu eru multimodalnih jezičnih modela koji su sposobni za obradu različitih formata podataka.
Uobičajeni primjeri modernih jezičnih modela uključuju GPT-3.5 i GPT-4 tvrtke OpenAI, kao i Google-ov PaLM i Gemini, zajedno s Meta Platforms-ovim open-source serijalom Llama. Jezični modeli nalaze primjenu u generiranju teksta, prevođenju, sažimanju, klasifikaciji, analizi sentimenta, chatbotima, pa čak i generiranju slika s rastom multimodalnih LMM.
Ostanite s nama za detaljnije istraživanje razlika između generativne AI i LLM iz tri različite perspektive u našem sljedećem članku.