В 2024 г. на рынок вышли ряд больших языковых моделей (LLM), которые стали новыми флагманами в мире генеративного искусственного интеллекта (ИИ). Поддержка мультимодальности стала доступна для майской ChatGPT-4o, в сентябрьскую ChatGPT-o1 были добавлены механизмы «мышления» за счет специальной обработки запросов — теперь модель проходит дополнительные «рассуждения», прежде чем генерировать ответ на пользовательский запрос. Большим событием стал выход в открытый доступ 25 сентября модели Llama 3.2 на 11–90 млрд параметров, которая, по оценкам на некоторых бенчмарках, обходит ChatGPT в задачах работы с текстом и изображениями. Значительные улучшения также были введены в вышедшем 20 июня Claude 3.5 Sonnet — модель также обходила ChatGPT в задачах, связанных с логическим обоснованием выбора, написанием кода, пониманием юмора. С моделью Gemini 2.0 выступила 11 декабря Google; компания обещает выпустить ее в открытый доступ в следующем году и уже вводит ее в свои продукты. Улучшения в свои модели продолжают добавлять Яндекс и Сбер,сообщает expert.ru.