Прогноз на 2025 год. Новая модель искусственного интеллекта Nvidia с открытым исходным кодом превосходит GPT-4o в тестах

Как опытный исследователь, глубоко увлекающийся искусственным интеллектом, я заинтригован последним творением Nvidia — Llama-3.1-Nemotron-70B-Instruct. Потратив бесчисленное количество часов на изучение моделей искусственного интеллекта и их возможностей, я могу с уверенностью сказать, что это объявление возбудило мое любопытство.

🎁 Кто не любит подарки? В Airdrop токены летят, как конфетти – хватай, пока не разобрали!

Присоединиться в Telegram

15 октября Nvidia случайно представила инновационную модель искусственного интеллекта; Утверждается, что эта новая модель превосходит по производительности нынешние системы искусственного интеллекта высшего уровня, такие как GPT-4o и Claude-3.

На основании сообщения, опубликованного командой разработчиков Nvidia AI на платформе социальных сетей X.com, говорится, что модель Llama-3.1-Nemotron-70B-Instruct в настоящее время является одной из лучших моделей на арене чат-ботов lmarena.AI.

Немотрон

По сути, Llama-3.1-Nemotron-70B-Instruct представляет собой переработанную версию Llama-3.1-70B-Instruct с открытым исходным кодом. «Немотрон» в названии означает участие Nvidia в конечном продукте.

Коллекция «групп лам» Meta служит бесплатной отправной точкой для программистов, позволяя им создавать и расширять модели.

Что касается Nemotron, Nvidia решила пойти дальше и создать систему, призванную превзойти по полезности известные модели, такие как ChatGPT OpenAI и Claude-3 от Anthropic.

Nvidia превратила стандартную модель искусственного интеллекта Meta в одну из «самых полезных» моделей в мире, используя индивидуальные наборы данных, усовершенствованные методы точной настройки и передовое аппаратное обеспечение искусственного интеллекта.

«Я задал ему несколько вопросов по программированию, которые обычно задаю для сравнения программ LLM, и получил одни из лучших ответов. лол, черт возьми».

Бенчмаркинг

Когда дело доходит до определения того, какая модель ИИ является «лучшей», не существует четкой методологии. В отличие, например, от измерения температуры окружающей среды с помощью ртутного термометра, не существует единой «истины», когда речь идет о производительности модели ИИ.

Как аналитик, я считаю крайне важным оценивать эффективность моделей ИИ так же, как и оценку человеком. Для этого я использую методы сравнительного тестирования.

Как исследователь в области искусственного интеллекта, я занимаюсь бенчмаркингом моделей ИИ. Этот процесс предполагает представление нескольких моделей ИИ с одинаковыми запросами, задачами или проблемами, а затем оценку эффективности их ответов путем их сравнения. Поскольку определение того, что представляет собой полезный результат, может быть субъективным, обычно привлекаются люди-оценщики для слепой оценки производительности каждой машины.

Похоже, Nvidia предполагает, что производительность их новой модели значительно превосходит такие модели, как GPT-4o и Claude-3, которые на данный момент лидируют в этой области.

На изображении показаны рейтинги «Сложного» теста в таблицах лидеров Chatbot Arena, где Nvidia Llama-3.1-Nemotron-70B-Instruct явно не отображается. Однако если утверждение разработчиков о том, что он набрал 85 баллов в этом тесте, верно, то он по умолчанию станет ведущей моделью в этой конкретной категории.

Интрига вокруг этого достижения может быть усилена тем фактом, что Llama-3.1-70B — это модель искусственного интеллекта среднего класса с открытым исходным кодом, разработанная Meta. Существует существенно более крупный вариант «Ламы-3.1» — версия 405Б, доработанная с использованием большего количества параметров (а конкретно — примерно 405 миллиардов).

Для сравнения, GPT-4o, по оценкам, был разработан с более чем одним триллионом параметров.

Смотрите также

2024-10-17 20:21