Как опытный исследователь, глубоко увлекающийся искусственным интеллектом, я заинтригован последним творением Nvidia — Llama-3.1-Nemotron-70B-Instruct. Потратив бесчисленное количество часов на изучение моделей искусственного интеллекта и их возможностей, я могу с уверенностью сказать, что это объявление возбудило мое любопытство.
15 октября Nvidia случайно представила инновационную модель искусственного интеллекта; Утверждается, что эта новая модель превосходит по производительности нынешние системы искусственного интеллекта высшего уровня, такие как GPT-4o и Claude-3.
На основании сообщения, опубликованного командой разработчиков Nvidia AI на платформе социальных сетей X.com, говорится, что модель Llama-3.1-Nemotron-70B-Instruct в настоящее время является одной из лучших моделей на арене чат-ботов lmarena.AI.
Немотрон
По сути, Llama-3.1-Nemotron-70B-Instruct представляет собой переработанную версию Llama-3.1-70B-Instruct с открытым исходным кодом. «Немотрон» в названии означает участие Nvidia в конечном продукте.
Коллекция «групп лам» Meta служит бесплатной отправной точкой для программистов, позволяя им создавать и расширять модели.
Что касается Nemotron, Nvidia решила пойти дальше и создать систему, призванную превзойти по полезности известные модели, такие как ChatGPT OpenAI и Claude-3 от Anthropic.
Nvidia превратила стандартную модель искусственного интеллекта Meta в одну из «самых полезных» моделей в мире, используя индивидуальные наборы данных, усовершенствованные методы точной настройки и передовое аппаратное обеспечение искусственного интеллекта.
«Я задал ему несколько вопросов по программированию, которые обычно задаю для сравнения программ LLM, и получил одни из лучших ответов. лол, черт возьми».
Бенчмаркинг
Когда дело доходит до определения того, какая модель ИИ является «лучшей», не существует четкой методологии. В отличие, например, от измерения температуры окружающей среды с помощью ртутного термометра, не существует единой «истины», когда речь идет о производительности модели ИИ.
Как аналитик, я считаю крайне важным оценивать эффективность моделей ИИ так же, как и оценку человеком. Для этого я использую методы сравнительного тестирования.
Как исследователь в области искусственного интеллекта, я занимаюсь бенчмаркингом моделей ИИ. Этот процесс предполагает представление нескольких моделей ИИ с одинаковыми запросами, задачами или проблемами, а затем оценку эффективности их ответов путем их сравнения. Поскольку определение того, что представляет собой полезный результат, может быть субъективным, обычно привлекаются люди-оценщики для слепой оценки производительности каждой машины.
Похоже, Nvidia предполагает, что производительность их новой модели значительно превосходит такие модели, как GPT-4o и Claude-3, которые на данный момент лидируют в этой области.
На изображении показаны рейтинги «Сложного» теста в таблицах лидеров Chatbot Arena, где Nvidia Llama-3.1-Nemotron-70B-Instruct явно не отображается. Однако если утверждение разработчиков о том, что он набрал 85 баллов в этом тесте, верно, то он по умолчанию станет ведущей моделью в этой конкретной категории.
Интрига вокруг этого достижения может быть усилена тем фактом, что Llama-3.1-70B — это модель искусственного интеллекта среднего класса с открытым исходным кодом, разработанная Meta. Существует существенно более крупный вариант «Ламы-3.1» — версия 405Б, доработанная с использованием большего количества параметров (а конкретно — примерно 405 миллиардов).
Для сравнения, GPT-4o, по оценкам, был разработан с более чем одним триллионом параметров.
Смотрите также
- Что будет с Ethena: прогнозы цен на криптовалюту ENA
- Прогноз курса доллара к злотому на 2024
- Виталик Бутерин продал мемкоины на $1,6 млн, обещанные на благотворительность
- Осужденный руководитель FTX Райан Саламе официально находится под стражей
- Что такое шибариум и что это значит для сиба-ину?
- Спотовые биткойн-ETF США получили приток $556 млн в самый крупный день с июня
- Предполагаемый крипто-мошенник скрывается после подделки браслета на лодыжке
- Мошенничество с ботами MEV вызвало шумиху вокруг искусственного интеллекта, чтобы вернуться под новым именем, говорит SlowMist
- Крипто-бизнес: 10 лет стремительного роста Tether, связи с США, европейские препятствия
- Что будет с биткоином: прогнозы цен на криптовалюту BTC
2024-10-17 20:21