Стартап AI, поддерживаемый Nvidia, выпускает аватары, выражающие человеческие эмоции

Самые главные криптоновости в Телеграм-канале CryptoMoon, присоединяйтесь!👇

Cryptomoon Telegram


Как криптоинвестор с опытом работы в области технологий и искусственного интеллекта, я в восторге от последнего обновления Synthesia своих аватаров с искусственным интеллектом. Их «Выразительные аватары» могут произвести революцию в способах общения компаний с помощью цифровых средств.


Компания Synthesia, занимающаяся искусственным интеллектом, получившая поддержку от Nvidia, недавно представила усовершенствование. Это обновление позволяет аватарам, созданным ИИ, более достоверно выражать человеческие эмоции и действия.

25 апреля корпорация представила свои «эмоциональные текстовые аватары». Эти аватары предназначены для передачи эмоций в ответ на текстовые команды, что делает их пригодными для использования в корпоративных презентациях, маркетинговых материалах и учебных занятиях.

Как исследователь, изучающий последние достижения в области искусственного интеллекта, я рад сообщить, что мы достигли революционной вехи. Впервые аватары с искусственным интеллектом могут понимать смысл произносимых ими слов.

— Synthesia (@synthesiaIO), 25 апреля 2024 г.

Возможности генерации видео OpenAI Sora известны тем, что создают реалистичные движущиеся визуальные эффекты.

У ИИ есть свои ограничения, особенно когда дело касается достоверного изображения людей. Вместо точной передачи их черт и движений ИИ может отображать искаженные части тела, несоответствующий фон или смещенные губы во время произносимых слов.

В своем последнем обновлении Synthesia фокусируется на улучшении синхронизации губ и эмоциональной точности для ботов за счет использования в производственном процессе реальных людей, читающих сценарии.

Как исследователь, изучающий передовой искусственный интеллект, я наткнулся на интригующее заявление Виктора Рибарбелли, генерального директора и соучредителя Synthesia. В недавнем видео он подчеркнул значительный пробел в развитии аватаров: хотя люди естественным образом понимают и реагируют на эмоции, передаваемые через выражение лица, аватарам не хватает этой способности. Проще говоря, до сих пор аватары не понимали значения наших произносимых слов, что затрудняло их эмоциональный интеллект.

В студии людей учили точно выражать основные эмоции, такие как счастье, печаль и разочарование, с помощью соответствующих выражений лица и голосовых тонов в ответ на простые сигналы.

Как криптоинвестор, я рад сообщить, что последние обновления аватаров включают впечатляющий набор функций. Теперь они доступны более чем на 130 языках, что обеспечивает более разнообразный и инклюзивный пользовательский опыт. Кроме того, эти аватары могут создавать собственные субтитры, обеспечивая четкое общение для всех пользователей. А если этого недостаточно, они могут даже имитировать голоса своих создателей, добавляя индивидуальности каждому взаимодействию.

Среди моделей аватаров, демонстрирующих разговорные языки, отличные от английского, на веб-сайте Synthesia, такие как французский, немецкий и испанский, модель английского языка демонстрирует наибольшую степень сложности и сходства с человеческой речью, согласно оценке, проведенной CryptoMoon.

Как исследователь, я наткнулся на интригующую информацию об этом стартапе. По имеющимся данным, по крайней мере половина компаний из списка Fortune 100 являются их клиентами, что является весьма впечатляющим достижением. Кроме того, в общей сложности они обслуживают более 55 000 предприятий. Эта разнообразная клиентура охватывает различные отрасли и включает в себя, среди прочего, такие известные компании, как Zoom, Xerox, Microsoft и Reuters.

Synthesia — британская технологическая компания, основанная в 2017 году и добившаяся значительного роста. Благодаря стремительному развитию технологий искусственного интеллекта (ИИ) в прошлом году стоимость компании взлетела почти до 1 миллиарда долларов. Известные инвесторы, в том числе Nvidia – ведущий игрок в производстве полупроводниковых чипов для искусственного интеллекта – поддержали Synthesia.

Сосредоточив внимание на создании реалистичных человекоподобных аватаров специально для бизнес-приложений, Synthesia сумела избежать некоторой шумихи и острой конкуренции, с которой сталкиваются другие модели чат-ботов, такие как ChatGPT от OpenAI и чат-бот Gemini от Google, которые используют более широкий подход.

Смотрите также

2024-04-26 15:11