Как криптоинвестор с опытом работы в области технологий и искусственного интеллекта, я в восторге от последнего обновления Synthesia своих аватаров с искусственным интеллектом. Их «Выразительные аватары» могут произвести революцию в способах общения компаний с помощью цифровых средств.
Компания Synthesia, занимающаяся искусственным интеллектом, получившая поддержку от Nvidia, недавно представила усовершенствование. Это обновление позволяет аватарам, созданным ИИ, более достоверно выражать человеческие эмоции и действия.
25 апреля корпорация представила свои «эмоциональные текстовые аватары». Эти аватары предназначены для передачи эмоций в ответ на текстовые команды, что делает их пригодными для использования в корпоративных презентациях, маркетинговых материалах и учебных занятиях.
Как исследователь, изучающий последние достижения в области искусственного интеллекта, я рад сообщить, что мы достигли революционной вехи. Впервые аватары с искусственным интеллектом могут понимать смысл произносимых ими слов.
— Synthesia (@synthesiaIO), 25 апреля 2024 г.
Возможности генерации видео OpenAI Sora известны тем, что создают реалистичные движущиеся визуальные эффекты.
У ИИ есть свои ограничения, особенно когда дело касается достоверного изображения людей. Вместо точной передачи их черт и движений ИИ может отображать искаженные части тела, несоответствующий фон или смещенные губы во время произносимых слов.
В своем последнем обновлении Synthesia фокусируется на улучшении синхронизации губ и эмоциональной точности для ботов за счет использования в производственном процессе реальных людей, читающих сценарии.
Как исследователь, изучающий передовой искусственный интеллект, я наткнулся на интригующее заявление Виктора Рибарбелли, генерального директора и соучредителя Synthesia. В недавнем видео он подчеркнул значительный пробел в развитии аватаров: хотя люди естественным образом понимают и реагируют на эмоции, передаваемые через выражение лица, аватарам не хватает этой способности. Проще говоря, до сих пор аватары не понимали значения наших произносимых слов, что затрудняло их эмоциональный интеллект.
В студии людей учили точно выражать основные эмоции, такие как счастье, печаль и разочарование, с помощью соответствующих выражений лица и голосовых тонов в ответ на простые сигналы.
Как криптоинвестор, я рад сообщить, что последние обновления аватаров включают впечатляющий набор функций. Теперь они доступны более чем на 130 языках, что обеспечивает более разнообразный и инклюзивный пользовательский опыт. Кроме того, эти аватары могут создавать собственные субтитры, обеспечивая четкое общение для всех пользователей. А если этого недостаточно, они могут даже имитировать голоса своих создателей, добавляя индивидуальности каждому взаимодействию.
Среди моделей аватаров, демонстрирующих разговорные языки, отличные от английского, на веб-сайте Synthesia, такие как французский, немецкий и испанский, модель английского языка демонстрирует наибольшую степень сложности и сходства с человеческой речью, согласно оценке, проведенной CryptoMoon.
Как исследователь, я наткнулся на интригующую информацию об этом стартапе. По имеющимся данным, по крайней мере половина компаний из списка Fortune 100 являются их клиентами, что является весьма впечатляющим достижением. Кроме того, в общей сложности они обслуживают более 55 000 предприятий. Эта разнообразная клиентура охватывает различные отрасли и включает в себя, среди прочего, такие известные компании, как Zoom, Xerox, Microsoft и Reuters.
Synthesia — британская технологическая компания, основанная в 2017 году и добившаяся значительного роста. Благодаря стремительному развитию технологий искусственного интеллекта (ИИ) в прошлом году стоимость компании взлетела почти до 1 миллиарда долларов. Известные инвесторы, в том числе Nvidia – ведущий игрок в производстве полупроводниковых чипов для искусственного интеллекта – поддержали Synthesia.
Сосредоточив внимание на создании реалистичных человекоподобных аватаров специально для бизнес-приложений, Synthesia сумела избежать некоторой шумихи и острой конкуренции, с которой сталкиваются другие модели чат-ботов, такие как ChatGPT от OpenAI и чат-бот Gemini от Google, которые используют более широкий подход.
Смотрите также
- Что будет с Ethena: прогнозы цен на криптовалюту ENA
- Прогноз курса доллара к злотому на 2024
- Что будет с биткоином: прогнозы цен на криптовалюту BTC
- Виталик Бутерин продал мемкоины на $1,6 млн, обещанные на благотворительность
- Прогноз курса доллара к шекелю на 2024
- Лучше узнайте кандидата в криптовалюту: Кари Лейк
- Что такое шибариум и что это значит для сиба-ину?
- HUMBL выдал патент США на технологию блокчейн-платежей
- Фирма, занимающаяся криптобезопасностью, по ошибке делится ссылкой на канал, чтобы «помочь» жертвам взлома Radiant
- Обвиняемый мэр Нью-Йорка оставляет сомнительное крипто-наследие по мере нарастания противоречий
2024-04-26 15:11