В Токийском университете работа Alter3 соединилась с GPT-4 для возможности его программирования голосом.
30.12.23
Команда исследователей из Токийского университета достигла значительного прогресса в области робототехники, объединив обширную языковую модель GPT-4 и Alter3. Это инновационное сочетание позволяет выполнять более реалистичные жесты и программироваться на естественном языке, отказываясь от традиционных аппаратно-зависимых систем управления. Alter3, гуманоидный робот, получил способность к выполнению сложных движений верхней части тела и имитации эмоций на лице.
Ученые назвали этот прогресс «сменой парадигмы» в области робототехники. Благодаря GPT-4, робот может изучать и выполнять различные задачи, такие как селфи, игра в бейсбол, поедание попкорна или игра на воображаемой гитаре, просто слушая естественные языковые инструкции. Раньше для таких задач нужно было кодировать конкретные инструкции для каждого действия, а теперь робот может взаимодействовать с помощью языка, что делает взаимодействие более эффективным и человекоцентричным.
Ученые высказывают мнение, что сейчас можно осуществлять прямое управление роботом, передавая лингвистические выражения человеческих действий через программный код. Это расширяет способности взаимодействия меж человеком и роботом. Этот прорыв в области робототехники открывает перспективы создания более интеллектуальных, адаптивных и персонализированных робототехнических сущностей. В работе Alter3 установлена камера, позволяющая ему «видеть» людей и совершенствовать свое поведение, анализируя их реакции. В одном сценарии робот демонстрирует, что ест пакет попкорна, но потом оказывается, что попкорн принадлежит сидящему рядом человеку. Выражения лица робота и движения руки передают удивление и стыд.
Использование речевых моделей в исследованиях робототехники делает процесс координации многих суставов работ гораздо проще. Ученые могут давать вербальные инструкции, описывающие варианты движения, и получать программный код для запуска двигателя робота. Это освобождает от рутинной работы, которая заключается в программировании каждого отдельного движения для 43 осей, и позволяет исследователям быстрее, плавнее и точнее настраивать и совершенствовать движения работа со временем.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Видеонаблюдение от Ajax: обзор IP-камер DomeCam Mini, TurretCam, BulletCam и видеорегистратора NVR
Компания Ajax Systems продолжила расширение своей экосистемы устройств, представив камеры видеонаблюдения и видеорегистратор для управления видеопотоками. Достаточно консервативный и устоявшийся тип устройств, традиционно для компании подкрепили глубокой проработкой софта и комплектующих.
Игровой монитор Lenovo Lecoo N2521 с экраном 180 Гц и временем отклика 1 мс стоит менее $100
Lenovo мониторЭкран Lenovo Lecoo N2521 охватывает 95,59% цветового пространства sRGB и 80,36% DCI-P3, что обеспечивает хорошую цветопередачу.
Китайский электрокар BYD Denza Z9 GT принадлежит к премиум-сегменту и имеет запас хода до 1100 км
автомобиль Китай электротранспортПолностью электрическая версия BYD Denza Z9 GT еще более впечатляющая по своей мощности. Используя три электромотора, она развивает суммарную мощность в 710 кВт (952 л.с.)