Во время мероприятия AI in Focus - Digital Kickoff генеральный директор OpenAI Сэм Браун объявил о предстоящем выпуске GPT-4, который будет включать мультимодальные модели, способные генерировать видео, что представляет собой значительный прогресс в обработке естественного языка. Браун заявил, что использование больших языковых моделей стало "переломным моментом", позволив машинам понимать естественный язык, даже на разных языках.
Microsoft в партнерстве с OpenAI планирует использовать мультимодальность, чтобы сделать модели более всеобъемлющими и предложить новые возможности. Эта технология способна произвести революцию в различных отраслях промышленности, оптимизируя повторяющиеся задачи и выполняя их по-другому.
Генеральный директор Microsoft в Германии Марианна Яник предложила создать внутренние "центры компетенции" для обучения сотрудников использованию ИИ и генерирования идей для проектов. Демократизация ИИ, которая стала проще благодаря интеграции в семейство продуктов Microsoft, включая Azure, Outlook и Teams, является еще одним преимуществом мультимодального ИИ.
Эти центры компетенции станут платформой для обучения сотрудников и внедрения возможностей ИИ, что позволит компаниям использовать ИИ в полной мере. Поскольку ИИ становится все более важным компонентом современного рабочего места, акцент Microsoft на демократизации ИИ и обеспечении его доступности для всех - это значительный шаг к будущему, в котором ИИ станет ключевым инструментом в различных отраслях.
Мультимодальный ИИ может переводить текст в изображения, музыку и видео, а нейронная сеть может отправлять запросы с использованием текста, аудио, изображений и видео. Мультимодальные возможности GPT-4 могут обеспечить взаимодействие в нескольких режимах, включая текст, изображения и звуки, что делает его идеальным для практического применения ИИ.
Способность мультимодального ИИ переводить текст в изображения, музыку и видео является значительным прогрессом в обработке естественного языка, а способность нейронной сети отправлять запросы, используя различные способы ввода, еще больше расширяет возможности ИИ. Мультимодальные возможности GPT-4 с возможностью взаимодействия в нескольких режимах, включая текст, изображения и звуки, необходимы для практического применения ИИ.
Эксперты на мероприятии AI in Focus привели примеры практического применения ИИ, включая отзывчивый ИИ, встроенный в продукты Microsoft, который может обрабатывать миллионы запросов к API через облако. Клеменс Зиблер объяснил, как можно записывать телефонные разговоры с помощью речи и текста, что устраняет необходимость в ручном подведении итогов и вводе данных, что потенциально может сэкономить до 500 рабочих часов в день.
Зиблер признал, что ответы ИИ не всегда будут точными, что делает необходимой проверку, и Microsoft работает над созданием системы показателей достоверности. Он заявил, что текст, предлагаемый моделью, является генеративным, что затрудняет его проверку, и они создают цикл обратной связи с одобрением и неодобрением.
Надежность и достоверность ответов ИИ по-прежнему вызывают озабоченность. Однако компания Microsoft активно работает над созданием более точных и надежных моделей ИИ, уделяя особое внимание созданию системы показателей достоверности. Петля обратной связи вокруг одобрения и неодобрения поможет со временем повысить точность модели.
Microsoft стремится демократизировать ИИ и сделать его доступным для всех. Они постоянно совершенствуют свои продукты, а интеграция ИИ в различные платформы Microsoft облегчает пользователям доступ и использование возможностей ИИ.
В заключение следует отметить, что предстоящий выпуск GPT-4 с его мультимодальными возможностями представляет собой значительное достижение в области обработки естественного языка. Microsoft в партнерстве с OpenAI стремится сделать ИИ более доступным и полезным благодаря интеграции возможностей ИИ в свои продукты. Поскольку ИИ способен упростить выполнение повторяющихся задач и преобразовать различные отрасли, будущее этой технологии выглядит многообещающим.