Aug 05, 2023
5 способов GPT
Новая модель искусственного интеллекта OpenAI GPT-4 дебютировала и уже работает
Новая модель искусственного интеллекта OpenAI GPT-4 дебютировала и уже используется во всем: от виртуального волонтера для слабовидящих до улучшенного бота для изучения языка в Duolingo. Но что отличает GPT-4 от предыдущих версий, таких как ChatGPT и GPT-3.5? Вот пять самых больших различий между этими популярными системами.
Но во-первых, что такое имя? Хотя изначально ChatGPT описывался как GPT-3.5 (и, следовательно, на несколько итераций выше GPT-3), он сам по себе не является версией большой языковой модели OpenAI, а скорее интерфейсом на основе чата для любой модели, на которой он основан. Система ChatGPT, популярность которой резко возросла за последние несколько месяцев, была способом взаимодействия с GPT-3.5, а теперь это способ взаимодействия с GPT-4.
С учетом вышесказанного, давайте рассмотрим различия между чат-ботом, которого вы знаете и любите, и его недавно дополненным преемником.
Наиболее заметным изменением в этой универсальной системе машинного обучения является то, что она является «мультимодальной», то есть может понимать более чем одну «модальность» информации. ChatGPT и GPT-3 были ограничены текстом: они могли читать и писать, но на этом все (хотя для многих приложений этого более чем достаточно).
Однако GPT-4 может передавать изображения и обрабатывать их для поиска соответствующей информации. Конечно, вы могли бы просто попросить его описать то, что изображено на картинке, но, что более важно, его понимание выходит за рамки этого. Пример, предоставленный OpenAI, на самом деле объясняет шутку на изображении забавно большого разъема для iPhone, но партнерство с Be My Eyes, приложением, используемым слепыми и слабовидящими людьми, чтобы добровольцы могли описать то, что видит их телефон, является более интересным. показательно.
Кредиты изображений:Будь моими глазами
В видеоролике Be My Eyes GPT-4 описывает узор на платье, определяет растение, объясняет, как добраться до определенного тренажера в спортзале, переводит этикетку (и предлагает рецепт), читает карту и выполняет ряд других задач, которые показывают, что он действительно получает то, что изображено на изображении, — если ему задаются правильные вопросы. Он знает, как выглядит платье, но может не знать, подойдет ли он для вашего собеседования.
Новые возможности GPT-4 позволяют создать «виртуального волонтера» для слабовидящих
Несмотря на все, что сегодняшние чат-боты делают правильно, их, как правило, легко сбить с пути. Небольшие уговоры могут убедить их, что они просто объясняют, что будет делать «плохой ИИ», или какую-то другую небольшую выдумку, которая позволяет модели говорить всевозможные странные и откровенно нервирующие вещи. Люди даже совместно работают над подсказками о «побеге из тюрьмы», которые быстро позволяют ChatGPT и другим пользователям выйти из-под контроля.
GPT-4, с другой стороны, был обучен множеству вредоносных подсказок, которые пользователи услужливо давали OpenAI за последние год или два. Учитывая это, новая модель намного лучше своих предшественников по «актуальности, управляемости и отказу от выхода за пределы ограждения».
По описанию OpenAI, GPT-3.5 (который использовался в ChatGPT) был «тестовым запуском» новой архитектуры обучения, и они применили извлеченные из нее уроки в новой версии, которая была «беспрецедентно стабильной». Они также смогли лучше предсказать его возможности, что привело к меньшему количеству сюрпризов.
Погуляйте и узнайте
Эти большие языковые модели обучаются на миллионах веб-страниц, книг и других текстовых данных, но когда они на самом деле разговаривают с пользователем, существует предел тому, как много они могут «держать в уме» ( сочувствуешь). Этот предел для GPT-3.5 и старой версии ChatGPT составлял 4096 «токенов», что составляет около 8000 слов или примерно четыре-пять страниц книги. Таким образом, он как бы терял из виду вещи после того, как они прошли так далеко «назад» в его функции внимания.
GPT-4 имеет максимальное количество токенов 32 768 — это 2^15, если вам интересно, почему это число выглядит знакомым. Это соответствует примерно 64 000 слов или 50 страницам текста, чего достаточно для целой пьесы или рассказа.
Это означает, что во время разговора или создания текста он сможет запомнить до 50 страниц или около того. Таким образом, он запомнит, о чем вы говорили на 20 страницах чата, или, при написании рассказа или эссе, он может ссылаться на события, произошедшие 35 страниц назад. Это очень приблизительное описание того, как работают механизм внимания и подсчет токенов, но основная идея заключается в расширении памяти и сопутствующих ей возможностях.