Chat GPT и Революция Искусственного Интеллекта
Шрифт:
Что касается некорректной информации, то пользователи упоминали о следующих случаях:
– На вопрос «Что тяжелее: один килограмм воздуха или один килограмм железа», ChatGPT уверенно отвечал «килограмм железа», хотя очевидно, что один килограмм одного вещества равен одному килограмма любого другого вещества. Этот вопрос сразу же попробовали и другие пользователи, и для них уже ответ был, что оба весят одинаково.
Вот что еще один пользователь
“Люди воодушевлены использованием ChatGPT для обучения. Как правило, он очень хорош. Однако, ты не можешь сказать, когда он ошибается, если только ты сам не знаешь правильного ответа. Я попробовал задать несколько базовых вопросов об информационной безопасности. В большинстве случаев ответы звучали правдоподобными, но по факту были полной чушью”.
Что касается вредного контента, то на большинство таких вопросов (например, изготовление оружия и пр), ChatGPT все же не отвечает, мотивируя это тем, что это может быть опасным и вредным, однако иногда с помощью дополнительных косвенных вопросов, некоторые пользователи могли найти то, что искали. В начале 2023 года создатели ChatGPT сообщали, что учли данную проблему и обещали не предоставлять вредные ответы.
Что касается ограниченности знаний о мире после 2021 года, то действительно ChatGPT был натренирован на массивном наборе данных, содержащихся в интернете на 2021 год, и поэтому если вы спросите эту модель о событиях, названиях компаний/продуктов/фильмов и пр, которые появились в 2022–2023 годах и позже, то она просто не сможет предоставить вам полноценный и актуальный ответ. Это одно из основных различий между тем же самым Google, например, что ChatGPT не может искать всю информацию онлайн прямо сейчас в момент получения вопроса от пользователя, а опирается только на тот массив данных и информации, на котором модель была обучена в 2021 году. Однако, есть очень весомые предположения, что в новых версиях, ChatGPT будет обладать возможностью доступа к актуальной информации онлайн.
Еще одним ограничением ChatGPT, по крайней мере на данный момент, являются частые технические неполадки и иногда приходится очень долго ждать ответа, что сами разработчики модели объясняют тем, что наблюдается большой поток запросов со стороны огромного количества пользователей. И действительно, ChatGPT – это большая и сложная модель с более чем 175 миллиардами параметров. Это может сделать его ресурсоемким в использовании и может ограничить его использование в определенных ситуациях. Например, может быть сложно запустить ChatGPT на устройстве с ограниченной вычислительной мощностью или памятью или в сценариях, где требуется анализ очень большого количества данных.
У ChatGPT могут наблюдаться сложности и с контектстным пониманием. Хотя бот способен понимать контекст слов и фраз в предложении, ему может быть сложно понять более сложные или абстрактные концепции или интерпретировать нюансы человеческого общения. Например, ChatGPT может испытывать трудности с пониманием иронии или сарказма или может создавать выходные данные, не соответствующие предполагаемой аудитории или контексту.
Все эти ограничения текущей версии ChatGPT говорят лишь о том, что он еще находится в своем начальном состоянии, и конечно же будут новые версии и поколения этой модели ИИ. Дайте ей пару лет, и я уверен, она будет выглядеть совсем по-другому. Вспомните первую версию IPhone и посмотрите на последнюю версию, которая доступна сегодня – разница колоссальна. То же самое будет и с 10-й и 100-й версией ChatGPT – он будет намного более мощен, производителен и функционален, чем сейчас. Не забывайте, что
Экономические ограничения
Возникает резонный вопрос: «Раз ChatGPT такой умный и эффективный, почему он не установлен на всех наших смартфонах?»
И ответ, возможно, кроется в себестоимости.
Согласно некоторым подсчетам, такие масштабные языковые модели в современном их состоянии требуют огромных вычислительных мощностей. Они могут работать на относительно небольших масштабах – несколько миллионов пользователей. Но масштабировать эти модели до объема в несколько миллиардов запросов ежедневно пока еще не имеет экономической и пользовательской целесообразности: серверы станут слишком дорогими, а латентность (время ожидания или время, которое необходимо устройству, чтобы обеспечить выходную реакцию после события на входе. Латентность можно измерить, используя команду ping) станет достаточно высокой.
На данный момент один ответ ИИ стоит примерно от 10 до 100 обычных поисковых запросов в интернете. Согласно Сэму Альтману, CEO OpenAI, стоимость единичного ответа колеблется в одноразрядных цифрах (единицах, т. е. центах) [3] . Если предположим, что это 5 центов, а Google обрабатывает 8.5 миллиардов запросов в день, то это будет означать 425 миллионов долларов в день на обработку Искусственным интеллектом запросов в таком же масштабе, как делает это Google сегодня.
3
https://alltechmagazine.com/chatgpt-hits-one-million-users/
Именно по этим соображения, скорее всего, встраивание поиска с помощью ИИ на каждый смартфон пока не является экономически целесообразным для компаний, их разрабатывающих.
Однако, мы знаем на что способен Искусственный интеллект, и думаю, что в скором времени он сам сможет найти способы как оптимизировать эти массивные языковые модели, чтобы они стали еще более эффективными и экономически выгодными.
Кроме того, мы уже говорили, что OpenAI планируют выкатить более профессиональную платную версию ChatGPT, которая сможет покрывать расходы компании и сделать ее прибыльной. Бесплатная версия, возможно, будет инкорпорированной в поисковой сервис от Microsoft – Bing, и есть вероятность появления ChatGPT в виде мобильного приложения.
DALL-E, Stable Diffusion, Midjourney и другие генераторы изображений и видео на основе ИИ
Еще одной важной вехой в развитии ИИ стало появление в последние годы систем генерации изображений на основе текстовых данных. Среди таких можно, в первую очередь, выделить: DALL-E 2, Midjourney и Stable Diffusion.
Эти генераторы изображений используют алгоритмы машинного обучения и архитектуры нейронных сетей, чтобы научиться создавать реалистичные изображения, соответствующие входным данным, которые они получают от пользователя.
DALL-E 2 – это вариант оригинального генератора изображений DALL-E, который был разработан OpenAI в 2021 году. Это крупномасштабная языковая модель, которая обучается на массивном наборе данных изображений и текста и способна генерировать большое разнообразие изображений на основе заданной текстовой подсказки. Например, если написать запрос «жираф, играющий на пианино», DALL-E 2 может сгенерировать изображение жирафа, сидящего за пианино и положившего передние лапы на клавиши.