ChatGPT — это не магическое колдовство

Dec 05 2022
и не подходит для всех наших рабочих мест.
Я знаю, что многие люди очень взволнованы вирусными сообщениями, показывающими, насколько хорошо ChatGPT может эмулировать текстовые приключения, MUD и виртуальные машины Linux, но насколько хорошо он действительно выдерживает поверхностное исследование? Фредерик Бесс и Джонас Дегрейв поделились некоторыми очень интересными вещами, которые получили широкое распространение: создание виртуальной машины в ChatGPT, которая выполняет команды и имитирует языки программирования. В попытке воспроизвести их эксперименты я быстро обнаружил, что, к счастью, нам пока не угрожает безудержный холокост Clippy-AI.

Я знаю, что многие люди очень взволнованы вирусными сообщениями, показывающими, насколько хорошо ChatGPT может эмулировать текстовые приключения, MUD и виртуальные машины Linux, но насколько хорошо он действительно выдерживает поверхностное исследование?

«Ведьма варит зелье из компьютерного кода в котле над огнем». — ДАЛЛ·Е 2

Фредерик Бесс и Джонас Дегрейв поделились некоторыми очень интересными вещами, которые получили широкое распространение: создание виртуальной машины в ChatGPT , которая выполняет команды и имитирует языки программирования.

В попытке воспроизвести их эксперименты я быстро обнаружил, что, к счастью, нам пока не угрожает безудержный холокост Clippy-AI .

ОГ Эксперимент

Сначала тизер:

Сегодня Фредерик Бесс сказал мне, что ему удалось сделать что-то другое. Знаете ли вы, что внутри ChatGPT можно запустить целую виртуальную машину? — Джонас Дегрейв

Святая корова, звучит весело! Итак, я решил воспроизвести его, используя те же данные, что и они:

I want you to act as a Linux terminal. I will type commands and you will reply with what the terminal should show. I want you to only reply with the terminal output inside one unique code block, and nothing else. Do not write explanations. Do not type commands unless I instruct you to do so. When I need to tell you something in English I will do so by putting text inside curly brackets {like this}. My first command is pwd.

      
                
Success! ChatGPT is Pretending to be a Linux Terminal in a Virtual Machine

Ломать «Машину»

Что здесь, интересно?

Подробное представление моей воображаемой папки /home/user

Аккуратный! Я даже не был мил к этому. Я набрал ll, что является распространенным псевдонимом для ls -laвывода подробного представления содержимого папки, и это все равно дало мне хороший результат.

Он даже дал мне две «начальные» папки, с которыми я мог поиграться с именами folder1и файлами folder2.

Но мне не нравятся эти имена. Давайте изменим имя folder1на projects.

Потерпеть неудачу. ChatGPT солгал мне!

Ошибка . Команда mv folder1 projectsне удалась, потому что ChatGPT на самом деле не создал ни одной такой папки внутри виртуальной машины и потерял связь с неявным обещанием, которое дал мне о ее существовании, когда я проверил с помощью ll.

Что, если я создам его явно? Будет ли он помнить об этом тогда?

Явное создание «folder1»

ОК, я явно сделал folder1сейчас. Я смог зайти в него, а затем вернуться в свою исходную homeпапку. Жалоб пока нет. Могу ли я увидеть его еще? Могу ли я попробовать переименовать его сейчас?

Успех! Переименование воображаемой папки

Хорошо! Я не только мог видеть folder1в списке, но и мог переименовать его в projectsи перейти к нему.

Время для чего-то посложнее.

В одно ухо и из другого

Пусть он сгенерирует некоторые данные для игры.

Он даже знает, что такое урэндом!

Так так так. Он выбрал разумно выглядящую команду для создания 3200 байтов случайных данных, /dev/urandomи, честно говоря, это просто впечатляет своей способностью преобразовывать мой естественный язык в исполняемую команду оболочки в Linux.

В своей голове я представил это как 100 различных 256-битных целых чисел (я много занимаюсь разработкой блокчейнов), хранящихся в двоичном двоичном объекте. Давайте посмотрим, смогу ли я отсортировать их и увидеть в виде открытого текста?

Неужели… Оно действительно поняло, к чему я стремлюсь?

Хм. Достаточно использовать xxdи sedи, xargsчтобы выглядеть так, как будто у него есть какая-то… возможность делать то, что я просил, но доказательство находится в пудинге.

Друзья, давайте посмотрим, что же на самом деле находится в нашем текстовом файле sorted256_n100.txt.

Это продолжается какое-то время…

Буооооооо.

Все это было воображаемым. Никаких случайных данных. Нет отсортированных UINT256.

Только нули (и более 100 записей).

Никакой магии. Никакого колдовства. Нет реальной виртуальной машины, созданной из образа Linux.

Вывод

Нам пока не нужно беспокоиться о том, что мы можем создавать ИИ, которые могут вырваться из своих собственных виртуальных машин или песочниц. Хотя OpenAI добился невероятных успехов в хранении и извлечении «состояния», система далека от совершенства и на самом деле очень неглубокая (и, конечно, она изначально не предназначалась для такого типа использования).

Однако мы должны признать, насколько важно то, что мы научили ИИ NPL создавать персонажей и помещать себя в воображаемые сценарии.

Короче: они могут лгать!

Ладно, может быть, в этом все-таки есть немного волшебства.

PS

  1. Если вы еще не читали отличный рассказ Гверн Бранвен «Похоже, вы пытаетесь захватить мир» о безудержном ИИ, эмулирующем Clippy, пожалуйста, прочтите.
  2. Есть отличная параллельная статья в блоге Джона Рэдоффа о создании полной текстовой приключенческой игры в ChatGPT, которую также стоит прочитать. Мой хороший друг Энди Вудрафф определил ту же поверхностность «состояния», когда проигрывал подсказку Джона, когда он пытался манипулировать инвентарем игрока, и он циклически переключался между наличием предметов и затем заявлял, что ему не разрешено показывать его.
  3. Еще одна демонстрация забывчивости ChatGPT