Могат ли чатботовете да станат съзнателни като хората?
разни / / October 31, 2023
Две противоположни теории се опитват да отговорят на този въпрос.
Кристоф Кох
Американски невролог, директор на Института за изследване на мозъка Алън.
Въпросите за това какво е субективно преживяване, кой го има и как е свързано с физическия свят около нас са преследвали умовете на философите през по-голямата част от човешката история. Въпреки това, научни теории за съзнанието, които могат да бъдат количествено измерими и емпирично тествани, се появиха едва през последните няколко десетилетия.
Много съвременни теории за съзнанието се фокусират върху следите, оставени от фините клетъчни мрежи на мозъка, от които възниква съзнанието. Днес две от тях доминират: теорията на интегрираната информация и теорията на невронното глобално работно пространство.
Преди двадесет и пет години имахме спор с австралийския философ Дейвид Чалмърс. Обещах му каса добро вино, ако тези невронни следи, технически наречени невронни корелати на съзнанието, бъдат открити и ясно описани до юни 2023 г.
Въпреки това, противоречието между теорията на интегрираната информация и теорията за невронното глобално работно пространство остава неразрешено. Това се дължи на частично смесени доказателства за това кои области на мозъка са отговорни за зрителното преживяване и субективно възприемане на лица или предмети, въпреки че значението на префронталния кортекс за съзнателното преживяване е опровергани. Така че загубих облога и изпратих виното на Чалмърс.
И двете доминиращи теории са създадени, за да обяснят връзката между съзнанието и невронната активност при хората и свързаните с тях животни като маймуни и мишки. И двете теории правят фундаментално различни предположения за субективния опит и стигат до противоположни заключения относно съзнанието в изкуствените артефакти. Степента, до която тези теории са емпирично потвърдени или опровергани по отношение на съзнанието, вкоренено в мозък, има важно значение за отговора на неразрешения въпрос на нашето време: могат ли машините да спечелят съзнание?
Какво представляват чатботовете от ново поколение?
Преди да обсъдим това, позволете ми да ви въведа в контекста и да сравня техника, която е съзнателна, с техника, която проявява само интелигентно поведение. Компютърните инженери се стремят да дадат на машините изключително гъвкавия интелект, който някога е позволявал човек напуснете Африка и населете цялата планета. Това се нарича изкуствен общ интелект (AGI).
Мнозина твърдят, че AGI е далечна перспектива. Удивителният напредък, постигнат в областта на изкуствения интелект през последната година, изненада целия свят, включително експертите. С появата на красноречиви разговорни софтуерни приложения, разговорно наричани чатботове, от езотерична тема, обсъждани от феновете на научната фантастика и елита на ИТ индустрията от Силициевата долина, дискусиите за AGI се превърнаха в дискусия за което отразява широко разпространеното обществено недоволство относно екзистенциалния риск за нашия начин на живот и нашите мил.
Чатботовете се основават на огромни езикови модели. Най-известните от тях са поредица от ботове, наречени генеративни предварително обучени трансформатори или GPT. Те са създадени от OpenAI в Сан Франциско. Като се има предвид гъвкавостта, грамотността и компетентността на най-новата версия, GPT-4, е лесно да се повярва, че тя притежава интелигентност и индивидуалност. Дори нейните странни проблеми, известни като "халюцинации", се вписват в тази теория.
GPT-4 и неговите конкуренти, като LaMDA и Bard на Google, са обучени на библиотеки от дигитализирани книги и милиарди публично достъпни уеб страници. Гениалността на езиковия модел е, че той се учи без надзор, обработва дума по дума и се опитва да предвиди липсващия израз. Тя прави това отново и отново, милиарди пъти, без външна намеса.
След като моделът придобие знания чрез поглъщане на цифровизираните записи на човечеството, потребителят показва непознато изречение - едно или повече. Моделът предвижда най-вероятната първа дума, след това следващата и т.н. Този прост принцип показа невероятни резултати на английски, немски, китайски, хинди, корейски и други езици, включително различни езици за програмиране.
Каква е разликата между интелект и съзнание
Важно е, че основополагащото есе за изкуствения интелект, „Компютри и интелект“, написано от Алън Тюринг през 1950 г. избягва въпроса "Могат ли машините да мислят?", т.е. въпроса дали имат съзнание. Тюринг предложи „играта на имитация“: може ли наблюдателят обективно да различи изхода, отпечатан от човек, от изхода, отпечатан от машина, ако самоличността и на двамата е скрита.
Днес това е известно като теста на Тюринг и чатботовете са много добри в него, въпреки че умело го отричат, ако ги попитате директно. Стратегията на Тюринг започна десетилетия на неумолим прогрес, който доведе до създаването на GPT, но пренебрегна проблема.
Имплицитно в дебата за чатботовете е предположението, че изкуственият интелект е същото като изкуственото съзнание, че да си умен е същото като да си съзнателен. И въпреки че при хората и другите развити организми интелигентността и съзнанието са свързани, те не е задължително винаги да се придружават.
Интелигентността е да мислиш и да се учиш да действаш и от действията на себе си и на другите, за да прогнозираш по-точно бъдещето и да се подготвиш по-добре за него. Няма значение дали това означава следващите няколко секунди („О, тази кола бърза към мен“) или следващите няколко години („Трябва да се науча как да кодирам“). Интелигентността в крайна сметка е свързана с действие.
Съзнанието, от друга страна, е свързано със състояния на съществуване - виждане на синьо небе, чуване на пеене на птици, чувство на болка, любовници. Няма никакво значение дали изкуственият интелект, който е извън контрол, усеща нещо. Всичко, което има значение, е, че той има цел, която не е свързана с дългосрочното благополучие на човечеството. И няма значение дали той знае или не какво се опитва да направи, което хората наричат самосъзнание. Той „безсмислено“ ще преследва целта си. Така че, поне концептуално, дори да изградим AGI, това няма да ни каже много за това дали усеща нещо.
Като знаем всичко това, нека се върнем към първоначалния въпрос как технологията може да стане съзнателна. Да започнем с първата от двете теории.
Какво обяснение предлага теорията на интегрираната информация?
Тя започва с артикулирането на пет аксиоматични свойства на всяко мислимо субективно преживяване. И след това задава въпроса от какво се нуждае една невронна верига, за да реализира тези пет свойства, включвайки някои неврони и изключвайки други. Или, с други думи, какво му трябва на един компютърен чип, за да включи едни транзистори и да изключи други.
Причинно-следствени взаимодействия в дадена верига в определено състояние или факта, че две активни неврон може да включи или изключи друг неврон, в зависимост от обстоятелствата, може да бъде разгърнат в многоизмерна причинно-следствена структура. То е идентично с качеството на преживяването - как се преживява, като например как се преживяват времето и пространството или как се възприемат цветовете.
Опитът също има количество, свързано с него - неговата интегрирана информация. Само верига с максимум ненулева интегрирана информация съществува като цяло и има съзнание. Колкото повече информация е интегрирана, толкова повече веригата не може да бъде намалена и толкова по-малко може да се счита просто за суперпозиция на независими подвериги.
Теорията на интегрираната информация подчертава богатия характер на човешкия опит. Просто се огледайте и пред вас ще се появи зашеметяващият видим свят с неговите безброй различия и връзки. Или погледнете картина на Питер Брьогел Стария, фламандски художник от 16-ти век, който изобразява религиозни теми и сцени от селския живот.
Всяка система, която има същите вътрешни връзки и причинно-следствени сили като човешкия мозък, по принцип ще бъде съзнателна като човешкия ум. Такава система обаче не може да бъде моделирана. Той трябва да бъде проектиран или изграден по образа на мозъка. Съвременните цифрови компютри се основават на изключително слабо свързване (изходът на един транзистор, свързан към входа на няколко транзистора) в сравнение с централната нервна система (невронът на кортикалната колона получава входни данни и произвежда изходни данни на десетки хиляди други неврони).
По този начин съвременните компютри, включително облачните компютри, няма да знаят нищо, въпреки че с течение на времето ще могат да правят всичко, което могат да правят хората. От тази гледна точка ChatGPT никога няма да се почувства специален. Имайте предвид, че това твърдение няма нищо общо с общия брой компоненти, независимо дали са неврони или транзистори, а по-скоро как са свързани. Това е взаимосвързаността, която определя цялостната сложност на веригата и броя на нейните възможни конфигурации.
Какво обяснение предлага теорията за невронното глобално работно пространство?
Идва от психологическото разбиране, че интелигентност като театър, където актьорите играят на малка осветена сцена, което е съзнание. Действията на актьорите се наблюдават от публика от процесори, които седят зад сцената в тъмното.
Сцената е централното работно пространство на ума, което има малък капацитет на паметта за представяне на едно възприятие, мисъл или памет. Различни модули за обработка - зрение, слух, двигателни умения на очите и крайниците, планиране, преценка, разбиране на езика и говорене - се конкурират за достъп до това централно работно пространство. Победителят измества старото съдържание, което става несъзнателно.
Според теорията за невронното глобално работно пространство, метафоричната сцена, заедно с модулите за обработка, е картографирана в архитектурата на неокортекса. Работното пространство е мрежа от кортикални неврони в предната част на мозъка с проекции на дълги разстояния към подобни неврони, разпределени в неокортекса в префронталната, париетотемпоралната и зъбната кора асоциативна кора.
Когато активността в сензорния кортекс надхвърли определен праг, в кортикалните области се задейства глобално събитие и в резултат на това информацията се предава към цялото работно пространство. Глобалното разпространение на информацията я прави осъзната. Данните, които не се предават по този начин, като точната позиция на очите или синтактичните правила за изграждане на грамотни изречения, могат да повлияят на поведението, но не съзнателно.
От гледна точка на теорията за невронното глобално работно пространство опитът е много ограничен, подобно на мисълта и абстрактно - подобно на оскъдното описание, което може да се намери в музей под картина на Брьогел: „Сцена в на закрито. Селяни във възрожденско облекло пият и ядат на сватба."
В разбирането на съзнанието от гледна точка на интегрираната теория на информацията, художникът брилянтно предава феноменологията на околния свят върху двуизмерно платно. В разбирането на теорията за невронното глобално работно пространство, това очевидно богатство е илюзия, призрак. И всичко, което обективно може да се каже за него, е посочено в краткото описание.
Теорията за невронното глобално работно пространство напълно отчита митовете на нашата компютърна ера, според които всичко може да се сведе до изчисления. Подходящо програмирани компютърни симулации на мозъка, с огромна обратна връзка и нещо като централно работно пространство, съзнателно ще възприемат света. Може би не сега, но съвсем скоро.
Каква е непреодолимата разлика между теориите?
В общи линии дискусията е следната. Според теорията за невронното глобално работно пространство и други теории на изчислителния функционализъм (те разглеждайте съзнанието като форма на изчисление), съзнанието не е нищо повече от набор от интелигентни алгоритми, работещи на машина Тюринг. Функциите са важни за съзнанието мозък, а не неговите причинно-следствени свойства. Ако някаква усъвършенствана версия на GPT приеме и произвежда същите входни и изходни модели като хората, тогава всички наши присъщи свойства ще бъдат прехвърлени към технологията. Включително нашето ценно съкровище - субективното преживяване.
Обратно, за теорията на интегрираната информация сърцето на съзнанието е вътрешната причинна сила, а не изчислението. Не е нещо ефирно или неосезаемо. То е специфично и функционално определено от степента, в която миналото на системата определя нейното настояще (силата на причината) и от степента, в която настоящето определя нейното бъдеще (силата на следствието). И тук е проблемът: самата причинно-следствена връзка, способността да се принуди система да извърши определено действие, а не много алтернативни, не могат да бъдат моделирани. Нито сега, нито в бъдещето. Това трябва да бъде вградено в системата.
Помислете за компютърен код, който моделира уравненията на полето на общата теория на относителността на Айнщайн, които свързват масата с кривината на пространство-времето. Софтуерът точно моделира супермасива Черна дупка, който се намира в центъра на нашата галактика. Тази дупка упражнява толкова силно гравитационно влияние върху заобикалящата я среда, че нищо, дори светлината, не може да избегне нейното привличане.
Въпреки това астрофизик, който симулира черна дупка, няма да бъде засмукан в лаптоп от симулираното гравитационно поле. Това на пръв поглед абсурдно наблюдение подчертава разликата между модела и реалността: ако моделът е напълно съответства на реалността, пространството и времето трябва да бъдат изкривени около лаптопа, създавайки черна дупка, която поглъща всичко наоколо.
Разбира се, гравитацията не е изчисление. Той има причинна сила, която му позволява да деформира тъканта на пространство-времето и да привлича всичко, което има маса. Симулирането на причинно-следствените сили на черна дупка изисква истински свръхтежък обект, а не само компютърен код. Причинната сила не може да се моделира, тя трябва да бъде създадена. Разликата между реалност и модел се крие в техните причинно-следствени сили.
Ето защо не вали в компютър, симулиращ дъждовна буря. Софтуерът е функционално идентичен с времето, но му липсва причинно-следствената сила да изпуска пара и да я превръща във водни капчици. В системата трябва да бъде вградена причинно-следствената сила, способността сам да създаваш или приемаш промяна. Възможно е.
Така нареченият невроморфен или бионичен компютър може да бъде съзнателен като човек. Но това не е така със стандартната фон Нойман архитектура, която е в основата на всички съвременни компютри. Малки прототипи на невроморфни компютри са създадени в лаборатории, като второто поколение невроморфен чип Loihi 2 на Intel. Но машина, достатъчно сложна, за да произведе нещо, наподобяващо човешко съзнание или поне съзнанието на плодова мушица, все още е амбициозна мечта за далечното бъдеще.
Обърнете внимание, че тази непримирима разлика между функционалистките и каузалните теории няма нищо общо нито с естествения, нито с изкуствения интелект. Както казах преди, интелигентността е поведение. Всичко, което човешката изобретателност може да произведе, включително такива велики романи като Притчата за сеяча на Октавия Бътлър и Война и мир на Лео Толстой, могат да възпроизвеждат алгоритмичен интелект, ако им се даде достатъчно материал за обучение. Появата на AGI е цел, постижима в не много далечно бъдеще.
Дебатът не е за изкуствения интелект, а за изкуственото съзнание. И този дебат не може да бъде разрешен чрез създаване на по-големи езикови модели или по-напреднали алгоритми за невронни мрежи. За да отговорим на този въпрос, трябва да разберем единствената субективност, в която сме абсолютно сигурни: нашата собствена. След като имаме ясно обяснение на човешкия съзнание и неговите невронни основи, ние ще можем да разширим нашето разбиране към интелигентните технологии по последователен, научно обоснован начин.
Тази дискусия няма голямо значение за това как чатботовете ще бъдат възприемани от обществото като цяло. Техните езикови умения, база от знания и социален чар скоро ще станат безупречни. Те ще бъдат надарени с перфектна памет, компетентност, уравновесеност, разсъждение и интелигентност. Някои дори твърдят, че тези творения на голяма технология ще бъдат следващата стъпка в еволюцията, "свръхчовекът" на Ницше. Имам по-мрачна гледна точка и вярвам, че такива хора бъркат упадъка на нашия вид със зората.
За много, а може би и повечето, хора във все по-атомизирано общество, откъснато от природата и организирани около социалните мрежи, ще бъде емоционално трудно да се устои на живеещите в тях технологии телефони. И в различни ситуации, обикновени и по-сериозни, хората ще се държат така, сякаш чат ботовете имат съзнание, те наистина могат влюбен, страдание, надежда и страх, дори и да не са нищо повече от сложни справочни таблици. Те ще станат незаменими за нас, може би дори по-важни от истински интелигентните същества. Въпреки че чатботовете усещат колкото телевизор или тостер - нищо.
Какво още да прочетете по темата🤖
- 6 причини, поради които не трябва да се доверявате сляпо на изкуствения интелект
- Защо не трябва да се страхуваме, че новите технологии ще заемат работата ни
- Технологична уникалност: вярно ли е, че технологията скоро ще излезе извън нашия контрол?
- 8 мита за изкуствения интелект, в които вярват дори програмистите