Байесовски

Поезията на реалността
Наука
Икона наука.svg
Трябва да знаем.
Ще разберем.
  • Биология
  • Химия
  • Физика
Изглед от
раменете на гиганти.

Байесовски се отнася до всеки метод за анализ, който разчита на уравнението на Bayes. Разработено от Томас Байес (починал 1761 г.), уравнението задава a вероятност до a хипотеза директно - за разлика от нормалния честотист статистически подход, който може да върне само вероятността за набор от данни (доказателства) дадена хипотеза.


За да се преведе вероятността за данните дадена хипотезаP (h | d) =  fracP (d  сума  граници_i P (dдо вероятността за хипотеза, като се имат предвид даннитеВдлъбнат изпъкнал.png, е необходимо да се използва предишна информация за вероятността и за справка. Байесовите подходи по същество се опитват да свържат известна информация за миналото с входящи доказателства за определяне на вероятности.

От наука има за цел да определи вероятността от хипотези, байесовите подходи към анализа предоставят връзка към това, което наистина искаме да знаем. Те също така помагат да се изяснят предположенията, които влизат в научните разсъждения и скептицизъм .


Съдържание

Байес и вероятност

Вероятност на хипотезата спрямо данните

Основният фокус на теорията на вероятностите е приписването на вероятност на дадено твърдение. Въпреки това, вероятностите не могат да бъдат зададени изолирано. Вероятностите винаги се присвояват спрямо някакво друго твърдение. Изречението „вероятността да спечелите от лотарията е 1 на 100 милиона“ всъщност е доста безсмислено изречение. Например, ако никога не купя лотарийни билети, вероятността ми е значително по-различна от тази, която купува 10 всяка седмица. Значително „изречение“ в теорията на вероятностите трябва да бъде изградено както с изявлението, на което се стремим да присвоим вероятност, така и с основната информация, използвана за присвояване на тази вероятност. Основната форма е „вероятността за х дадено Y. е с . ' Изчислението на вероятностите къса ръка за това изречение еСива квадратна оптична илюзия .PNG.

Когато търсим отговори на въпрос или разбиране за дадено явление, обикновено започваме с формирането на хипотеза; След това се събират данни, които се стремят да предоставят информация за реалността на тази хипотеза. В крайна сметка се стремим да знаем каква е вероятността хипотезата ни да е вярна? В този случай нашата основна информация е съответните данни, които сме събрали. Така че по вероятност говорим, ние се стремим да знаем каквоТриъгълник на Kanizsa.svgе равно на. В такъв случайзе нашата хипотеза идса нашите данни.

Нещата започват да се усложняват малко от тук. Нека си представим, че задаваме прост въпрос, като „дали тази монета е претеглена справедливо?“ Предполагаме, че ако е справедливо претеглено, обръщането трябва да доведе до равен брой глави и опашки. Обръщаме го 10 пъти и измисляме 6 глави и 4 опашки. С тази информация можем ли да отговорим на въпроса каквоNecker cube.svgравно на? Отговорът е, че не можем. Единственият въпрос, на който можем да отговорим, е каквое равно на.



Това е фин, но много важен момент. Като се има предвид само хипотеза и някои релевантни данни, ние можем само да отговорим колко вероятно е дадена нашата хипотеза, а не обратното. Тези две части информация не са равни. За да разберем защо, нека формираме някои вероятностни изречения с ежедневни понятия и да видим какво се случва, когато ги обърнем:


  • Вероятността да е облачно отвън, като се има предвид, че вали, не е равна на вероятността да вали, тъй като навън е облачно.
  • Вероятността някой да е пиян, ако е консумирал 10 бири, не е равна на вероятността някой да е консумирал 10 бири, като се има предвид, че е пиян.
  • Вероятността, че Антихрист идва, като се има предвид, че е в Библията, не е равна на вероятността Антихристът да е в Библията, като се има предвид, че той идва.

Така че като се има предвид товане е равно, какви видове отговори можем да получим? Това е класическият подход към статистиката, който започна да се нарича честотен подход.

Подходи на лекаря-често

Честотният подход е стандартният статистически модел, преподаван в повечето гимназии, колежи и програми за следдипломно обучение. Той се стреми да намери отговора на това, което P (д|з) равно на. Въз основа на нашия пример за преобръщане на монета, често попитаният често пита: ако някой направи цял набор от 10 обръщания, колко често бих получил разпределение от 6 глави и 4 опашки? Отговорът, разбира се, зависи от това дали монетата е справедливо претеглена или не. Често участникът ще попита колко вероятно е това разпространение да се появи, ако монетата се претегли справедливо и ако не се претегли справедливо. Тъй като справедливото претегляне означава, че резултатът от главите или опашките е по същество случаен, този въпрос може да се обобщи, за да се попита какво е разпределението, ако приемем, че резултатите ни са случайни. Това е известно като нулевата хипотеза и е „омнибус“ тест за статистици на честотата. Можете да вземете каквото и да е разпределение на данни и да попитате: какви са шансовете това разпространение на данни да се появи, при положение че е причинено произволно? Ако има голям шанс да се появи, тогава казваме, че се е появил като случаен. Ако има малък шанс да се появи, ние казваме, че нещо трябва да го причини. Обикновено се използва някакъв процент на прекъсване, като стандартът е 5 процента, което означава, че трябва да има по-малко от 1/20 шанс за формиране на дадено разпределение, приемайки случайна причина, преди да сме готови да кажем, че трябва да има неслучайна причина . Това се казва ' значение '.


Има много сложни статистически процедури, които могат да бъдат използвани за по-нататъшно диференциране на причините отвъд просто „случайни“ или „неслучайни“, но всички те почиват на една и съща основна идея за предоставяне на някакъв произволен статистически прекъсване, където предполагаме, че нещо е достатъчно малко вероятно да е нещо друго. Това обаче всъщност не е така. Както беше посочено по-рано, ние не можем да присвоим вероятност на нашата хипотеза. Ако нашите данни имат 1% шанс да се появят, ако причината е случайна, това е таканеозначава, че има само 1% шанс хипотезата, че причината ни е случайна, да е вярна или че има 99% вероятност данните ни да са причинени от нещо неслучайно. Честият подход, макар да предоставя ценна информация и да намеква за връзките между хипотезите, моженекажете ни вероятността хипотезата да е вярна.

За да разберем защо е така и да разберем как можем да направим това, трябва да се обърнем към байесовото заключение.

Уравнение на Байес

Генерирахме данните си, стартирахме всички статистически данни за тях и стигнахме до обнадеждаващи резултати, според които данните ни трябва да се показват само 1% от случаите, ако това е причинено на случаен принцип. Защо тогава не сме сигурни да предположим, че поне не е случайно причинено и че нашата хипотеза е по-вероятна от случаен случай? Отговорът на този въпрос е свързан с предишните вероятности за всяка хипотеза или на байесовски език просто „приоритети“. Нека илюстрираме това с малка история:

Вървите по пътя, когато чуете шепот по уличката, който ви призовава. Любопитно, влизаш. До стената стои непознат. Той ви казва, че може да предскаже всяка поредица от числа, които ще бъдат избрани от човек или машина. Това включва лотарийните номера тази вечер и той е повече от готов да ви каже какви ще бъдат те в замяна на $ 1000 в брой. Това със сигурност би било добра сделка ... ако неговата история е вярна. Вие обаче сте скептични към твърдението му по много очевидни причини и го молите да го докаже. Мъжът се съгласява и ви моли да изберете число между 1 и 5, вие го правите и секунди по-късно той ви казва точния номер, който сте избрали. Бихте ли предали хилядата долара сега? Повечето хора не биха, тъй като подобен подвиг не е толкова впечатляващ. Нека вместо това да кажем, че ви е казал да изберете число между 1 и 100 и точно го познах. Въпреки че това е по-интригуващо, вероятно не си струва $ 1000. Ами 1 на 1000, 1 на 100 000, 1 на 1 000 000, 1 на 100 000 000? В крайна сметка ще стигнем до момент, в който сме достатъчно убедени да предадем парите си.


Сега нека разгледаме различна история. Влизате в магазин за новости в местния мол и забелязвате пакет зарове, който ви казва, че всеки път тежат, за да хвърлят 6. Заинтригуван, отваряш пакет и хвърляш матрица. Разбира се, излиза 6. Готови ли сте да кажете, че тези зарове вероятно са претеглени? Може би ще хвърлите втори път, но колко хора ще останат неубедени след 2-ро или 3-то хвърляне? Не много.

Така че при първия сценарий повечето хора са готови да припишат на случаен шанс, когато вероятността е била само 1 на 100 или 1 на 1000, докато във втория шансът 1 на 6 или 1 на 36 беше всичко, за да убедят хората, че е не е случаен. Каква е разликата? Предварителната вероятност за всяка хипотеза е тази, която ги разделя. В този първи сценарий нищо няма смисъл. Всички знаят, че психическите способности никога не са били демонстрирани, защо този човек е в уличка и защо продава билет за лотария на стойност 100 милиона долара за 1000 долара? Разбира себиха могли, можеда е вярно, но шансовете са малки. Във втория сценарий се намирате в уважаван магазин, гледайки търговска стока с ясно етикетирана и професионална опаковка, така че вероятно ще ви каже истината за това, че сте претеглени.

Нека разделим това на нещо малко по-количествено измеримо. За аргумент, нека приемем, че шансът, който човекът в алеята казва истината, е 1 на 10 000 000. Какво е по-вероятно; шансът 1 на 10 000 000, че той казва истината, или шансът 1 на 100, че е отгатнал броя ви произволно? Във втория сценарий, да кажем, че шансът пакетът да лъже заровете е 1 на 100, така че шансовете, че лъже и сте хвърлили произволно 6 е 1 на 600, докато шансовете пакетът да казва истината е 99 / 100 (100 процента шанс да хвърлите 6). В този случай вероятността единична ролка от 6 с матрица в грешно етикетирана опаковка е далеч по-ниска от опаковката, която е етикетирана правилно.

Както се надяваме тези примери, единственият начин да се премине отда сее да се вземат предвид предишните ни убеждения относно вероятността за всяка хипотеза. Уравнението на Байес е уравнението, което се свързваи нашите приоритети и изчислява какворавно на. Уравнението е просто и се състои от три части, първата е приоритетите, за които току-що говорихме или, втората се нарича вероятностна вероятност, което е просто, а последната се нарича задна вероятност, която е. Тогава уравнението на Байес изглежда така:

Тъй като задната вероятност е свещеният Граал на повечето въпроси, зададени от човечеството, разбирането на уравнението на Байес и неговите части и как те са свързани помежду си може да ни каже много за оптималния начин за придобиване и тестване на знания за света.

Байес и науката

Наука се интересува предимно от сравняване на различни хипотези, за да определи кои са най-вероятните сред даден набор. Това означава, че с много редки изключения вероятността, която изследователите искат, е. По-голямата част от статистиката, използвана в съвременните публикации, се основава на честотните подходи, които могат само да се върнат. Тъй като честотните подходи не могат да ви кажат директно за вероятността от хипотеза, различни до това са направени опити за принуждаване на резултатите да съответстват на тази форма. Най-често използваното устройство е концепцията за статистическа значимост . Този подход приписва често произволно отрязване натакъв, че когато вероятността е под прага, тя е „значителна“ и подкрепя хипотезата, а когато е над прага, дадена хипотеза се отхвърля и случайният шанс се облагодетелства.

Въпреки че този подход е изключително популярен и доминира съвременните техники за отчитане в повечето рецензирани списания, той е изпълнен с проблеми (вижте: статистическа значимост за обсъждане на тези въпроси). Байесовите подходи предлагат решение на много от проблемите, изложени чрез честотните методи. Тъй като уравнението на Байес се върнадиректно няма нужда от произволни устройства като статистическа значимост. Поради тези причини има нарастваща група изследователи, които се застъпват за използването на байесова статистика при докладване на научни открития.

Байесовата статистика обаче не е без собствени проблеми. Най-изтъкнатият проблем обхваща изграждането на априори. Тъй като приоритетите са от основно значение за всеки байесов подход, те трябва да бъдат разгледани внимателно. Ако двама различни изследователи използваха два различни предишни, тогава резултатите от статистиката ще бъдат много различни. Тъй като задните вероятности от предишна работа могат да се използват като приоритетни за бъдещи тестове, реалният проблем се центрира около първоначалните предишни преди да е налице много информация. Някои смятат, че определянето на приоритетите е толкова произволно, че отрича всяка полза от използването на байесовски подходи. Ако няма информация на разположение при задаване на първоначални приоритети, повечето хора ще използват това, което се нарича унифициран предишен. Единният предшественик просто задава всички възможни хипотези на еднаква първоначална предишна вероятност. Друг подход е да се използва референтен априор, който често е сложно разпределение, създадено, за да се елиминира конкретно възможно най-голямата роля на априора при изчисляване на задна. Този метод обаче е критикуван като по същество елиминиращ всяка печалба от използването на байесов подход изобщо.

Байесово мислене и рационалният ум

В продължение на много години социалните науки използваха формулираната концепция, че хората са по своята същност рационален да ръководи прогнозни модели на социални, политически и икономически взаимодействия. Тази концепция често се обозначава Homo Economicus и е подложен на обстрел по безброй причини, не на последно място е, че хората изобщо не се държат рационално. Голяма част от доказателствата както в икономиката, така и в психологията са показали това, което изглежда последователно, неоптимално и ирационално разсъждение в лабораторните експерименти. Няколко от по-широко цитираните примери са:

Ко-вариационен анализ

Когато се опитвате да съберете информация за това дали две променливи корелират помежду си, има четири честоти, които могат да бъдат събрани:

  1. ДА СЕ присъства и Б. отсъства
  2. Б. присъства и ДА СЕ отсъства
  3. ДА СЕ присъства и Б. присъства
  4. ДА СЕ отсъства и Б. отсъства

Всеки от тях трябва априори носят една и съща тежест, когато оценяват корелацията, но хората ще придадат много по-голяма тежест на случая, когато и двамата присъстват, и най-малкото тегло на случая, когато и двамата отсъстват.

Друга свързана и класическа задача е задачата за подбор на Wason, при която субектите са помолени да проверят условна хипотеза 'ако p, тогава q'. Субектите обикновено се искат да обърнете карти, които се подчиняват на даденото правило . Например, хипотезата може да бъде „Ако от едната страна има гласна, тогава има четно число от другата страна“, тогава се показват четири карти, така че две карти показватстриКаквои две карти показватне стрине qнапример A, K, 2,7. При класическите разсъждения картите, които трябва да се обърнат, састрине q(A, 7), тъй като това са единствените, които могат да фалшифицират правилото. По-малко от десет процента от хората ще следват този модел и повечето вместо това ще се обърнатстриКаквокарти (A, 2). Това се разглежда като класическа ирационалност. Изненадващо, хората се справят много по-добре с тази задача, когато проблемът е формулиран по отношение на измама в социален обмен, напр. „Детето може да яде десерта само ако е яло вечерята“.

Ефекти на рамкиране

Описанията на събитията често могат да бъдат формулирани по повече от един логически еквивалентен начин, но често се разглеждат по различен начин. Един често срещан пример е докладването на статистически данни за оцеляването след диагностициране на заболяването. Хората ще се чувстват по-оптимистично, когато им кажат, че имат „75 процента шанс за оцеляване“, отколкото когато им кажат, че имат „25 процента шанс да умрат“. Тези твърдения са логически еквивалентни и не трябва да се позовават на различни отговори, но очевидно го правят. Това също е било оценявано многократно при рискови задачи, където на хората се казва, че имат „75 процента шанс да спечелят точки“ срещу „25 процента шанс да загубят точки“. Хората ще изберат задачата, изразена на положителен език и няма да я изберат, когато е изразена на отрицателен език.

Байес на помощ

Тези примери плюс други са използвани за аргументиране, че хората всъщност са ирационални актьори. Тези задачи обаче са доста измислени в лабораторните условия. Основната липсваща съставка във всичко това е, че хората не правят избор във вакуум. Предварителната информация и опит могат да променят кой избор е най-оптимален. Разсъжденията, които вземат предвид предишната информация, заедно с основната логическа информация и информация за вероятността, по своята същност са байесови. Създадоха се значителни доказателства в областта на когнитивната психология и неврологията, че хората използват байесовски подходи за оценка на своята среда и да правят прогнози. Това се случва както на ниско ниво в сензорната обработка, където моделите на изстрелване на неврони изглежда кодират разпределението на вероятностите и обработват изчисленията, така и на по-високо ниво на мислене при хората, които вземат изпълнителни решения. Когато се използват байесови подходи за анализ на горните задачи, се оказва, че хората се представят доста оптимално.

Изпълнението на темата в задачите за съвместно изменение и избора на задачи по-горе има много по-голям смисъл, когато смятате, че повечето условни хипотези са формулирани по-скоро за редките събития, отколкото за общите събития. Например, ако тестваме корелацията, че тютюнопушенето причинява рак, знаем, че тютюнопушенето е сравнително рядко и знаем, че ракът е сравнително рядък, тогава четирите типа честоти вече не трябва да бъдат еднакво претеглени. Тъй като има много хора, които не пушат и много, които нямат рак, намирането на някой, който не пуши и няма рак, ще се случи много по-често случайно, отколкото намирането на хора, които пушат и имат рак. Това е точно разпределението на тежестта, което виждаме в лабораторните тестове.

За ефектите на кадрирането е важно да осъзнаете, че информацията в реалния свят рядко се съобщава напълно точно. Социалните психолози са установили, че хората избират да формулират нещата по оптимистичен или песимистичен начин не случайно, а по предсказуем начин. Хората ще опишат чаша като „наполовина пълна“, ако е празна и са я гледали да се пълни наполовина, но я описват като „полупразна“, ако е пълна и е изпразнена наполовина. Следователно, вземайки предвид социалната информация и комуникацията като основна информация, байесовите разсъждения могат да третират на пръв поглед еквивалентни логически твърдения като действително предаващи различна информация. Още веднъж, така се държат хората в лабораторията.

Тогава доказателствата изглежда сочат към факта, че хората са разумни хора на Байес и могат да се представят далеч по-оптимално и рационално, отколкото обикновено им се отдава заслуга.

Байес и илюзии

В допълнение към доказателствата, че когнитивното функциониране от по-висок ред следва байесов подход, има много доказателства, че системите от по-нисък ред в подсъзнанието също използват аналогичен метод. Изглежда, че невроните кодират и анализират сензорна информация, използвайки модели на стрелба, за да формират вероятностни разпределения. Това означава, че както вероятността, така и приоритетите се изчисляват за всякакви стимули. Това може да помогне да се обяснят много интересни аспекти на когнитивната обработка. Един скорошен пример е този блок текст, който обикаля из интернет:

Aoccdrnig да rscheearch в Cmabrigde Uinervtisy, той не е mttaer в това, че или ltteers в китката са, olny iprmoatnt tihng е taht на frist и lsat ltteer да бъде в rghit pclae. Rset може да бъде toatl mses и можете да го посетите с porbelm. Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, но wrodhe като wlohe.

Способността да се чете този параграф толкова лесно може да се отдаде на байесовата природа на когнитивната обработка. Присъстващите букви, както и закрепването на първата и последната буква, осигуряват фураж за изчисляване на вероятността за дума. След като научихте приоритетите след излагане на много изречения през целия живот, е много лесно да реконструирате действителното значение, въпреки че входът е объркан. Байесов анализ на сензорния вход може също да е причина за много оптични илюзии. Един пример са илюзиите, които се основават на вдлъбната и изпъкнала. По-долу има две копия на едно и също изображение, завъртени на 180 градуса едно спрямо друго:

Промяната във вдлъбнатината се основава на предварително предположение, че източникът на светлина идва отгоре. Това е напълно разумно и рационално преди да се вгради в сензорната система и би работило при повечето условия. Но когато всъщност няма източник на светлина и разликата в нюансите на цветовете е реална, ума на Байес завършва с „грешната“ хипотеза и оттам илюзията. Приоритетът „светлина отгоре“ е един от най-специфичните байесови приоритети за оптични илюзии.

Друга много мощна илюзия, създадена от предположението за източник на светлина, е сенчестата илюзия на шахматната дъска на Adelson. Това изображение е показано по-долу. Погледнете отблизо маркираните квадрати ДА СЕ и Б. ; те всъщност са със същия нюанс на сивото.

Илюзията е причинена, защото различните квадрати наоколо ДА СЕ и Б. са засенчени, за да създадат образа на сянка. Предварителното предположение е, че разликата във възприеманото засенчване наистина се дължи на сянка, хвърлена от невидим източник на светлина. След това възприеманата яркост на квадратите се регулира в предположението за светлина и сянка.

Една от първите оптични илюзии, които трябва да бъдат преодолени в психологията, е известният гесталтов триъгълник, показан по-долу.

Хората са склонни да виждат триъгълник, който затваря останалите предмети, а не другите предмети, в които липсват тези парчета. Гещалт психолозите обясниха това като хора, които обработват обекти като цяло, а не на парчета. Предполага се, че има три сфери и тъмно облицован триъгълник. Тогава единственият начин да осмислим това изображение е да видим запушващ втори триъгълник. Знаейки, че сензорната система е байесова, тази илюзия може да бъде обяснена по-пълно. Кръг с липсващ сектор е много рядко явление. Приоритетът за всяка такава форма е, че това е цяла сфера или кръг. Освен това вероятността всички такива обекти с липсващи части случайно да се подредят, за да създадат формата на триъгълник, е много малка. Когато тези елементи се комбинират по байесовски начин, хипотезата с най-голяма вероятност е, че има запушващ триъгълник.

Понякога информацията, която връща байесов анализ, е двусмислена, с две или повече конкуриращи се хипотези с приблизително еднакви задни вероятности. В този случай, леки смущения в сензорния поток (случаен шум, леки промени в възприемащата среда и т.н.) ще накарат мозъка да превключва напред-назад между възприятията. Това вероятно е причината за изместването на възприеманата дълбочина на куба на Некер, показан по-долу.

Оптичните илюзии като куба на Некер, които разчитат на двусмислени задни вероятности, могат да бъдат силно чувствителни към предишни очаквания. Ако две хипотези за възприеманото изображение са равни при еднакви априори, тогава поставянето на една предишна по-висока от друга трябва да принуди илюзията поне първоначално да се появи в тази посока. Ето тест: това е изображение на заек .