Основни констатации: Влияние на големите данни през 2020 г.

Респондентите & rsquo; мисли

Двойка напрежение върху бъдещето на големи данни

Един от основните признаци на освещаването на Големите данни като интересна тема с огромен потенциал се появи през март тази година, когато Националната научна фондация и Националните здравни институти обединиха усилията си & ldquo; за разработване на нови методи за извличане на знания от данните; изграждане на нова инфраструктура за управление, куриране и обслужване на данни на общности; и създават нови подходи за свързано образование и обучение, & rdquo; Директорът на NSF Субра Суреш обяви в писмо до изследователи в областта на инженерите, компютрите и информационните науки.6Той каза, че програмата & ldquo; има за цел да усъвършенства основните научни и технологични средства за управление, анализ, визуализация и извличане на информация от големи, разнообразни, разпределени и разнородни набори от данни, за да ускори напредъка в научните и инженерни изследвания. & Rdquo;


Усилията едва ли биха могли да започнат достатъчно скоро. Мнозина са развълнувани от перспективите за анализ на големи данни. Рик Смолан, създател на & ldquo; Ден в живота & rdquo; фотографична поредица, е в средата на проект, който той нарича & ldquo; Човешкото лице на големи данни, & rdquo; документиране на събирането и използването на данни. Той казва, че Big Data има потенциала да бъде & ldquo; таблото за управление на човечеството & rsquo; & rdquo; интелигентен инструмент, който може да помогне за борба с бедността, престъпността и замърсяването.7

И все пак има несигурност относно това колко ефективно ще бъде. Една от илюстрациите е неотдавнашно проучване на главни маркетингови директори в големи корпорации: 75% от анкетираните заявяват, че вярват, че използването на данни ще помогне на компаниите им драстично да подобрят бизнеса им, но повече от половината казват, че понастоящем не разполагат с инструменти за извличане на истински клиентски прозрения от данните, генерирани от цифрови и офлайн усилия.8В проучването 58% от анкетираните казват, че им липсват уменията и технологията за извършване на анализ на маркетингови данни, а над 70% казват, че не са в състояние да използват стойността на данните за клиентите.

В ежедневието вече има доказателства за използването на Big Data:


  • Всеки път, когато Google предлага промяна в правописа в заявка за търсене, това е, защото предишните заявки за една и съща тема са използвали различни изписвания, които са били по-полезни. Анализът на фирмата за трилиони заявки за търсене дава тези предложения за промяна на правописа.9Икономистът на Google Хал Вариан говори за способността на фирмата да открива тенденции от заявките за търсене, което й позволява да прогнозира икономически и обществени здравни тенденции.
  • Всеки път, когато някой получи обаждане от компания за кредитни / дебитни карти относно & ldquo; необичайна дейност & rdquo; на техните карти призивът пристига, защото фирмите бъркат чрез милиарди транзакции, търсейки аномалии в поведението на потребителите, които потенциално са свързани с измама или кражба на самоличност.10
  • През април Forbes проследи примери за операции с големи данни в добре познати фирми:единадесет& ldquo; Netflix например взема всички свои клиенти & rsquo; гледане на навици и рейтинги на филми и ги прекарва чрез сложен алгоритъм, за да генерира 5-звездна препоръчителна система, пригодена за всеки абонат. Amazon.com прави форма и на това. Сайтът за онлайн запознанства OKCupid генерира постоянен поток от често весели прозрения за съвременната романтика, като преглежда потребителските си профили в търсене на корелации. Приложение за iPhone, наречено Ness, използва вашата собствена социална мрежа и предпочитания, за да генерира персонализирана търсачка за ресторанти. & Rdquo;
  • & Ldquo; Целевият Снафу & rdquo; получи голямо внимание на конференция на O & rsquo; Reilly Strata за Big Data миналата пролет. Както Патрик Тъкър пише в блог от конференцията за обществото на бъдещето в света:Ню Йорк Таймссъобщи през февруари, че търговецът на дребно Target & ldquo; използва клиентски данни и прогнозни анализи, за да установи, че един от клиентите им е бременна, иоще по-забележително,в кой триместър е била. Те й изпратиха по имейл рекламни материали и бащата на момичето откри, че дъщеря му е бременна въз основа на купоните, които тя започна да получава от голям търговец на дребно, което без съмнение породи неловък разговор. & rdquo;12

Този нарастващ фокус върху големите данни ни подтикна да поставим два сценария, които да извлекат експертни мнения за това как нещата могат да се развият до 2020 година.

След като бяха помолени да изберат един от двата сценария за 2020 г., представени в този въпрос от анкетата, респондентите също бяха попитани, & ldquo; Какво въздействие ще имат големите данни през 2020 г.? Какви са положителните, отрицателните и нюансите на сивото в вероятното бъдеще, което очаквате? Как ще използваме анализа на промените в големите данни в света, ще променим начина на вземане на бизнес решения, ще променим начина, по който хората се разбират? & Rdquo;

Редица участници в анкетата поставиха под въпрос езика, използван за описване на сценария с положителен резултат. & ldquo; Мащабното увеличаване на обема и наличността на данни със сигурност ще подобри силата на аналитичните и прогнозни инструменти, но няма да има някакъв основен пробив към по-„познаваеми“ резултати, & rdquo; написа анонимен респондент. & ldquo; Наличието на повече данни не променя факта, че има твърде много взаимодействащи променливи, за да бъде възможно многозначително прогнозиране за много неща - напр. метеорологично време. Доколкото хората казват, че някои неща са по-предсказуеми от преди, те или лъжат, или използват магическо мислене. & Rdquo;



Друг писа, & ldquo; Като част от сектора за големи данни, имам само скромни очаквания за неговото положително въздействие. Има много малко доказателства, че има нарастваща практика на & lsquo; вземане на решения, основани на доказателства. & Rsquo; & rdquo; Обаче друг анонимен респондент не се съгласи, като каза: & ldquo; Тъй като все повече хора навлизат в дигиталната ера, ще има повече умове, работещи за подобряване на начина, по който хората общуват, курират информация и дори предсказват събития. Изучавайки как хората си взаимодействат въз основа на времето, деня, използването на езика и сравнявайки го с определени събития, не би било невъзможно да се каже, че може да има модели за идентифициране на бъдещи събития. Ако такъв процес на идентифициране на алгоритмични процеси не се случи до 2020 г., той ще бъде на път. & Rdquo;


Други насочиха своите прогнози към сценариите. Това, което следва, е подбор от стотиците писмени отговори на участниците в анкетата, споделени при отговора на този въпрос. Около половината от респондентите в експертното проучване избраха да останат анонимни, без да се почитат за забележките си. Тъй като опитът на хората е важен елемент от тяхното участие в разговора, официалният доклад включва предимно коментарите на онези, които са получили признание за казаното от тях. Пълният набор от експертни отговори, анонимни и не, могат да бъдат намерени онлайн на адрес http://www.imaginingtheInternet.org. Избраните твърдения, които следват тук, са групирани в заглавия, които посочват някои от основните теми, произтичащи от общите отговори.

До 2020 г. трябва да наблюдаваме напредък в използването на големи данни, за да подобрим разбирането си за себе си и света

Много от анкетираните са били сигурни, че анализът на големите данни ще е напреднал до точката през 2020 г., когато практически, ежедневни приложения от него ще се появят в хората & rsquo; s и организации & rsquo; живее и оказва помощ.


Брайън Трогдън, предприемач и семантичен уеб евангелист, каза, & ldquo; Big Data е новото масло. Компаниите, правителствата и организациите, които могат да добиват този ресурс, ще имат огромно предимство пред тези, които не го правят. Със скоростта, пъргавината и иновациите, определящи победителите и губещите, Big Data ни позволява да преминем от мисленето на „измери два пъти, намали веднъж“ към едно от „поставяй малки залагания бързо“ & rdquo;

Пол Джоунс, клиничен доцент в Университета на Северна Каролина-Чапъл Хил, казва, че през следващите няколко години ще се случи много еволюция. & ldquo; Очаквам злоупотреба и регулиране в отговор на тази злоупотреба в близко бъдеще, & rdquo; той написа. & ldquo; До 2020 г. поведението и действията около големите данни ще бъдат нормализирани и много по-малко страшни и хаотични. Наградите, които може да се извлекат от разбирането на света чрез Големите данни, са гигантски и способни да променят обществото към по-добро. & Rdquo;Рос Радър, член на борда на канадския орган за регистрация на интернет, се съгласи. & ldquo; Само до 2020 г. ще имаме достатъчно фундаментално разбиране, за да започнем наистина да правим страхотни неща с Big Data. Ще направим много грешки през следващите десет години, издържаме на прогнози за & lsquo; Смъртта на големите данни & rsquo; и бавно, но сигурно ще разработим инструментите и разбирането, необходими за превръщането на възхода на големите данни в положителна сила за промяна. & rdquo;

Кейс от кехлибар, Главен изпълнителен директор на Geoloqi, очаква положителен напредък. & ldquo; Когато данните не могат да говорят помежду си, времето и усилията се губят, & rdquo; - посочи тя. & ldquo; В много случаи използването на анализи е начин за разбиране на дългосрочните тенденции или идентифициране на възникващо поведение, което може да се превърне в дългосрочни проблеми. Както при всеки естествен процес, и тук ще има грешки и грешки, но ще има и големи ползи, една от които е намаляването на времето и пространството, необходими за извършване на работа или разбиране на процес. & Rdquo;

Продължаващото развитие на кода се разглежда като плюс.Лора Лий Дули, архитект за онлайн ангажираност и стратег на Световния институт за ресурси, написа, & ldquo; Надграждайки XML, ние ще подобрим и наложим метод за структурирано езиково етикетиране за събиране на данни, така че данните да могат да бъдат включени в наборите от данни по-лесно и безпроблемно. Това би позволило повече време за анализ, изисквайки по-малко време за форматиране и почистване на данни. Това също така ще позволи на изследователите бързо да отговорят на информационните нужди, като предоставят смесени данни, които могат да послужат за бързо вземане на решения. & Rdquo;


Дон Хаусрат, пенсиониран от Агенцията за информация на САЩ, вижда позитиви. & ldquo; Големите данни ще преобладават, & rdquo; той написа. & rdquo; Било то проектирането на военни стратегии от UNIVAC в Бетезда по време на войната във Виетнам, или проектирането на системата BART в Бъркли, игрите, използващи сложни набори от данни, са по-добри при идентифицирането на решения. Всъщност използването на нетрадиционен статистически анализ в системата BART допринесе за спечелването на Нобелова награда за икономика на един от консултантите. Абсолютно невярно е, че големите данни ще намалят живота ни. Използването на съвременния статистически анализ е такова, че нюансираните резултати са не само възможни, но и рутинни. & Rdquo;

& ldquo; Повече информация ще бъде от полза по всякакви начини, които дори не можем да разберем в момента, а именно защото нямаме данни, & rdquo; казахДжон Капоне, писател и журналист на свободна практика, бивш редактор на публикации MediaPost Communications.

Анонимен респондент каза: & ldquo; Време е да прегърнем нещо, което е по-голямо от мозъка ни, но също така да използваме мозъка си за управление на входа и контрол на анализа. Печеливша. Ние мислим по-усърдно и ставаме по-умни. & Rdquo;

Някои респонденти споделят своя ентусиазъм относно ползите от данните в реално време.Вариантно нещо, главен икономист в Google отбеляза, & ldquo; Аз & rsquo; съм голям вярващ в сегашното предаване. Почти всяка голяма компания има склад за данни в реално време и разполага с по-навременни данни за икономиката от нашите държавни агенции. През следващото десетилетие ще видим публично / частно партньорство, което позволява на правителството да се възползва от някои от тези хранилища за данни от частния сектор. Това вероятно ще доведе до по-добре информирана, по-активна фискална и парична политика. & Rdquo;

Джина Маранто, съдиректор по екосистемна наука и политика в Университета в Маями, каза, & ldquo; Вярвам, с Ханс Рослинг, че колкото повече данни анализираме, толкова по-добре ще бъдем. Глобалното изменение на климата ще наложи да продължим в тази посока на сегашното излъчване, за да направим нашите общества по-пъргави и приспособими както към причинените от човека събития в околната среда (напр. Deepwater Horizon), така и към екстремните метеорологични събития или десетичните промени в мащаба като суша Заедно с данните обаче трябва да имаме много по-добро разбиране за вземането на решения, което означава разширяване на знанията за когнитивните пристрастия, за граничната работа (учени, граждани и политици, които работят заедно, за да преценят възможностите въз основа не само на емпирични доказателства, но също на стойности). & rdquo;

Тифани Шлейн, режисьор и продуцент на филма & lsquo; Свързани & rsquo; и основател на The Webby Awards, пише, & ldquo; Големите данни ни позволяват да видим модели, които никога не сме виждали досега. Това ясно ще ни покаже взаимозависимост и връзки, които ще доведат до нов начин на гледане на всичко. Ще ни позволи да видим & lsquo; реално време & rsquo; причина и следствие от нашите действия. Това, което купуваме, ядем, даряваме и изхвърляме, ще бъде визуално в карта в реално време, за да видим вълнистия ефект от нашите действия. Това може да доведе само до нравствено съзнание. & Rdquo;

Някои отговори, които се концентрираха върху Интернет на нещата (източник на големи данни), идваха от хора, които твърдят, че ще видим впечатляващи печалби

Докато редица респонденти изразиха малко доверие в много допълнително, полезно развитие на Интернет на нещата до 2020 г., мнозина го виждат да се развива. Интернет на нещата е смесицата от свързани & ldquo; интелигентни обекти & rdquo; устройства с IP сензори и четци, RFID тагове и друга идентифицираща цифрова информация, която може да подава материал към машини за анализ.

& ldquo; Огромните перспективи за „Интернет на нещата“ ме подтикват да проверя първия избор, & rdquo; написаФред Хапгуд, автор на технологии и консултант и модератор на групата за интереси в Nanosystems в MIT през 90-те години. & ldquo; Склонен съм да мисля за Интернет на нещата като умножаващ точки на интерактивност - сензори и / или изпълнителни механизми - в целия социален пейзаж. С намаляването на цената на свързаността броят на тези точки ще се покачва, разпространявайки интелигентността навсякъде. & Rdquo;

Анонимен участник в анкетата пише, & ldquo; С правилната правна и нормативна рамка, Интернет на нещата трябва да допринесе поразително за човешкия живот. Най-големите пречки за успеха са технологичните и поведенческите, имаме нужда от бързо превръщане в IPv6 и се нуждаем от сътрудничество между всички заинтересовани страни, за да работи Интернет на нещата. Също така се нуждаем от глобални стандарти, а не само от американски стандарти и практики, които очертават практически и ефективни линии за това как такава база данни може и не може да се използва в съответствие с правата на човека. & Rdquo;

Боб Франкстън, пионер в изчисленията, съразработчик на VisiCalc и ACM Fellow, отбеляза, & ldquo; Интернет на нещата е по-малко за масивни данни, отколкото за мета обекти. Ще трябва да се научим как да се скрием от големите данни на видно място. Притеснявам се за тиранията на главния, по-малко заради Големите данни, отколкото заради днешното самотерроризирано общество, търсещо утеха в миналото. & Rdquo;

Брус Нордман, учен-изследовател в Националната лаборатория на Лорънс Бъркли и ръководител на работната група по Интернет инженеринг, написа, & ldquo; Тази тема е пряко свързана с някои от собствените ми трудове в Интернет на нещата. Данните, които са много по-достъпни като количество, цена и качество, ще бъдат отличителна черта през следващото десетилетие, но голяма част от това ще бъдат „Малки данни“, което е полезно предимно или изцяло само на местно ниво (за практически проблеми или загриженост за поверителността). Ще искам данните, свързани с моето здраве, да бъдат възможно най-лични. Къщата ми трябва да позволява контрол на светлината, топлината, звука, изображението и т.н., което подобрява моите преживявания и удобство и спестява ресурси. Например, осветлението все по-често ще реагира на заетост или „присъствие“ (не само, че някой присъства, но кой е, колко е и с каква дейност се занимава) и по този начин осигурява по-добри услуги за осветление, автоматично и при по-малко нетна енергия от преди. Кой обаче извън сградата трябва да се грижи за детайлите? Никой. Големите данни ще бъдат нетен плюс, но и той ще създаде значително количество проблеми, особено около сигурността и поверителността. & Rdquo;

Анонимен респондент написа, & ldquo; Ние сме на път, който ще направи много големи масиви от данни достъпни за изучаване на света около нас. Появата на повсеместни, високоскоростни безжични среди ще даде възможност за разполагане на евтини сензори. Тези сензори ще предоставят безпрецедентни количества данни. Понастоящем бизнесът е водещ в „прогнозния анализ.“ Наскоро правителството внимава към такива инструменти. В близко бъдеще (2020 г.) тези масиви от големи данни ще започнат да идват онлайн и професионалните анализатори ще започнат да използват информацията, за да правят информиран избор на политики. В дългосрочен план потенциалът за злоупотреба е силен. Не е ясно дали политически ориентираните хора ще притежават воля или умение да интерпретират правилно анализите на данни. Всички реални злоупотреби е вероятно да се натрупат в по-далечното бъдеще, след 2020 г. & rdquo;

Лидерът на интернет обществото Раджнеш Сингх, регионален директор за Азия, предупреди, & ldquo; Вграждането на интернет технология в различни „неща“ ще ни помогне да подобрим живота си. Въпреки това е също толкова важно да гарантираме, че използваме това отговорно и не се държи твърде много власт и контрол от едно и също лице. Трябва да има подходящи проверки и баланси, отчетност и прозрачност. Трябва да се свърши много повече работа от всички заинтересовани страни, за да се гарантира, че ще стигнем до там, и да се използва такава технология за напредъка на човечеството, а не нейният контрол. & Rdquo;

Анонимен респондент каза: & ldquo; Рискът е наличните Големи данни да бъдат използвани - в Дивия Запад на правата за поверителност - като нова златна мина за агресивни интернет компании. Това ще зависи много от капацитета на правителствата (и бъдещите органи за управление на Интернет) ще трябва да избегнат риска данните, предоставени от Интернет на нещата (IoT), да станат същите, каквито днес са данните, получени от търсачките. По отношение на ползите от IoT за околната среда, не вярвам, че тяхното въздействие ще бъде толкова подходящо, колкото можете да повярвате. Ще отнеме много време за стандартизиране и интегриране на съществуващите мрежи и базите данни на IoT. Нито една от съществуващите компании няма да приеме да бъде увеличена чрез IoT играта; ще има ожесточена съпротива срещу интеграцията. & rdquo;

Чарли Брейндал, хоноруван преподавател в университета в Копенхаген, прогнозира, & ldquo; Повечето неща - дори най-евтините и най-баналните, като кламери - ще носят индивидуална идентичност в даден момент в бъдещето. Вече сме в средата на революцията и вече имаме на разположение за анализ безпрецедентно количество данни. Трябва да свикнем с идеята, че важният въпрос е колко данни можем да си позволим да изхвърлим, а не колко данни можем да си позволим да съберем. Сега знаем много повече от преди, но знанията ни просто сочат към нови нужди за изследвания. & Rdquo;

Бари Чудаков, консултант и гостуващ научен сътрудник в програмата McLuhan в областта на културата и технологиите в университета в Торонто разработи следния сценарий: & ldquo; До 2020 г. всяко наше движение (или щракване или емоция) е нечий бизнес модел. Първо ще изградим разкази, а след това и светоглед около това. Като се има предвид способността да се вземат огромни количества данни и да се намери смисъл в тях чрез намиране на модели и анализи, в крайна сметка ще използваме тези анализи не само във финансите, здравеопазването, маркетинга и информационните технологии, но и в това, което чуваме, виждаме и срещаме като света минава покрай нас и през нас. Ще има изгреваща реалност, че нашата идентичност вече е свързана с нашите данни. По същество в известна степен нашата самоличност са нашите данни. Големите данни и Интернет на нещата се превръщат в арбитър, шибот, агент на триаж. Тъй като светът става все по-взаимосвързан, информацията държи нещата заедно: тя е свързващо средство за системите. Като такъв той е не само нов решаващ елемент на това, което е важно или не, той е нов прокси, който може да застане на мястото на всеки. До 2020 г. данните се превръщат в нова система от вярвания. В човешката история сме имали този вид свързващо вещество и преди и използвахме латинския основен религаре, което означава да се свържем заедно, за да въплътим тази концепция. Информацията под формата на големи данни и Интернет на нещата се превръща в религия. & Rdquo;

Съмнителен анонимен респондент отбеляза, & ldquo; Очевидно тази идея за „Интернет на нещата“ започва да насърчава поредния кръг от кравеоко утопично мислене. Големите данни ще доведат до някои успехи и много неуспехи и повечето хора ще продължат просто да се бъркат, надявайки се да не бъдат ограбвани твърде често от добронамерените (или не) предприемачи и бюрократи, които се наслаждават на опита да използват този лъскав нов играчка за оправяне на света. & rdquo;

Мнозина очакват или поне се надяват, че доброто ще надделее над лошото; но някои се притесняват, че балансът на въздействията ще се обърне в другата посока

Много от респондентите в тази извадка имаха силна представа както за ползите, така и за проблемите, които ще се появят, когато големите данни станат голяма реалност в корпоративния, държавния и социалния живот. Те говориха за двете измерения на въздействието. Някои бяха склонни да подчертават положителното, дори когато предупреждаваха да се справят с отрицателното; други се притесняват от нещата, които се разпадат повече от лошо, отколкото от добро.

Ето какДана Бойд, старши изследовател с професионална принадлежност и работа, базирана в Microsoft Research, вижда баланса на силите: & ldquo; Интернет увеличава доброто, лошото и грозното ежедневие. Разбира се, тези неща ще бъдат използвани за добро. И разбира се, те ще бъдат използвани за лоши и грозни. Научната фантастика ни дава много шаблони, за да си представим къде ще отиде това. Но тази раздвоеност ни отвежда никъде. Това, което ще бъде интересно, е как социалната динамика, икономическият обмен и достъпът до информация се отразяват по нови начини, които отварят възможности, които все още не можем да си представим. Това ще означава загуба на някои аспекти на обществото, които оценяваме, но също така ще даде нови възможности. & Rdquo;

Марджори С. Блументал, асоцииран проректор в университета в Джорджтаун и служител-помощник в RAND Corporation, прогнозира, & ldquo; Направи си сам анализ ще помогне на повече хора да анализират и прогнозират от всякога. Това ще има различни обществени ползи и допълнителни иновации. Това също ще допринесе за нови видове престъпления. & Rdquo;

Професионален програмистСет Финкелщайнотговори, & ldquo; Това е въпрос, на който искам да отговоряи двете. & Lsquo; изборите & rsquo; по-горе са верни в описанията си. Най-накрая отидох с & lsquo; отрицателен & rsquo; защото от години се застъпвам, че бизнесът за извличане на данни не е добър модел за управление. Но това е само последната версия на & lsquo; компютрите и обществото. & Rsquo; & rdquo;

Пери Хюит, директор на дигиталните комуникации и комуникационни услуги в Харвардския университет, написа, & ldquo; „Nowcasting“ със сигурност ще се спъне много пъти, преди да излезе, а компаниите ще контролират софтуерните инструменти по начини, които правят всички нас дълбоко и правилно подозрителни. Страхът от Големите данни обаче се чувства като страх от пожар: той съществува, способността му да нанесе щети е огромна и въпреки това свети така, че няма връщане назад. За всеки агрегатор на данни за здравни грижи, който ни кара да се свием, има, надяваме се, Естер Дуфло (стипендиант на Фондация Макартур за нейната работа по подобряване на живота на най-бедните хора в света). Използването на данни може да информира за социални решения. & Rdquo;

Лари Ланом, директор на технология за управление на информацията и вицепрезидент в Корпорацията за национални изследователски инициативи, написа, & ldquo; Добавените данни ще подобрят нашето разбиране за физическия свят и проследяването в реално време на обекти в движение, например пратки и инвентари, и ще повишаване на ефективността на различни икономически дейности. Поверителността ще продължи да бъде голямо предизвикателство. & Rdquo;

Марк Уолш, съосновател на geniusrocket.com, каза, & ldquo; За съжаление, това е въпрос, който щеопределеноимат различни отговори по категории. IBM Smarter Planet ще подобри използването на енергия и претоварването на трафика. Големите данни работят. Лобистите ще получат резултатите от големите данни на политиците в подкрепа на дадено заключение и ще се случат лоши неща. На и надолу по линията ще видите тази дихотомия: Бизнес срещу лобисти. Един ще работи за положителни, други за отрицателни. & Rdquo;

Тед М. Купман, преподавател в държавния университет в Сан Хосе и член на изпълнителния комитет на Асоциацията на интернет изследователите, обясни, & ldquo; Въпреки че способността за обработка на огромни количества данни ще донесе много ползи, липсата на теоретична съгласуваност и разбиране за това как работата на големи и сложни системи ще доведе до възникване на големи проблеми. Фокусът на Big Data върху финансовите пазари не е увеличил нашето разбиране за това как работят нашите сложни и глобални икономики. Възможността да се идентифицират променливите не води до разбирането им. Масивните сложни системи са много трудни за предвиждане. Освен това, само защото разбираме повече, не означава, че можем да предприемем действия, които не създават повече триене или да въведем променливи, които водят до непредвидени последици. В края на данните трябва да действате по отношение на данните и точно там срещаме проблеми. Винаги ще има повече известни неизвестни и неизвестни неизвестни, отколкото известни познати. Мисля, че повече данни само ще увеличат първите повече от вторите. & Rdquo;

Сам Пънет, президент на FAD Research Inc., забеляза, & ldquo; Както при всяка нова технология, нейното пристигане е смесена благословия, изпълнена с опасността на нашите организации за вземане на решения да използват нови потенциали. Двата най-очевидни случая са системите за събиране на разузнавателни данни, използвани за националната сигурност, и информационните системи, използвани в момента за управление на международните финансови пазари. И двете са проявили непредвидени последици - в единия случай не е действал правилно на наличната информация, а в другия са изключително сложни и екстремни колебания на пазарите, които никой не може да обясни. Оптимист съм за потенциала на Интернет на нещата, разгърнат в управляем мащаб. Голямата предпазливост при по-амбициозните системи е прекалената зависимост от на пръв поглед рационални системи, за да се осигурят напълно непристъпни решения. Потенциалът тези системи да бъдат злоупотребявани или да не вземат предвид непредвидени обстоятелства е реален, подчертавайки необходимостта дизайнът на такива системи да се основава на добре обмислени принципи, отнасящи се до поверителността на информацията и гражданските свободи, както и осъзнаването, че системите са конструкции от данни, използващи правила. Правилата, създадени от хората, с всичките им недостатъци и несъвършенства, са предмет на случайните & lsquo; черен лебед & rsquo; условия на невъобразими резултати. & rdquo;

Каролайн Хейторнтуейт, директор и професор в Библиотечното училище, архивни и информационни изследвания на Университета на Британска Колумбия, написа, & ldquo; С всяка промяна има еднакви и противоположни реакции. По-голямото събиране на данни ще създаде проблеми с поверителността; по-големи визуализации ще скрият алгоритми за генериране на тези привлекателни презентации на данни. & rdquo;

Тя предупреди: & ldquo; Както Хърбърт Саймън каза преди няколко години, алгоритмите ще изчезнат в машините и след това няма да бъдат преразглеждани. & Rdquo;

Стивън Масиклат, доцент по комуникации, Университет в Сиракуза, прогнозира, & ldquo; Използването на големи данни ще бъде норма за целия бизнес и нарастващият сектор от населението в крайна сметка ще се занимава с обяснение на прозрения за големи данни на хора, които не са обучени да разбират статистическата механика и граници на системите. Това няма да е универсално благо: в Америка особено хората не харесват идеята за класификация. Тъй като данните ни стават по-детайлни и анализът ни по-усъвършенстван, вероятно ще видим повече стратификация на класа, обусловена от търговци и други бизнес операции. Но ползите много вероятно ще надхвърлят тези негативи, тъй като ще можем да направим повече неща по-рентабилно с прозренията, получени от повече данни. & Rdquo;

Отворен достъп до инструменти и данни & lsquo; прозрачност & rsquo; са необходими на хората да предоставят информация за проверки и баланси. Достатъчни ли са, за да наклонят въздействията в положителна посока?

Някои респонденти казват, че бъдещето ще бъде положително, ако достъпът до данните се предлага на еднаква основа за всички, и дори & ldquo; частен & rdquo; организациите правят повечето от своите набори от данни или всички те отворени и безплатни. Това често се нарича „прозрачност на данните“. & Rdquo; Анонимен респондент написа: & ldquo; Аз лично съм много ангажиран с тази тенденция и съм развълнуван колко последователно хората настояват за отворени данни. & Rdquo; Друг пише, & ldquo; Ако Големите данни също не са широкообхватни (т.е. разпределени сред възможно най-много играчи и граждани), това като цяло ще бъде отрицателно. & Rdquo;

Алекс Халавай, вицепрезидент на Асоциацията на интернет изследователите и автор наОбщество на търсачките,написа, & ldquo; Истинската сила на „Големите данни“ ще дойде в голяма степен в зависимост от степента, в която тя се държи в частни ръце или е открито достъпна. Открито достъпните данни и широко разпространените инструменти за тяхното манипулиране ще създадат нови начини за разбиране и управление на себе си като личности и като общества. & Rdquo;

Киприен Ломас, директор на Учебния център за земни и хранителни системи в Университета на Британска Колумбия, призова, & ldquo; Заедно с нарастването на големите данни трябва да дойде равен и отворен достъп до данните, така че допусканията да могат да бъдат проверявани и проверявани двойно и да се насърчават култура на търсене на резултати в данните. Достъп досъщотоданните трябва да позволяват провеждането на хиляди паралелни експерименти от любители. Тази екосистема трябва да позволи откриването на нови модели и значения в Големите данни. & Rdquo;

Том Худ, Главен изпълнителен директор на Мерилендската асоциация на CPA, отговори, & ldquo; Big Data ми дава надежда за възможностите на технологията. Прозрачност, отчетност и & lsquo; мъдростта на тълпата & rsquo; са възможни с появата на големи данни, комбинирани с инструментите за достъп и анализ на данните в реално време. Много примери вече са в ход. В счетоводната професия се появява XBRL (eXtensible Business Reporting Language), отворен код и стандартизиран език за бизнес отчетност, който е подмножество на XML. Това вече е внедрено със задължително финансово отчитане в SEC, FDIC и се предлага за отчетност на държавните разходи чрез Закона за данните от 2011 г. (Закон за цифровата отчетност и прозрачност). Използването на XBRL се използва и за намаляване на тежестта за спазване на изискванията за бизнеса и правителството с много правителства по света (Холандия, Австралия, Нова Зеландия и Обединеното кралство). Рисковете от отрицателен сценарий се въртят около проблемите на целостта на данните и сигурността. Ако те позволяват манипулация и изкривяване на управляващите, тогава общественото доверие ще се разпадне и ще възникне много негативен сценарий. Ако обаче данните са освободени и има инструменти за достъп до множеството и анализ на данните, тогава очаквам положителният сценарий да бъде най-вероятен. & Rdquo;

Доналд Нийл, старши изследователски програмист от Университета на Уайкато, базиран в Хамилтън, Нова Зеландия, и други виждат обещание в това да се даде възможност на всички лесно да разберат света по-добре чрез данни. Нийл писа, & ldquo; Едно от последствията на „Облака“ е, че инструментите за анализ на големи данни могат да бъдат достъпни за всеки. & Rdquo;

Нейтън Суорцендрубер, технологично образование в консорциума SWON Libraries, предупреди, че данните трябва да са отворени. & ldquo; За да могат Големите данни да имат положително въздействие върху обществото като цяло, те трябва да бъдат прозрачни, & rdquo; той каза. & ldquo; Обикновените граждани би трябвало да могат да търсят набора от данни и да откриват реални отговори, независимо от светлината, която се проявява върху отделни лица, корпорации или правителства. Заложено е твърде много за тези страни, за да се позволи открит, прозрачен достъп до тези данни. Докато някои набори от данни или части от набори от данни са скрити, има място за злоупотреба и манипулация. Мисля, че тази манипулация със сигурност ще се осъществи. Освен ако големите данни не бъдат демократизирани в мащабен мащаб, те като цяло ще имат отрицателно въздействие върху обществото. В момента не виждам много надежда за такава демократизация. & Rdquo;

Ричард Лоуенбърг, директор на института 1-ва миля и мрежов активист от началото на 70-те години, отбеляза, & ldquo; Големите данни трябва да се развиват в контекста на отвореността и подобреното разбиране на динамичните, сложни цели екосистеми. Трябва да бъдат разгледани трудни въпроси, които ще отнемат време и подкрепа, включително: субекти от публичния и частния сектор, които се съгласяват да споделят данни; предоставяне на често актуализирани мета-данни; откритост и прозрачност; възстановяване на разходите; и технически стандарти. & rdquo;

Кати Кавано, доцент по образователни технологии в Университета на Флорида-Гейнсвил, прогнозира, че в този свят, & ldquo; тъй като хората ще могат бързо да създават свои собствени приложения за манипулиране на данни, публичните набори от данни ще се използват широко за отговори на въпроси. В много случаи анализът на данните ще увеличи удовлетвореността и рейтингите на потребителите, а в някои случаи архивираното удовлетворение и докладите на потребителите ще бъдат анализирани като данните, което ще доведе до баланс при вземането на решения чрез използването на големи количества обективна и субективна информация. & Rdquo;

НоШон Мийд, директор на архитектура, оценка и анализ на решения за Mead, Mead & Clark, Interbrand, очаква, че ще трябва да има обществен протест, за да се отворят данни за обществеността и може да има движение за освобождаване на AI. & ldquo; Големите публично достъпни набори от данни, по-лесни инструменти, по-широко разпространение на аналитични умения и софтуер за изкуствен интелект на ранен етап ще доведат до изблик на икономическа активност и повишена производителност, сравнима с тази на интернет и компютърните революции от средата до края на 90-те години , & rdquo; предсказа той. & ldquo; Ще възникнат социални движения, за да се освободи достъпът до големи хранилища с данни, да се ограничи развитието и използването на ИИ и да се „освободят“ ИИ. & rdquo;

Някои респонденти казват, че не мислят, че повечето хора ще могат да идентифицират или оценят сложни набори от данни, със или без инструменти и отворен достъп.

Анонимен респондент пише, & ldquo; колекцията вероятно ще бъде незабележима за повечето, освен ако законът и разпоредбите не я поставят явно и не предоставят индивидуален избор. Анализът вероятно ще страда от развод в знания и контекст между поръчителите и доставчиците на анализа. Понастоящем нито един пример не е по-добър от този между капризното невежество на банковите ръководители и наивността на технолозите за реалността на обезпечените дългови задължения. Разчитането ще доведе до все по-нестабилни процеси, при които само тези, които могат да използват Големите данни, ще могат да се защитят, като човекът е все по-застрашен. Бързата програма за търговия с акции е актуален, пагубен пример. & Rdquo;

Друг анонимен участник в проучването каза: & ldquo; Фалшиво положителният процент ще продължи да расте, но общото население не разбира кривите на ROC или сравненията с фалшиво положително / истинско положително днес или в бъдеще. Малкото хора, които ще разберат опасностите от „Големите данни“, ще имат високи когнитивни способности и обучение. Общото население ще продължи да разчита на скапани резултати, защото не знае по-добре. & Rdquo;

Свалете розовите очила, спореха някои. Големите данни имат потенциал за значително & ldquo; разпределение на вредите & rdquo; това може да е невъзможно да се избегне

За редица респонденти възходът на големите данни все още не е достатъчно ясен в сравнение с предвидимите трудности, които ще създаде.

Дългогодишен технологичен анализаторОскар Ганди, почетен професор по комуникация в Университета на Пенсилвания, беше един от силните защитници на този възглед: & ldquo; Наскоро публикувах книгаПриемане на условия с шанскоето до голяма степен отразява аргументите в основата на втория вариант. В тази книга и според мен по-общо е необходимо да се мисли малко повече за разпределението на вредите, произтичащи от възхода на големи, средни и малки събирачи на данни, брокери и потребители. Ако & lsquo; Големи данни & rsquo; може да се използва предимно за социална изгода, а не за преследване на печалба (и системите за социален контрол, които подкрепят това усилие), тогава бих могъл & lsquo; да се регистрирам & rsquo; към управляваното от данните бъдеще и неговото изразяване чрез Интернет на нещата. & rdquo;

Майкъл Гудсън, асистент учен по проекта в Калифорнийския университет в Дейвис, написа, & ldquo; Моят отговор е неохотно признание за това, което възприемам като човешка природа. Въз основа на моето мнение за това колко ефективно маркетингът работи върху много хора - убеждавайки ги да правят неща, различни от това, което е в техен личен интерес - изглежда вероятно мощните хора и институции да използват всички данни, с които разполагат, за да повлияят на събитията според техните интереси . & rdquo;

& ldquo; Въпреки че нарастването на големите данни дава някои положителни резултати, страхувам се, че това ще доведе най-вече до засилено наблюдение и по-целенасочени маркетингови усилия, & rdquo; написаМелинда Блау, журналист на свободна практика и автор на 13 книги, включителноПоследващи непознати: Силата на хората, които не изглеждат важни, но наистина го правят.

Предупредителен тон беше чут отСивасубраманийска Мутузамия, президент на главата за Интернет обществото в Ченай и основател и главен изпълнителен директор на InternetStudio. & ldquo; Интернет и Интернет на нещата, заедно с придружаващата ги експлозия в качеството на обработка на данни наистина ще улеснят положителния напредък, но в същото време експлозията на данни определено ще създаде повече проблеми, отколкото решава в бъдеще, & rdquo; той написа. & ldquo; Разделянето на необходимите данни от ненужните данни ще създаде особени предизвикателства. Също така, анализът на данните сам по себе си не гарантира оптимални решения и оптимални резултати, защото има няколко фактора извън данните - точка, която е склонна да бъде пропусната в търсенето на все повече и повече данни. Такива обеми данни изискват по-сложна инфраструктура за управление на данни и сложни инструменти за анализ, които неизбежно ще оставят всички данни на пазенето на много големи предприятия, добри и лоши, и в ръцете на правителствата. Има огромна сила, свързана с такова богатство от информация. Едва ли тази сила винаги ще се използва с непогрешими етични стандарти. По-конкретно нарастването на Големите данни вероятно ще доведе до ситуация, при която всеки човек се проследява всеки момент навсякъде, от безсмислена загриженост за сигурността и в погрешно търсене на контрол. & Rdquo;

Джеймс А. Дановски, професор по комуникация в Северозападния университет и програмист по програми за разузнаване с отворен код и уеб добив 2011, пише, & ldquo; Копаене, анализ, съкращаване на времето до прогнозиране на тенденциите са интензивният фокус на повечето информационни сегменти в сектора на знанието. Злоупотребата ще се увеличи, тъй като се очаква кибервойната като едно проявление да стане много по-разпространена и по-спонсорирана от държавата, отколкото е в момента. Понастоящем източниците на правителственото разузнаване финансират изследвания за откриване на измама в социалните медии и разработване на начини за противодействие, технологии, които могат лесно да бъдат променени за манипулиране на нови източници на „обществено мнение“. & Rdquo;

Анонимен участник в проучването каза: & ldquo; Хайпът около големите данни е почти толкова обезумял, колкото шумът около теорията за ефективните пазари през 90-те години, и вижте къде ни доведе това. Въпреки че подобренията в събирането и обработката на данни ще доведат до огромни подобрения в нашето разбиране в много области, това не е панацея. Ние имаме десетилетия опит в анализирането на корпоративни финанси, борси и пазарни индекси и въпреки това все още не можем да предскажем какво ще се случи след това. Много динамични системи, от които фондовият пазар е един, не се поддават на предсказуеми модели, независимо колко данни събирате или колко изчислителна мощност прилагате. Притеснявам се, че прекомерното доверие в големите данни и всевиждащите алгоритми ще доведат до ужасни грешки. И се притеснявам, че тези системи могат да бъдат залагани, направени така, че да дават фалшиви или подвеждащи резултати. & Rdquo;

Един анонимен респондент се пошегува, & ldquo; Отгоре:Как да лъжа с Интернет на нещатасе превръща в подземен бестселър. & rdquo;

Друг анонимен респондент написа, & ldquo; Работната сила, необходима за подходящо маркиране и точно обединяване на всички текущи масиви от данни, е прекомерно голяма. И това не отчита създаването на нови набори от данни всеки ден. Следователно големите данни ще генерират дезинформация и ще бъдат манипулирани от хора или институции, за да покажат констатациите, които искат. Широката общественост няма да разбере основните конфликти и наивно ще се довери на резултата. Това вече се случва и само ще се влошава, тъй като големите данни продължават да се развиват. & Rdquo;

Няколко души изразиха загриженост за човешкия индивид в света на големите данни. Анонимен респондент каза: & ldquo; Ще станем по-пристрастени към това, което ни казват базите данни. Това може да наруши поемането на риск за доброто. Ще зависим повече от модели, отколкото от инстинкти. & Rdquo;

Леара Родос, доцент по журналистика и международни комуникации в Университета на Джорджия, каза: & ldquo; Всички данни могат да бъдат злоупотребявани, информацията е мощ и ако някой има много информация, независимо дали е точна, пълна или достоверна е все по-трудно за доказване. Груповото мислене поема. Разнообразието в циклите на мислене е толкова важно, че заменянето му с мажоритарна гледна точка ще бъде вредно за нашето общество и ще подтикне хората да се съобразяват и да не поддържат своята културна идентичност.

Анонимен респондент написа, & ldquo; Някъде по времевата линия на живота, логичните основни разбирания, които коренят всеки от нас спрямо останалите, трябва да имат предимство. Не мисля, че технологиите или големите данни могат да направят това или трябва да се опитат да ни кажат бъдещето или как или в какво да вярваме. Не съм готов за тази концептуална промяна. Технологията се движи бързо, хората не толкова. & Rdquo;

Стан Старк, консултант в Heuroes Consulting, отговори, & ldquo; Твърде голямо доверие ще бъде дадено на прогнозната аналитика на големите данни, като по този начин замъгляват и „посивят“ решенията, взети от големия бизнес в ущърб на тяхното представяне на арени за обслужване на клиенти. Те ще „приемат“, че техният анализ е правилен при всяко вземане на решения и ще загубят фокуса си върху „преди“ техниките за големи данни, които са били по-персонализирани. & Rdquo;

Респондент от анонимно проучване каза: „Все още не сме разбрали последиците от теорията на хаоса и ако„ Големите данни “и бъдещото излъчване не са перфектни примери за информация, базирана на хаос, тогава не знам какво е. Като цяло не сме подготвени за тази голяма липса на поверителност; още по-малко сме подготвени за данни от такъв мащаб, достъпни само за мощните, богатите или свързани. & rdquo;

Анонимен участник написа, & ldquo; Две точки: Първо: Големите данни не са големи знания. Отваряме пожарен маркуч от данни, насочени към себе си, но освен да развиваме съхранение с по-висока плътност, не правим много по отношение на това. Основните предизвикателства тук ще бъдат разработването на „възприемащи филтри“ за тези потоци от данни (аналогични на тези в съзнанието ни, които ни позволяват например да не прекарваме целия ден, обръщайки внимание на факта, че носим чорапи): изхвърляне на данни точки, за които е малко вероятно да станат знания, които е малко вероятно да бъдат достъпни някога, които ще служат само за заемане на място на твърдия диск и ще усложнят по-нататъшния анализ на интересни събития. Второ: липсва правна защита на гражданите (в тези юрисдикции, които не са категорично автократични) и ще бъде от съществено значение за предотвратяване на корпоративна или правителствена злоупотреба с наличните прозрения за хората чрез широко обобщени данни, както и чрез нови техники за наблюдение. & Rdquo ;

Друг анонимен респондент отбеляза, & ldquo; През 2020 г. малко хора разбират „Големите данни“ като не повече от конвенционалната статистика от 20-ти век, приложена към променливи, измерващи силно повърхностни и ефимерни присъствия във физическото и киберпространството. Тази информация ще продължи да бъде наситена с магическа сила за прогнозиране, но въпреки това няма да успее да определи непланираното поведение на индивиди, които са обект на силно възникващи социални сигнали. Нарастването на големите данни не е отрицателно, но мнозина ще загубят интерес, тъй като разходите за придобиване и поддържане на данните надвишават получената полза. & Rdquo;

Джон Лебковски, директор на Polycot Associates LLC и президент на Electronic Frontier Foundation-Остин, забелязах, & ldquo; Виждали сме толкова много ситуации, при които блясъкът на статистическия анализ погрешно представя реалността на анализираните данни. Твърде лесно е да се огъне анализът, за да служи на конкретна цел или намерение. Също така съм загрижен за собствеността на личните данни и проблемите с поверителността в света на големите данни. Това е област, в която резултатите вероятно биха могли да бъдат подобрени чрез регулация, но в момента регулацията не е в стил. & Rdquo;

Един анонимен респондент сподели критика, която много респонденти от проучването повдигнаха - че организациите, които разполагат с данни, няма да разменят файлове помежду си, дори когато това е от полза за по-доброто. & ldquo; Не вярвам да има големи масиви от данни, които да се споделят между корпорации, правителства и университети на широко ниво, както е обсъдено в горните сценарии. & rdquo;

Марсия Ричардс Зулцер, старши писател и анализатор в Wolters Kluwer, предупреди, & ldquo; Най-големият риск е скоростта и достъпът, които предоставя Интернет. Вече можем да правим катастрофални грешки за наносекунди и да ги излъчваме универсално. Загубихме баланса, присъщ на „времето на забавяне.“ & Rdquo;

ИБари Пар, собственик и анализатор на MediaSavvy, каза, & ldquo; По-добрата информация рядко е решение на някакви реални социални проблеми. Може да е решението на много бизнес проблеми, но е малко вероятно ползите да се натрупат пред обществеността. По-вероятно е да загубим поверителност и свобода от възхода на големите данни. & Rdquo;

Нямаме човешки или технологичен капацитет да анализираме големи данни точно и ефективно. Анализаторите може да търсят прозрение на всички грешни места

Някои оспориха графика за 2020 г., представен в описанията на сценариите.Марк Уотсън, старши инженер в Netflix, каза: & ldquo; Очаквам, че това ще бъде доста трансформиращо за обществото, макар и може би не само през следващите осем години. & rdquo;

Други, които се аргументираха по подобен ред, описваха това, което според тях е основно несъответствие между обемите генерирани данни и човешкия капацитет - дори с помощта на машини - за работа с големи набори от данни, за споделяне на набори от данни и за извличане на значителни , точни резултати.

Майк Либхолд, старши изследовател и уважаван сътрудник от Института за бъдещето, прогнозира, & ldquo; Ограниченията за оценка на предимствата на големите данни ще бъдат скоростта на приемане на отворени API, свързани данни и оперативно съвместими метаданни. Продължаващите опасения относно поверителността и сигурността ще ограничат полезността на големите данни за визуализация на изводи и личен анализ. & Rdquo;

Кристиан Хуйтема, изтъкнат инженер в Microsoft, каза, & ldquo; Ненаблюдаваното машинно обучение е трудно. Има много примери за контролирано машинно обучение, но те се ръководят от експерти по теми, които насочват машината към конкретни открития. Ще отнеме много повече от десет години, за да овладеете извличането на действителни знания от масивите от големи данни. & Rdquo;

Бил Сейнт Арно, консултант в SURFnet, изграждането на националната образователна и изследователска мрежа Холандия & rsquo; интернет от следващо поколение, отбелязва се, & ldquo; Ползите и въздействията ще бъдат много по-малки и ще отнеме повече време, за да се развият. Манипулирането и корелирането на набори от големи данни е трудна работа. & Rdquo;

И анонимен респондент каза: & ldquo; Фактът, че повечето данни са неструктурирани, е огромен проблем и аз се съмнявам, че ще разрешим проблемите, свързани с осмислянето на този морас. & Rdquo; Друг анонимен участник в анкетата написа: & ldquo; Със сигурност през 2020 г. Големите данни ще бъдат по-рискови, отколкото заслужаващи доверие. Просто няма да имаме достатъчно опит - еквивалентът на 100-годишния наводнение в условията за прогнозиране - и така нашите системи ще „изглеждат добре“ по някои основни проблеми, но ще докажат, че правят грешки. & Rdquo;

Дан Нес, главен изследователски анализатор в MetaFacts, производители на потребителския профил на технологията, разказа приказка в своя отговор: & ldquo; Има стара история за минувач, който попада на пиян мъж, застанал под лампа и търси ключовете си. Минуващият се включва в търсенето и не вижда нищо. Той пита и научава, че ключовете не са паднали никъде в близост до фонарния стълб, но че пияният е гледал близо до фонарния стълб, защото там е била светлината. Днес много „големи данни“ са предубедени и липсват контекст, тъй като се основават на удобни извадки или подгрупи. Виждаме доблестни, но погрешни опити за прилагане на дълбоките набори от данни към неща, които имат ограничена релевантност или приложимост. Те са разтегнати, за да отговорят на грешни въпроси. Оптимист съм, че до 2020 г. това ще става все по-ясно и ще има истински пионери в информацията, които ще мислят извън полето за големи данни и ще базират решенията си по-широко и балансирано. Вместо да разчитат на „светлината на лампата“, те ще разработят и използват еквивалента на фокусирани фенерчета. & Rdquo;

Консултант от СиатълТом Уитморказа, & ldquo; Ще има нарастваща нужда не от статистически анализатори, а от хора, които ще правят „анализ на криминалистични данни“ - какво всъщност е измерено, за да се генерира тази база данни, която гледам, и колко близо е до това, което аз наистина исках да видя премерен? Тъй като се генерират все повече и повече големи масиви от данни, ще има все повече и повече проблеми с това. Всеки знае какво е даден изход и какво е сравнение. И е много ясно, ако човек започне да изглежда, че определенията, използвани от различни хора, имат много различни последици за значението, което може да бъде изведено. Анализът на изследователските данни може да ви покаже какво е интересно за голяма партида от числа, дали откритите интересни неща отразяват нещо полезно за етикетите, прикрепени към тези числа, е съвсем различен въпрос, а число без подходящи описателни прикачени файлове не е основание -Това е само число. & rdquo;

ФутуристДжон Смартказва, че Големите данни ще бъдат огромно положително, но едва докато семантичната мрежа стане напълно функционална, около 2030 г. & ldquo; Много хора и компании ще заявят какво могат да направят за нас големите данни през следващото десетилетие и вече го правят, но това е само лек негатив. Такъв шум причинява свръхинвестиции в слабо работещи платформи и други проблеми, но те са леки. След като имаме взаимодействие между кибертуини (полуинтелигентни агенти) и ценностен космос през 2030 г., всички най-малки групи от социални ценности ще имат свои собствени онлайн лобита и ще могат да намират субкултури, които подкрепят и развиват техните ценности. Междувременно очаквайте типичния хаос, шум и неефективност, които технологичните иновации винаги носят. & Rdquo;

Редица респонденти казаха, че вторият, отрицателен сценарий ще бъде вероятно през 2020 г., но до 2030 г. или след като може да сме се адаптирали и еволюирали, за да достигнем точката, в която положителният сценарий ще бъде най-разпространен. Анонимен участник в проучването каза: & ldquo; Вариант 1 би бил желателен, но вариант втори е по-вероятно поне за 2020 г. През 2020 г. много въпроси, свързани със справедливостта, решенията на мнозинството срещу малцинството и т.н., няма да бъдат решени и алгоритмите все още ще бъдат твърде машинни и недостатъчно хуманизирани. Първият вариант може да е дългосрочен сценарий. & Rdquo;

Джонатан Грудин, главен изследовател в Microsoft, прогнозира, & ldquo; Извличането на данни ще се използва повече, но до 2020 г. все още ще бъде в доста ограничени начини за ограничени цели и няма да има толкова голям ефект, въпреки че, разбира се, тези, които го пускат на пазара усилват ползите. Но вероятно ще настъпи 2030 г., преди наистина да стане мощен. Ефектите ще бъдат ли нетен плюс или минус? В продължение на двадесет години директният маркетинг и други хора се занимават с това, беше ли нетен плюс или минус? Харесвам напредъка в прогнозата за времето и трафика. Харесва ми, когато моят супермаркет всъщност ми предлага безплатни артикули или силно намалени стоки, които всъщност съм купил там в миналото, а не случайни купони. Не очаквам извличането на данни да постигне огромен напредък по този начин до 2020 г. Ще бъде тук по-бързо, отколкото си мислите. Това е като три версии на Mac или Windows OS отпреди - колко революционни са промените оттогава? Предполагам, че вече имаме iPad и Kinect, но нищо от това не е променило коренно живота на & lsquo; most & rsquo; хора за добро или лошо. & rdquo;

J. Мерил Кригер, социолог от Университета в Индиана, Университета в Пърди, Индианаполис, каза: & ldquo; Нямаме ресурси да обработваме данните и да ги анализираме адекватно по тяхното значение. Освен това огромните количества количествена информация са прекрасни, но без контекстуализацията и детайлите, произтичащи от интервюта, наблюдения и други качествени техники, огромното количество информация е по същество безсмислено. С други думи, това е хубаво, но какво от това? Докато не ангажираме адекватни ресурси (които в момента не са на разположение - посочвам акцента на нашето сегашно общество към монетизация и специализация) към интерпретация и обяснение & lsquo; Интернет на нещата & rsquo; остава чудесна идея и това е всичко. По отношение на стойностите, това напълно зависи от това къде седите. Ще има хора, които се ужасяват от това, което произтича от това да разберат какво всъщност правят хората; те са много по-заинтересовани светът да отразява това, което те знаят и разбират, и намират & lsquo; разлика & rsquo; да бъде невероятно заплашително. Такива хора винаги ще се опитват да манипулират набори от данни. От друга страна са идеалистите, които също искат разнообразието винаги да е нещо добро и ще се опитат да манипулират наборите от данни, за да отразят тяхната визия. Почтеността в науката е ключът тук - твърде много хора имат програма, която преследват. Това е заплахата за & lsquo; Интернет на нещата & rsquo; не самата информация. & rdquo;

Тапио Варис, почетен професор в Университета в Тампере и главен научен сътрудник към Организацията на ООН за образование, наука и култура (ЮНЕСКО), отбеляза, & ldquo; Общата липса на доверие и гигантската злоупотреба със съществуващите Големи данни за наблюдение и разузнаване ще се забави прогресиране надолу и обратно. & rdquo;

Рич Тейтъм, изследователският анализатор на Zondervan, религиозно издателство, се съгласи, че предстоят основните проблеми с доверието. & ldquo; Такъв анализ ще позволи измама във все по-голям мащаб, & rdquo; той написа. & ldquo; Най-важното няма да бъде на кого имате доверие за новини или на какъв обект имате доверие, а кой притежава данните, които използвате за новини. И този вид данни и анализи няма да са евтини. & Rdquo;

Ники Рейнолдс, директор на технологични услуги в Хамилтън Колидж, казва, че прекаленото самочувствие е голям риск. & ldquo; Вече използваме моделирането на данни, за да правим големи грешки, & rdquo; - посочи тя. & ldquo; В повечето начини се съмнявам, че използването на Големи данни ще бъде малко или много дефектно от сегашното ни използване на данните и моделите, до които имаме достъп днес. Сега катастрофите с недвижими имоти и ипотечни кредити са ясен случай на тези проблеми. Най-добрите анализи на корените на тези грешки, които съм чел и чувал, сочат към прекомерна увереност в слабо разбрани, много сложни модели на риск и отказ да се признае, че най-лошотощесе случи. Когато вероятността от възникване на ситуация е 1000 към едно, това означава, че ситуацията ще се случи, но не много често, в дългосрочен план, макар и вероятно два или повече последователни случая в краткосрочен план. Изглежда хората не обръщат внимание на това, когато вземат решения. Може би наистина не сме добри в мисленето за дългосрочен план и в крайна сметка трябва да приложим „плана за възстановяване при бедствия“ в действие. Във всеки случай не мисля, че големите данни ще направят проблема с лошата преценка при оценка на последиците от риска по-малък. Всичко, което се прогнозира въз основа на каквито и да е данни, е просто модел, а не контролер на събития. Ние като вид ще продължим да вземаме решения на кратка писта и ще ни хванат навън. И така, ще влошат ли големите данни последиците от нашите грешки? Да и не. Въпреки че последствията от грешка могат да станат по-мащабни, също така ще бъде много по-трудно да се „скрият“ грешките и техните последици поради нивото на свързаност, което имаме. Видяхме нарастващия потенциал на тази свързаност в последните политически събития и дори в последните екологични бедствия. Когато някой започне протест, другите знаят за него веднага, от непосредствените наблюдатели. Решенията дали да се присъедините към протеста не трябва да чакат издаването на вестник или „филм в единадесет“. Когато духа петролна платформа, целият свят знае в рамките на часове. Правителствата и учените започват да действат незабавно - не винаги гладко и със сигурност не винаги в сътрудничество, но реакцията е незабавна. Залагам, че способността ни да реагираме на кризи ще се увеличи също толкова бързо, може би по-бързо, отколкото способността ни да създаваме кризи. Надявам се да съм прав. & Rdquo;

Джениеце Луск, асистент на научен директор с докторска степен по приложна социология, който работи в компания за информационни технологии в Атланта, пише и & ldquo; Като приложен социолог, вярвам религиозно в способността на хората, които трябва да тълкуват и създават тези масиви от данни, за да отхвърлят всичко нагоре, умишлено или не. Медиите, изследванията, Интернет се движат от хората. Човешката грешка може да обърка дори най-доброто от събирането, анализирането и разпространението на данни. Освен това ние не сме в състояние да предложим или предскажем по обобщен начин, докато доверителните интервали не станат 100% и преброяването не се нуждае от вписване на данни, които няма да можем да прочетем в бъдеще или да станем психически статистици. За съжаление няма да можете да убедите някои аудитории или сегменти в това, защото ако някой с авторитетна позиция ви каже нещо, което компютърът изчисли, може и да го наречете абсолютна истина (освен ако не съвпада с тяхната система от вярвания, разбира се). & rdquo;

И един участник отбеляза, че не използваме данните, които вече имаме. & ldquo; Съвременното общество вече игнорира век социални изследвания, когато определя програми и политики, & rdquo; казахЧерил Ръсел, редакционен директор на New Strategist Publications и автор на Demo Memo Blog. & ldquo; Съмнително е, че лидерите на 2020 г. ще бъдат по-способни или желаещи от нашите лидери днес да използват резултатите от социалните науки, за да подобрят живота ни. & rdquo;

Някои съсредоточиха фокуса си върху ролята на човешката преценка в процеса на анализ на големи данни и реакция

Анонимен респондент каза: & ldquo; Старият урок, че корелацията не е причинно-следствена връзка, изглежда никога не е научен. Контролът върху данните означава, че неточните данни е трудно да се идентифицират и коригират. Виждам, че проблемите ще се увеличават само с размера на наборите от данни. Изглежда, че най-много се набляга на това да се правят интелигентни неща с данните, вместо да се гарантира тяхната валидност или да се даде контрол на правилните хора над тях. & Rdquo;

Мишел Дж. Мену, гостуващ професор в катедрата по информационни изследвания в Университетския колеж в Лондон, отбеляза, & ldquo; Интелигентността на системите не може да замести интелигентността на хората и организациите, които ги използват. Тъй като усилията са насочени към развитието на технологиите за сметка на образованието, повишаването на съзнанието и демократичния контрол, по-вероятно е да възникнат негативни ефекти. & Rdquo;

Том Рул, педагог и технологичен консултант със седалище в Мейкън, Джорджия, написа: & ldquo; Никога не подценявайте глупостта и основната греховност на човечеството. & rdquo;

Уилям Л. Шрадър, независим консултант, който основава PSINet през 1989 г., предостави още няколко подробности. & ldquo; Факт е: хората са хора, & rdquo; той написа. & ldquo; Богатите стават по-богати, а мощните остават такива. Всички инструменти ще се използват от богатите за печалба и от мощните, за да останат такива. Активистите в света обаче също ще имат достъп до големите данни и големи инструменти, всъщност ще бъдат иноватори и активисти, които създават точно тези инструменти. В крайна сметка чантата винаги се смесва; както Интернет ни донесе дистанционно обучение и дистанционна медицина (както беше предсказано през 80-те години), той също донесе на хората глобален достъп до детска порнография, възможност за фишинг на финансова информация и информация за самоличност за незаконна дейност, както и да помогне на правителствата при наблюдението и контрола на техните популации. Едновременно с това видяхме как Интернет изигра основна роля за свалянето на няколко правителства през 2009-2011 г. и тази дейност ще продължи. Да, отговорът е „и двете“, положителен и отрицателен. & Rdquo;

Мигел Алкаин, ръководител на районния офис на Международния съюз за далекосъобщения, Тегусигалпа, Хондурас, отговори, & ldquo; Ако някои високопоставени хора вярват, че този тип технология може да предскаже непредсказуемото, има случаи, когато тази технология ще бъде преразширена и злоупотребена. Човешката преценка не може да бъде заменена от технология, като първата е отговорна за решенията. & Rdquo;

Дейвид Д. Бърщайн, основател на Generation18, младежка организация за ангажиране на гласоподавателите, каза, че човешкият елемент е предимството на цялата технология. & ldquo; Докато растежът на Големите данни е съчетан с растеж на усъвършенствана курация и куратори, това ще бъде актив, & rdquo; той написа. & ldquo; Без тези куратори данните ще стават все по-изобилни, все по-поразителни и ще объркат нашите политически и социални разговори чрез изобилие от числа, които могат да направят всяка точка, която искаме да ги накараме да направи. & rdquo;

Доналд Г. Барнс, гостуващ професор от университета Гуангси в Китай и бивш директор на научния консултативен съвет към Агенцията за опазване на околната среда на САЩ, отбеляза, & ldquo; Големите данни имат възможности и ще доведат до някои, но ограничен брой открития. Визията за разчитане на резултатите от анализа на големите данни като основен източник на пробивна информация и прозрения е неоправдана. Предишни и настоящи примери за анализ на големи данни предполагат, че трябва да бъдем предпазливи относно ползотворността на този тип анализ; напр. Министерството на вътрешната сигурност е затруднено от потока от информация, заловена в Интернет, и ограниченото изплащане от използването на масивни информационни източници в комбинаторната химия и биоинформатиката. Основният проблем е проблемът сигнал-шум; т.е. с повече информация предизвикателството за откриване на сигнала може да бъде още по-голямо. До 2020 г. повечето прозрения и значителни постижения все още ще бъдат резултат от обучени, въображаеми, любознателни и проницателни умове. & Rdquo;

Дейвид Киршнер, кандидат за докторантура и изследовател в Технологичния университет Nanyang в Сингапур, пише, & ldquo; Хората вярват твърде много на статистиката и количествения анализ на гигантски масиви от данни. Това ни кара да вярваме, че можем да предсказваме и прогнозираме много по-добре, отколкото всъщност можем. Прогнозирането води до това хората да приемат резултати, които не е задължително да се случат и които имат реални последици за хората, които печелят или губят въз основа на тези прогнози. Предполагаме също, че можем да се доверим на интерпретациите на тези данни. Тълкуванията се правят от хора, хора на властни позиции, които имат свои собствени програми и това са тълкуванията, на които хората обикновено се доверяват. Не е умно, но не знаем по-добре, защото вярваме на казаното от „експерти“ и нямаме средства да разберем какво всъщност се случва, причините за това или онова. Всичко това е ефективно маскирано в бюрокрация. Много опасно! & Rdquo;

Джефри Александър, старши анализатор на научна и технологична политика в Центъра за наука, технологии и икономическо развитие към SRI International каза, че човешкият фактор в анализа е от решаващо значение. & ldquo; Докато 2020 г. е твърде скоро за появата на истински изкуствен интелект и предсказваща сила, способността за манипулиране на социални, физически и информационни входове в голям мащаб ще разкрие нови прозрения за поведението и човешкото развитие, & rdquo; той написа. & ldquo; По-голямата опасност се крие след 2020 г., когато машинното обучение може да стане толкова ефективно, че да изтласка човешката преценка. & rdquo;

Анонимен респондент прогнозира оттегляне от някои, пишейки, & ldquo; Очаквам реакция срещу Големите данни да се случи по-скоро, отколкото по-късно, и очаквам да видя движение към хората, които намаляват присъствието си в мрежата. Все още има голям процент от населението, което има ниско ниво на интернет присъствие (например всеки на възраст над 45 години) и това ще предложи необходимите контрасти, за да се случи това. & Rdquo;

Хората са загрижени за енергийните програми на правителствата и корпорациите, интересите с най-много ресурси за големи данни

Разнообразни отговори се фокусираха върху колекционерите на Големи данни и техните мотиви. Сред онези, за които това беше рамката за отговорите им, мнозина бяха предпазливи и пълни с предупреждения за това как данните могат да бъдат използвани.

Ед Лайъл,професор в Държавния колеж Адамс, написа: & ldquo; Виждам два основни негатива, преобладаващи положителното.1)Нашето доверие в иконометричните модели направи по-вероятно голямата световна икономическа катастрофа. Подобрявайки се все по-добре в прогнозирането на спецификите на близкото бъдеще, ние имахме модели, които игнорираха големите системни промени и силата на пазарната корупция от страна на тези на върха. Всички прогнозни модели са обект на средно движение, игнорирайки нарастващата промяна в системата, причинена от падане от скала, което не се вижда от моделите и не се търси от хората, които се доверяват на модели.2)като1984 г.иСмел нов свят, книги, които моето поколение познава добре, виждал съм правителства и още по-голям бизнес използва масивни персонализирани данни, за да контролира хората, за да не просто отговаря на техните нужди, но и да създава нужди. Правителството ни е накарало да се страхуваме и да сме готови да приемем все по-големи ограничения на личната свобода поради нашата несигурност. Заможният елит (топ 2% или повече) може да закупи телевизионни реклами и други медии, за да избере Конгреса за техните цели. Сега големите корпорации могат да бъдат още по-активни в горната част на таблицата. Тази нарастваща власт, изместена на върха, отдалечава САЩ от демокрацията в това, което сега виждам като плутокрация. RFID в нашите дрехи и продукти улесняват проследяването на извънредните стойности и може би излагат хората на по-голям риск в бъдеще. & Rdquo;

Анонимен респондент написа, & ldquo; Правилният избор зависи до голяма степен от нашия колективен избор. В крайна сметка избрах по-песимистичния сценарий, защото това е изборът, в който се намираме в момента - този, при който корпорации без чувство за ценности, морал или съвест правят избор за хората (избори, засягащи хората, но мотивирани от обикновена печалба за акционери). Помислете за броя на телевизионните програми, посветени на „инвестирането“ на пари в сравнение с броя на телевизионните програми, посветени на премахването на бедността. Тъй като нещата стоят в момента, няма малко съмнение, че вторият вариант е правилният. Но за щастие това може да се промени, ако хората решат да поемат отговорността и да върнат корпорациите към тяхната подчинена роля. & Rdquo;

Друг анонимен участник в проучването прогнозира, & ldquo; И двата резултата ще се получат едновременно по много сложни преплетени начини. Дори либералните правителства ще се почувстват принудени да натрупват и използват данни срещу своите граждани, в много от тези държави корпорациите, които се управляват, ще свършат работа. & Rdquo;

Джулия Такахаши, редактор и издател в Diisynology.com, писа, & ldquo; До 2020 г. повечето потребители на интернет ще бъдат свикнали да получават алгоритмични препоръки и или няма да ги уведомяват малко, или ще са намерили начини да ги заобиколят. В Съединените щати по-голямата част от хората не харесват чувството, че са манипулирани или представени с по-малко възможности за избор и онлайн общността за търговия на дребно ще трябва да се справи с това. На ниво общностно, регионално, държавно или национално планиране ще се използват повече големи данни и ще трябва да се конкурират с политически нагласи, които изглежда са в тенденция към подозрение за „големи данни“. Най-вероятно корпорациите ще бъдат най-големите потребители на Big Data и може да установи, че данните навън са толкова добри, колкото данните в тях и предположенията, които са влезли в планирането на изхода. Мисля, че ще видим някои големи грешки. & Rdquo;

Повечето от анкетираните, които коментираха със загриженост относно държавния и / или корпоративния контрол на данните, избраха да останат анонимни. Ето още техни наблюдения:

- & ldquo; Започнах да се занимавам с обобщаване на данни през 70-те години на миналия век и имам копие от доклада за здравеопазване и социално осигуряване в САЩ от 70-те години на миналия век за компютри, поверителност и бази данни на рафта, където пиша това. Днес агрегирането на данни нараства с две основни цели: Апарат за национална сигурност и все по-фокусирани маркетингови (включително политически) бази данни. Нито едно от двете не е предназначено в полза на отделните потребители на мрежата, а по-скоро гледа на потребителите или като потенциални терористи, или като купувачи на стоки и услуги. Вече хората струват много за извличане на резултатите от някои от тези неща, дори прости неща като кредитни оценки са достъпни за субекта на данните само срещу заплащане. Информацията е мощ, а мощността ще струва пари. & Rdquo;

- & ldquo; Винаги, когато корпорации или правителства се занимават с каквото и да било, те рядко се държат по начин, който би могъл да се счита за „алтруистичен“ начин. Корпорациите ще монополизират големите данни, за да правят пари; неетична правителствена администрация би могла да го използва, за да предизвика хаос в личния живот, което според мен вече се случва в Съединените щати, под егидата на предотвратяването на детската порнография и експлоатацията. Макар че със сигурност си струва усилие, има последици за нарушаване на правата на гражданите на личен живот за извършване на ужасни операции. Това създава неприятен прецедент, при който подозрението за дейност може да бъде коз, а заклещването следва плътно отзад. Виждам, че това е основен проблем за журналистите и политическите блогъри в бъдеще. & Rdquo;

- & ldquo; Фалшивата увереност вече тормози „специалистите по управление на риска“. Никой, който разглежда големите бази данни, не прогнозира престъпните дейности на финансовия сектор, всичко може да се промени, за да изглежда по определен начин, и всеки канал за данни може да бъде запушен, объркан или замърсен до точката, в която независим анализ е подкопан. Файловете са и ще бъдат изтрити при поискване. В алгоритмите няма морален кодекс, няма етика, няма прилагане. Тези инструменти са само индекси, насочващи към области на по-нататъшни изследвания. Без по-стабилна система за контрол и баланс и независими пазачи, тези системи няма да гарантират вярност към истината. & Rdquo;

- & ldquo; Парите ще стимулират достъпа до големи масиви от данни и силата, необходима за анализ и въздействие върху резултатите от анализа. Крайният резултат в повечето случаи ще бъде по-ефективно насочване към хората с цел да ги накарат да консумират повече стоки, което според мен е отрицателно за обществото. Не бих нарекъл това злоупотреба, но бих го нарекъл самоцелна програма. & Rdquo;

- & ldquo; Данните не са информация и информацията не е знание и знанието не е мъдрост. Провеждайки нещата така, както са били проведени до момента, най-добрата информация ще служи на „еластична“ статистика, визии за неонацистко надмощие, войни, основани на „надеждно разузнаване по отношение на оръжията за масово унищожение“ или фалшиви президентски избори. Нещата с етичния контрол ще стават все по-важни, тъй като силата на Интернет дава сила на някои мъже. & Rdquo;

- & ldquo; Освен ако някои големи политически сътресения не променят баланса на силите в света, Големите данни ще бъдат предимно в ръцете на все по-малката група от богати и могъщи. Тенденцията на хората с огромна мощ е да използват инструменти като Big Data, за да увеличат своята мощ. Следователно, ако настоящата посока на международните властови структури продължи и властта се концентрира все повече в ръцете на малцина, възможностите на Големите данни ще бъдат използвани за допълнително увеличаване на тази сила и няма да бъдат използвани за благото на общността. & Rdquo;

- & ldquo; По-голямата част от Големите данни са и ще продължат да бъдат в ръцете на корпоративни интереси, които по дефиниция са егоистични гадове. & rdquo;

- & ldquo; Големите данни вероятно ще бъдат причина за намалена свобода и поверителност и ще дадат предимства на компаниите, които могат да харчат пари за анализ. & rdquo;

- & ldquo; Безспорно е чудесно време да бъдеш математик, който е развълнуван от тромави масиви от данни. Въпреки че много от тях могат да бъдат използвани в конструктивни, положителни начини за подобряване на живота и услугите за мнозина, Големите данни ще се използват предимно за хранене на хора с реклами въз основа на тяхното поведение и приятели, за анализ на рисковия потенциал за здравето и други форми на застраховане и по същество разделяйте хората и ги излагайте по-интензивно на все по-малко неща. & rdquo;

- & ldquo; Човечеството винаги ще има алчност и корупция и измама и това може да бъде смекчено само чрез проницателен анализ на фактите, открит обмен на информация и логично вземане на решения. & rdquo;

Някои прогнозират, че алгоритмите ще повлияят най-негативно на живота на тези, които вече са в неравностойно положение

Други отговори бяха свързани с тези в предишния раздел, тъй като те изследваха мотивите и поведението на събирачите на данни. Но материалът им се концентрира върху ефекта на големите данни върху онези, които сами по себе си не са мощни.

Фред Щутцман, постдокторант от университета Карнеги Мелън и създател на софтуера Freedom, Anti-Social и ClaimID, каза: & ldquo; Трябва да помним, че големите данни не са пълна леща, особено когато тълкуваме човешкото състояние. & rdquo;

Стив Сойер, професор и асоцииран декан на научните изследвания в университета в Сиракуза; експерт от повече от 20 години изследвания в интернет, компютри и работа, написа, & ldquo; Нашата визия за данните се основава на нашата визия за света и тази визия не е много широкообхватна, когато става въпрос за Big Данни. Склонни сме да подчертаваме париеталните прозрения на определена форма на икономическо мислене и сме склонни да рамкираме социалните анализи чрез форма на мек колониализъм. Подобно пристрастие, съчетано с арогантността на техническата компетентност, ще създаде огромни различия между „това, което казват данните“ и живота на милиарди хора. & Rdquo;

Брайън Харви, преподавател от Калифорнийския университет в Бъркли, отбеляза, & ldquo; Събирането на информация ще бъде от полза за богатите, за сметка на бедните. Предполагам, че за няколко души това се счита за положителен резултат, но двата ви избора трябваше да са & lsquo; най-вече ще са от полза за богатите & rsquo; или & lsquo; ще е от полза най-вече за бедните, & rsquo; а не & lsquo; добро за обществото & rsquo; и & lsquo; лошо за обществото. & rsquo; Няма такова нещо като & lsquo; обществото. & Rsquo; Има само богатство и бедност и класова борба. И да, знам за фермерите в Африка, които използват мобилните си телефони, за да проследяват цените на продукцията в големите градове. Това е чудесно, но не е достатъчно. & Rdquo;

Ebenezer Baldwin Bowles, собственик и управляващ редактор на corndancer.com, писа, & ldquo; С Големите данни идва Великата сила и нито една от тях няма да се използва разумно за общото благо. Целта не е да се разкрие възможност за премахване на недостига сред многото, а да се идентифицира плодородна почва за експлоатация и контрол. & Rdquo;

Пол Макфайт, специалист по онлайн комуникации със седалище в Прово, Юта, каза, & ldquo; Новите медийни канали ще продължат да разделят потребителите и да засилят социалното разделение. Интелигентните хора ще използват информацията добре, но обикновеният човек ще продължи да търси ярки лъскави предмети, които да забавляват. Насилителите ще продължат да злоупотребяват. Предоставянето на достъп до данни не променя моралното поведение. & Rdquo;

Daren c brabham, асистент по комуникации в Университета на Северна Каролина-Чапъл Хил, каза, & ldquo; Нашата зависимост от алгоритмите вече е доказано проблематична, което се доказва от непостоянния характер на фондовите пазари и други неща. Докато продължаваме да насочваме най-добрите и най-ярките математици към професии, фокусирани върху алгоритъма (като финанси), ще продължим да абстрахираме реалния труд и реалните човешки грижи, далеч от реалните последици и обстоятелства. Това също е масов етичен проблем. & Rdquo;

Пол Гарднър-Стивън, сътрудник по телекомуникации от университета Флиндерс, отбеляза, & ldquo; Макар че много ползи ще произтичат от Интернет на нещата, докато нещата остават в притежание на много малко централизирани интереси, това ще представлява голям потенциал за злоупотреба. Историята ни казва, че когато такъв потенциал съществува и злоупотребите могат да направят достатъчно пари и граждански контрол, че такива злоупотреби ще продължат да се увеличават. Разпознаването на лица и проследяването сами представляват простите средства за създаване на почти неизбежна полицейска държава. Шапки и палта като тези, които се носят от Spy-vs-Spy, ще станат по-привлекателни, макар и в крайна сметка да са неефективни, тъй като статистическите и вероятностни алгоритми позволяват проследяването дори на хора, прикрити (буквално или по друг начин). & Rdquo;

Артур Аса Бергер, заслужил професор по комуникации в държавния университет в Сан Франциско, & ldquo; Въпреки че Интернет позволява дисидентите да имат глас, в по-голямата си част те не се чуват по отношение на силата на доминиращите елити, членове на управляващата класа и т.н. . & rdquo;

Франк Одаш, президент на Lone Eagle Consulting, компания, специализирана в интернет обучение за обучаващи се в селските райони, отдалечени и местни жители, написа и & ldquo; Политиката на контрол и политиката на изявите ще продължат да правят богатите по-богати и да намаляват нивата и лишаването от правото до политиката на прозрачност налага отгоре надолу да си партнира смислено отдолу нагоре по видими, измерими начини. Низовият бум на иновациите отдолу-нагоре все повече ще намира нови начини за самоорганизация, както се вижда през 2011 г. от движенията „Окупирайте Уолстрийт“ и „Арабска пролет“. & Rdquo;

Дейвид А. Х. Браун, изпълнителен директор на Brown Governance Inc., консултантски бизнес със седалище в Торонто, Канада, отбеляза, & ldquo; Демократизацията е проблемът; това има огромни последици за социалната структура и социалния ред (нарастващ натиск от страна на „нямащите“ върху „елитите“), както и за неприкосновеността на личния живот, семейството и културата. Голям въпрос без отговор е кой ще контролира големите данни? Който и да контролира информацията, ще има по-голяма сила и влияние и те могат да използват това за положителни или отрицателни резултати. & Rdquo;

Целенасоченото обучение за големите данни може да включва предупреждения, които предвиждат манипулиране на резултатите от анализа на данните; доверителните функции могат да бъдат вградени в проверката на данните

Някои респонденти се чудеха дали някои негативи от Големите данни могат да бъдат смекчени чрез по-сериозно проучване и целенасочено планиране.

Джон Хориган, вицепрезидент на TechNet, изследователска организация, каза, & ldquo; & lsquo; Големи данни & rsquo; е много неоткрита страна за гражданите и политиците и нейният полезен потенциал зависи от правилното управление и образование на гражданите. Техническият сектор обикновено е доста добър в въвеждането на нови приложения по сигурен начин. Но е лесно да се подценява значението на образованието на обществеността какво означава всичко това, не на последно място да се насърчи широкото използване на възможностите на & lsquo; Големите данни & rsquo; (напр. доставка на здравни грижи, управление на енергията в дома). Така че трябва да бъдете внимателни, ако не се предприемат подобни усилия. & Rdquo;

Морийн Хилиард, координатор на програмата за развитие на Върховната комисия на Нова Зеландия и заместник-председател на борда на Тихоокеанския отдел на Интернет обществото, отговори, & ldquo; Големият проблем, свързан с интернет, еДовериеоткъде идва информацията и как се използва. Докато хората знаят кой предлага информацията и могат да се доверят на нейния източник, тогава има по-добро разбиране за света. Доверието в технологията обаче намалява, когато тя се използва неправилно и хората са ощетени в резултат на неправилна комуникация или фалшива комуникация. Обучението за подходящо използване на Интернет, като се възползваме по-гъвкаво от разнообразието на достъпа, което World Wide Web предлага, и сигурността на онлайн информацията по време на финансови транзакции са това, което според мен са големите проблеми за в бъдеще, за да се гарантира, че Интернет се използва подходящо и безопасно и осигурява положителните въздействия, за които има най-голям потенциал. & rdquo;

Хю Ф. Клайн, адюнкт-професор по социология и образование в Колумбийския университет, написа, & ldquo; Ще бъде необходимо да се регулират тези дейности, за да се гарантира, че те се използват в полза на всички народи. Освен това ще е необходимо да се образоваме, за да гарантираме, че можем да разпознаем злоупотреби и измами с самообслужване. & Rdquo;

Анонимен респондент коментира, & ldquo; Данните се злоупотребяват днес по много причини, решението не е да се ограничи събирането на данни, а по-скоро да се повиши нивото на осведоменост и образование за това как данните могат да бъдат злоупотребявани и как да бъдете уверени, че данните са че сте представени справедливо и всъщност отговаряте на въпросите, които смятате, че има. & rdquo;

Джон Келина Monitor Group казва, че интелигентните лица могат да отвърнат на удара, ако управляващите представят погрешно на обществеността какво показват данните. & ldquo; Положителните резултати за & lsquo; Големи данни & rsquo; ще зависи от общата наличност на мощни инструменти за анализиране и визуализация и широко разпространеното плавно използване. Дори ако потребителските и про-потребителските табла за данни са по-малко напреднали от тези, използвани от търговски бизнес и правителствени разузнавателни агенции, способността на отделни лица и малки организации да разработват аналитично строги контриративни разкази, пълни с динамични 3D графики, които се качват в YouTube и се вдигат от CNN може да осигури проверка за пренебрежителното използване на извличането на данни. & rdquo;

Марсел Булинга, футуролог и автор на Welcome to the Future Cloud - 2025 в 100 прогнози,наблюдавани, & ldquo; Големите данни могат да бъдат манипулирани, както и малките данни. Не става въпрос за големи или малки! Става въпрос за вграждане на всички данни с функции за доверие и поверителност. Трябва да разработим & lsquo; Cloud Seal & rsquo; и увийте всички данни в такъв нотариален печат. & rdquo;

Хейууд Слоун, директор на CogniPower, консултантска компания, каза: & ldquo; Това всъщност не е въпрос за интернет или големи данни - въпрос за това кой и колко хора могат да злоупотребяват с него (или нещо друго), умишлено или по друг начин. Това е въпрос, който винаги е налице - следователно има нужда от изравнителни сили, конкуренция, прозрачност, контрол и / или други начини за предпазване от злоупотреба. И тогава бъдете готови да прецените понякога погрешно. & Rdquo;

Изглежда хората си мислят, че знаят повече, отколкото всъщност знаят, но въпреки всичките ни недостатъци, гледането на голямата картина обикновено помага

В допълнение към по-дългите наблюдения на Stowe Boyd, Jerry Michalski и Patrick Tucker, които бяха споделени в началната & ldquo; Преглед & rdquo; от този доклад (на страници 9-12) няколко респонденти написаха разширени и обмислени отговори, които включват историческа перспектива и общи наблюдения за човешката природа и общество.

Кевин Новак, съпредседател на работната група eGov на консорциума за глобалната мрежа, говорител и автор на електронното управление и консултант на Световната банка по инициативата eTransform, отбеляза: & ldquo; Обществото често се оказва в недоумение, когато се опитва да разбере големи проблеми, решения и предмети, предвид разнообразието от среди, действия и мнения в различни култури по света. При това разнообразие често е предизвикателство да се определи кой е най-добрият начин на действие / план за придвижване напред. Нарастващата маса данни може да помогне за по-доброто информиране при вземането на решения, идентифицирането на тенденциите и свързването на битовете за данни, за да се види по-голяма картина от това, което е било известно преди. Големите данни обаче ще предлагат предизвикателства, освен ако не бъдат разработени инструментите, методите и технологиите, които могат да помогнат за свързването на неструктурирани данни заедно, за да разкажат история. Инструментите, методите и технологиите ще бъдат предизвикателството през 2020 г., а не наличността на самите данни. Обществото ще продължи да се бори с неприкосновеността на личния живот. Тъй като все повече и повече от живота ни се архивират и добиват в мрежата, опортюнистите ще продължат да изследват начините да използват наличните данни за свои, не толкова честни средства. Начинът, по който реагираме и управляваме, трябва да продължи да бъде основен фокус в интернет общността до 2020 г. Трябва да разберем предизвикателствата и възможностите, да знаем съществуващите пропуски и да предложим най-добрите шансове за справяне с тях. & Rdquo;

Майкъл Кастенгера, старши преподавател в Градския колеж по журналистика, написа: & ldquo; В един момент футуристите говориха за развитието на „глобален мозък“ чрез интернет. Този сценарий може да изглежда хиперболен, но не и ако правите разлика между определенията на „мозък“ и „ум“. Мозъкът сега създава своя собствена версия на алгоритми, които позволяват разширени корелации и ново разбиране. В продължаващата еволюция на Интернет алгоритмите все повече и повече свързват несъединени данни по начин, който имитира свързващите синапси на мозъка. Тъй като развитието продължава, аналогията може да се направи на интернет, който има автономна и полуавтономна нервна система. Контролът върху това развитие ще бъде държан от държани от големи институции - не само корпорации, но посоката на това развитие ще бъде определена от отделни лица. Дебатът за това какво е естеството на Интернет и какво трябва да бъде той - дебат, който ще настрои хората срещу институциите. Притеснявам се, че индивидуалността ще бъде изгубена от институционална хегемония не поради техните „егоистични планове“, а от самодоволството и приемането на продължаващите лични натрапвания. & Rdquo;

И анонимен респондент отговори: & ldquo; Колкото повече наборите от данни са отворени и достъпни, така и предприемаческите умения в мрежата ще използват тази суровина за различни краища и много пъти те могат да бъдат благотворителни. Ще видим повече визуални изображения на големи масиви от данни, които ще позволят на хората да видят въздействието на своите дейности, докато се играят в други части на света. Големите данни ще се използват за прогнозиране и прогнозиране, ще се играят повече симулации и тези симулации ще помогнат на хората да разберат сложността на нашата корелация помежду си, като същества на тази планета и извън нея. Хората ще се опитат да & lsquo; оправят & rsquo; или & lsquo; игра & rsquo; сценарии, базирани на симулации. Вече видяхме това през последното десетилетие с кризата на Уолстрийт, но системите с такъв размер и сложност са динамични и се саморегенерират. Реализирането на динамични и възникващи системи като естествен ред ще накара хората да осъзнаят глупостта, опитвайки се да играят системи до N-та степен. Ще видим нарастването на по-алгоритмично мислене сред обикновените хора и прилагането на все по-усъвършенствани алгоритми за осмисляне на мащабни финансови, екологични, епидемиологични и други форми на данни. Иновациите ще бъдат хвалени, стига да регистрират проблясък в диапазона от мащабни възникващи явления. & Rdquo;