В Twitter местните новини е трудно да се намерят

Тъй като американците все повече използват социалните медии, изследователите естествено се интересуват от това как данните от тях могат да се използват, за да разберат по-добре как потребителите споделят и обсъждат информация на тези нови платформи. Масата туитове, вариращи от политически коментари до цялостно „настроение“ за компании, продукти или услуги, кара много маркетингови фирми и учени да настояват за прозрения в колективния поток на съзнанието на Twitter.

Но колко точен е Twitter като мярка за обществени настроения и как може да се използва? В изследователския център Pew ние сме специално заинтересовани да експериментираме с ролята на Twitter в новините от 2008 г. Така че, когато стартирахме едногодишен проект за изследване на местните новини в три града през миналата година, тествахме няколко подхода, използвайки данни от Twitter, за да разберем как служи като източник на новини и дава възможност на местните жители да станат участници в него.

Нашата присъда? Докато анализът на Twitter все още е на експериментален етап и данните в Twitter имат ограничения, той може да бъде ценен нов инструмент за разбиране на медийната среда. По-конкретно, намерихме за ценно да разберем как новинарските организации използват Twitter. Местните новини обаче са само една малка тема от много обсъждани в платформата. Това, което ни липсваше, беше опитът да съберем данни за потребителите на Twitter по местоположение.

Ето обобщение на това, което работи и какво не при използването на Twitter за изследвания.

Какво направихме:

Искахме да разберем каква роля играе Twitter като източник на новини за местните жители на три града за проучване на казуси: Денвър, Мейкън, щата Гау и Sioux City, Айова. Това включва проследяване на традиционни новинарски организации в Twitter, като вестници, телевизии и радиостанции, както и на самите създатели на новини, като политици, лидери на общността и държавни служители. За целта най-вече използвахме услугата Gnip за достъп до „firehose“ на Twitter, която се отнася до достъп до всички туитове и метаданни в Twitter.



Вместо да приемаме потребителите на Twitter като прокси за по-голямата им общност, ние просто се отнасяхме към потребителите на Twitter във всеки град като общност сами по себе си. Направихме цялостен одит на доставчиците на новини във всеки град и установихме, че повечето от тях имат акаунти в Twitter. Дори ако относително малка част от населението е в Twitter, използването на Twitter от страна на новинарските организации може да послужи като полезен инструмент за разбиране на начина, по който местната информация се разпространява в общността.

Второ, искахме да разберем дали жителите на всеки град използват Twitter, за да коментират, обсъждат и дори участват в новинарски събития. Експериментирахме с няколко различни метода, преди да се спрем на комбинация от подходи, които биха отговорили най-добре на въпросните въпроси.

Правейки този анализ, ние имахме предвид общите ограничения на използването на Twitter, за да говорим за това какво обществеността мисли, прави или цени. За разлика от представителните телефонни проучвания, които провеждаме, тези в Twitter санепредставител на населението като цяло. Като цяло нашите проучвания показват, че приблизително 23% от възрастните онлайн са в Twitter и че тези, които получават новините си от сайта, са по-млади, по-образовани и по-склонни да притежават смартфон от общото население.

Как направихме анализа:

Първата задача при създаването на извадка от туитове за всеки град беше да се намери надежден начин за генериране на географски граници за туитовете от целевите градове.

Това се оказа предизвикателство, тъй като разглеждането на геотагове или самоидентифицирани местоположения на потребители на Twitter - привидно очевидните решения - не бяха работещи отговори. В Twitter потребителите трябва да се включат, за да имат техните туитове автоматично маркирани с местоположение и много малко го правят; повечето оценки са, че само около 2% от туитовете имат геотагове. Това се оказа вярно и в това проучване: В трите града, изследвани през едноседмичен полеви период, изобщо нямаше почти никакви туитове с геомаркирани.

След това разгледахме самоидентифицираното местоположение на потребителите на Twitter въз основа на техния профил в Twitter. Проучихме извадка от туитове във всеки град и установихме, че повечето потребители или не са попълнили тази информация, или са я попълнили с информация, която не е била полезна. Например „Луната“ и „Космосът“ бяха изключително популярни места. Дори в случаите, когато е имало използваемо място, не е имало ясен начин да се провери дали потребителите действително живеят там, където са казали, че живеят.

Вместо това се обърнахме към техника, която се нарича „вземане на проби от снежна топка“ или „верижна“.

Хейстакът в TwitterТъй като вече бяхме събрали дръжките на Twitter на доставчици на новини във всеки град, извадихме от този първоначален списък на всички туитове всеки маркер на Twitter или потребител, който @ беше споменал или ретуирал дръжката на доставчик на новини през проучвания период от време. Направихме това, защото споменаването или ретуирането на новини показва, че потребителят на Twitter е ангажиран с него, било като потребител на новини или като някой, който иска да разпространи новината. Въпреки че бяхме наясно, не можехме да гарантираме товавсичкоот новите дръжки щяха да бъдат директно свързани с всяка общност, това ни даде отправна точка за допълнително усъвършенстване на пробата.

Тази стъпка увеличи общия брой потребители на Twitter в извадката от няколкостотин на повече от 30 000. И накрая, изследователите изтеглиха всички туитове от всяка дръжка, които бяха идентифицирани или като доставчик на новини, или като потребител на новини през периода от време за всеки град. Това доведе до над 4,7 милиона туитове.

След това допълнително стеснихме тази извадка от 4,7 милиона, за да намерим туитове, свързани с фокуса на проучването за местните новини в Twitter - важна стъпка, защото установихме, че преобладаващото мнозинство от съдържанието в Twitter през изследваната седмица не е по характер.

Опитахме се да прецизираме извадката, като изучихме URL адресите, споделени в Twitter във всеки град и като разгледахме ключови думи. Приблизително 40% от туитовете включват URL или връзка към друга уеб страница. Изследователите създадоха програма, която ще отиде до всяка уеб страница и ще я сканира за ключови думи, които да свързват страницата с всеки град. Използвайки Macon като тестов случай, ние създадохме списък с ключови думи въз основа на столичната статистическа област на Macon (MSA). 26-те ключови думи включваха всички имена на окръзите и градовете, включени в MSA на Macon. На практика тези ключови думи не работиха. Дори тези ключови думи, които бяха специфични за географския район, бяха твърде общи, за да бъдат полезни.

Дори и този метод да е работил, все още съществува проблемът с 60% от туитовете, които не съдържат URL. Неуспехът на стратегията за ключовите думи и издаването на допълнителните 60% от туитовете ни доведоха до последния метод, който използвахме за изследването.

Какво работи:

В крайна сметка решението беше инструмент за анализ на социални медии, наречен Crimson Hexagon, който анализира цялата ни извадка от туитове за най-често срещаните ключови думи и хаштагове. Crimson Hexagon е софтуер, който може да се използва за анализ на големи обеми туитове и извличане на различна информация. В този случай използвахме инструмента за премахване на туитове, които не са от значение за нашите изследвания. Те включват туитове, изпратени от страни извън САЩ и туитове, които не са на английски език.

След като ги премахнахме, използвахме Crimson Hexagon, за да намерим най-често използваните думи и фрази в съдържанието на туитовете. Това ни разкри, че местното новинарско съдържание в Twitter е далеч по-изпреварвано от националните новини и друго съдържание. Ключови думи за местните новини беше практически невъзможно да се намерят с каквато и да е честота.

Въпреки полезността на инструменти като Crimson Hexagon, в крайна сметка открихме най-голям успех с далеч по-малко технически инструмент: хората. Ние просто четем туитове - десетки хиляди от тях - за да намерим местни новини. Този процес също ни позволи да разберем по-добре къде се появяват местните новини и как се споделят.

В комбинация с анализ на съдържанието на местни новинарски източници, нашите констатации показват, че дори това малко местни новини, които се споделят в Twitter, често се различават от това, което се отразява в информационните бюлетини във всеки град. Например в Macon най-споделената история в Twitter досега е за местна група, която се е превърнала в състезание на VH1. Тази история почти не беше отразена изобщо в пресата през изследваната седмица.

Налични са повече технически инструменти за картографиране на големи тенденции в Twitter, като например наблюдение на глобален хаштаг. Но за нашите цели, изследвайки новини в по-малки общности, данните в Twitter бяха толкова оскъдни, че не бяха толкова полезни, колкото се надявахме.