Седмица от живота на популярните канали в YouTube

На тази илюстрация на снимката логото на Youtube се вижда на смартфон. (Снимка илюстрация от Рафаел Хенрике / SOPA Images / LightRocket чрез Getty Images)

Медийният пейзаж се промени преди повече от десетилетие, когато стартира сайтът за видео споделяне YouTube. Обемът и разнообразието от съдържание, публикувано на сайта, е зашеметяващо. Популярността на сайта го прави стартова площадка за изпълнители, фирми и коментатори по всяка възможна тема. И подобно на много платформи в съвременната дигитална екосистема, YouTube през последните години се превърна в огнище на текущи дебати по въпроси като онлайн тормоз, дезинформация и въздействието на технологиите върху децата.


Седмица от живота на популярните канали в YouTubeНа фона на този нарастващ фокус и в опит да продължи да демистифицира съдържанието на този популярен източник на информация, Pew Research Center използва своя собствена техника за картографиране, за да събере списък с популярни канали в YouTube (тези с поне 250 000 абонати), съществували към в края на 2018 г., след това проведе мащабен анализ на видеоклиповете, които тези канали са създали през първата седмица на 2019 г. Центърът е идентифицирал общо 43 770 от тези високо абонатни канали, използвайки процес, подобен на този, използван в нашето проучване на YouTube препоръчителен алгоритъм. Това събиране на данни даде разнообразни прозрения за същността на съдържанието на платформата:

Екосистемата на YouTube създава огромно количество съдържание.Само тези популярни канали публикуваха близо четвърт милион видеоклипа през първите седем дни на 2019 г., общо 48 486 часа съдържание. За да поставим тази цифра в контекст, на един човек, който гледа видеоклипове в продължение на осем часа на ден (без почивки или почивни дни), ще са необходими повече от 16 години, за да гледа цялото съдържание, публикувано само от най-популярните канали на платформата в рамките на една седмица . Средното видео, публикувано от тези канали през този период от време, е било приблизително 12 минути и е получило 58 358 гледания през първата седмица на сайта.


Като цяло тези видеоклипове са гледани над 14,2 милиарда пъти през първите седем дни на платформата.1

YouTube е глобален феномен и най-популярните му канали публикуват значително количество съдържание на езици, различни от английския.Използвайки комбинация от ръчно етикетиране и машинно обучение, Центърът категоризира видеоклипове въз основа на това дали съдържат текст или звук на език, различен от английския. Резултатите от този анализ илюстрират глобалния характер на платформата YouTube. Малко над половината от тези канали (56%) публикуваха видео през първата седмица на 2019 г., а по-голямата част от тези активни канали (72%) публикуваха поне един видеоклип, който беше частично или изцяло на език, различен от английския. Като цяло само 17% от почти четвърт милиона видеоклипа, включени в този анализ, са изцяло на английски език.

Малък дял от високоактивни създатели създадоха по-голямата част от съдържанието, публикувано от тези популярни канали.Както е случаят с много онлайн платформи (като Twitter), относително малък дял от каналите са отговорни за по-голямата част от съдържанието, публикувано през периода на проучването. Само 10% от популярните канали, идентифицирани в картографирането на Центъра, са произвели 70% от всички видеоклипове, публикувани от тези канали през първата седмица на 2019 г. По същия начин, 10% от популярните видеоклипове с най-много гледания през този период са отговорни за 79% от всички показвания, които са отишли ​​на ново съдържание, публикувано от тези канали.

Общият брой канали с голям абонат се е увеличил драстично през втората половина на 2018 г.Процесът на картографиране на Центъра идентифицира 9 689 канала, преминали прага от 250 000 абонати между юли 2018 г., когато Центърът последно е извършил анализ на данните в YouTube, и декември 2018 г., когато данните са актуализирани за този анализ. Това представлява 32% увеличение на общия брой популярни канали през този период. По същия начин броят на абонатите на съществуващи популярни канали, които вече са били идентифицирани към юли 2018 г., се е увеличил средно с 27% за същия период.



В допълнение към това по-широко събиране на данни, Pew Research Center проведе и отделен анализ на съдържанието на видеоклиповете на английски език, публикувани от тези популярни канали през първата седмица на 2019 г. (общо 37 079 видеоклипа отговарят на това описание). Центърът използва човешки кодери, за да идентифицира основната категория или тема на всеки видеоклип (като видео игри, потребителски технологии или текущи събития и политика), а също така изследва ключовите думи, използвани в заглавията и описанията на видеоклипове, за да идентифицира широко използвани и свързани думи с по-голям брой гледания спрямо други видеоклипове. Някои от ключовите открития от този анализ включват:


Видеоклиповете, насочени към деца, бяха много популярни, както и тези, които включваха деца под 13-годишна възраст - независимо от предназначението им.Само малък дял от видеоклиповете на английски език, публикувани от тези популярни канали през периода на проучването, са изрично предназначени за деца (въз основа на консенсус на човешки програмисти). Но тези, които обикновено са по-дълги, получават повече гледания и идват от канали с по-голям брой абонати спрямо видеоклиповете с широка аудитория. По-общо казано, видеоклипове с участието на дете или деца, които изглежда са били под 13-годишна възраст - независимо дали въпросният видеоклип е насочен изключително към деца или не - са получили средно близо три пъти повече гледания от други видове видеоклипове. И много малката група видеоклипове, които бяха насочени директно към млада аудитория исъщос участието на дете под 13-годишна възраст са по-популярни от всеки друг тип съдържание, идентифицирано в този анализ, измерено чрез броя на гледанията.

Трябва да се отбележи, че YouTube изрично заявява, че платформата не е предназначена за деца под 13-годишна възраст. YouTube предоставя платформа YouTube Kids с подобрен родителски контрол и подбрани видео плейлисти, но анализът в този доклад се фокусира върху YouTube като цяло.


Видеоклиповете на английски език, свързани с текущи събития или политика, публикувани от тези популярни канали, обикновено имат международен (а не американски) фокус.Видеоклиповете, изрично свързани с текущи събития или политика, са относително често срещани, като съставляват 16% от всички видеоклипове на английски език, качени през периода на проучване. Повечето от тези видеоклипове обаче са с международен фокус и не споменават събития, проблеми или мнения, свързани със Съединените щати. Докато каналите, които публикуваха едно или повече американски текущи събития или политически видеоклипове бяха особено активни - публикувайки средно 63 видеоклипа през седмицата, американските текущи събития или политически видеоклипове съставляваха само 4% от всички видеоклипове, публикувани от популярни канали като цяло .

Видеоклиповете за деца - както и тези с деца - получиха голям брой гледания по време на периода на проучване в сравнение с други актуални категории

Съдържанието, включващо видеоигри, беше част от популярните канали в YouTube.Междувременно около 18% от видеоклиповете на английски език, публикувани от популярни канали през периода на проучване, са свързани с видео игри или игри. Съдържанието за видеоигрите беше един от най-популярните жанрове на съдържание, измерено чрез общия брой гледания през седемте дни от периода на изследване, и тези видеоклипове също бяха склонни да бъдат много по-дълги от другите видове видеоклипове.

Някои ключови думи със заглавие на видео бяха свързани с увеличен брой показвания.Анализ на заглавията на видеоклипове на английски език установява, че определени ключови думи са били свързани с много по-голям брой показвания в сравнение с други видеоклипове през периода на проучването. Някои от тях сочат към ориентацията на платформата към развлечения. Например видеоклиповете, в които се споменават думи като „Fortnite“, „шега“ или „най-лошото“, са получили повече от пет пъти повече показвания в медианата, отколкото видеоклипове, в които не се споменават тези думи. Други бяха с по-съществен характер. Например, използването на думата „Тръмп“ в заглавията на видеоклиповете е свързано със значително увеличаване на средните възгледи сред видеоклиповете за американските текущи събития или политика. Всъщност около 36% от видеоклиповете за текущи американски събития или политика, публикувани от тези популярни канали през периода на проучването, споменават думите „президент“ или „Тръмп“ в заглавията си.

Кръстосаното популяризиране на видеоклипове с други канали в социалните медии беше едновременно широко разпространено и свързано с увеличаване на показванията.Седем на десет от тези видеоклипове споменават други известни социални медийни платформи като Instagram или Twitter в описанието си (или във връзки, или в самия текст), и тези, които са получили повече гледания, отколкото видеоклипове, които не са свързани към други платформи.


Горните констатации се основават на анализ на канали в YouTube с най-малко 250 000 абонати и видеоклиповете, които те публикуваха през седмицата от 1 до 7 януари 2019 г., надграждайки предишното проучване на Центъра за алгоритъма за препоръки на YouTube. Използвайки няколко рекурсивни и рандомизирани метода, ние прекосихме милиони видео препоръки, предоставени чрез API на YouTube, и идентифицирахме възможно най-много уникални канали. Към януари 2019 г. са намерени общо 1 525 690 канала, 43 770 от които имат поне 250 000 абонати. За целите на това проучване те се определят като „популярни канали“. Използвайки този списък с популярни канали, изследователите събраха всяко видео, публикувано на тези канали през първата седмица на 2019 г., и проследиха всеки от тях в продължение на седем дни след публикуването им.

По същия начин, по който изследването на анкетата включва известна степен на несигурност и грешка, проектите за „големи данни“ също са обект на потенциална грешка. Въпреки че изследователският център на Pew прави всеки опит да извърши този анализ строго и точно, има няколко различни начина, по които може да е въведена умерена грешка. Констатациите, представени тук, трябва да се разглеждат с оглед на този потенциал за грешка.

  • Определение на популярни канали.Центърът избра минимален праг от 250 000 абонати за каналите, включени в този анализ. Това ограничение гарантира, че анализът е фокусиран върху най-популярните канали на сайта, като същевременно ограничава анализа до управляем брой канали, които могат да бъдат наблюдавани и проследявани своевременно. Възможно е обаче използването на по-нисък (или по-висок) праг и включването на повече (или по-малко) канали да са дали различни резултати.
  • Липсват популярни канали.Тъй като няма официален, изчерпателен списък с канали в YouTube (популярни или по друг начин), Центърът използва собствена техника за картографиране, за да търси и идентифицира канали. Този процес включваше многократно следване на видео препоръки от един канал на друг в продължение на почти една година, докато вече не можахме да идентифицираме допълнителни канали с повече от 250 000 абонати. Възможно е този процес да не е успял да идентифицира всички популярни канали в YouTube, но доказателствата сочат, че броят на липсващите канали вероятно ще бъде незначителен. През последните шест месеца на картографиране на каналите между юли и декември 2018 г. списъкът с популярни канали, които бяхме идентифицирали, се разшири с 44% - от 30 481 на 43 770. По-голямата част от тези допълнения съставляват известни канали, които са добавили нови абонати през този период. Само 12% от новите канали не са били идентифицирани преди това от нашия процес на картографиране.
  • Проблеми с API на YouTube.По време на процеса на събиране на данни исканията към интерфейса за програмиране на приложения на YouTube (API) понякога се провалят поради различни причини. В резултат на това не успяхме да уловим 4% от времевите печати на видеоклипа, които бяхме възнамерявали да съберем. Такова хълцане не е необичайно при работа с API и може да се дължи на грешки, проблеми с интернет връзката, промени в настройките за поверителност, направени от собствениците на канали, или просто защото някои видеоклипове бяха премахнати през седмицата. Тъй като тези грешки бяха спорадични и изглеждаха случайно, Центърът успя да използва методи за оценка, за да попълни повечето от липсващите стойности. Въпреки че това доведе до малка грешка при сближаване, въздействието му върху представените тук констатации трябва да бъде незначително.
  • Погрешна класификация на езика.Тъй като беше нереалистично за хората да изследват директно близо четвърт милиона видеоклипове, публикувани от тези канали, Центърът обучи персонализиран модел за машинно обучение, за да автоматизира процеса на класификация дали дадено видео е на английски или не. В сравнение с извадка от видеоклипове, кодирани от изследователи от Центъра, моделът за класификация постига 97% до 98% точност по време на различни тестове. Въпреки това, 4% до 9% от видеоклиповете, които той е означил като „английски“, съдържат съдържание на други езици, а моделът също така погрешно класифицира 7% до 8% от видеоклиповете, които човешките програмисти са идентифицирали като английски. Видеоклиповете, които са неправилно етикетирани като английски от модела, по-късно са премахнати от човешки програмисти по време на анализ на съдържанието, но е вероятно малък набор от английски видеоклипове да бъдат изключени от анализа поради грешка в класификацията.
  • Погрешна класификация на кодера.Pew Research Center използва човешки кодери, за да класифицира съдържанието на англоезичните видеоклипове, разгледани в това проучване. Изследователите от Центъра сами обозначават малка извадка от видеоклипове, докато останалите хиляди са кодирани от три отделни кодера на платформата за краудсорсинг на Mechanical Turk на Amazon. След това за всеки видеоклип съгласувахме резултатите от трите кодера, използвайки прагове, които максимизираха до каква степен краудсорсираните резултати се съгласиха с изследователите на Центъра. Докато съгласието обикновено беше високо, все още има вероятност да възникнат умерен брой разногласия и погрешни класификации, тъй като изучаваните тук понятия - такива, които се квалифицират като „детско съдържание“ - по своята същност включват известна степен на субективност.
  • YouTube непрекъснато се променя.Видеоклиповете, анализирани в този отчет, представляват тези, публикувани от канали с определен брой абонати за определен период от време. Оттогава много канали може да са спечелили или загубили абонати, навиците за публикуване на популярни канали може да са се променили и навиците за гледане на техните абонати. Оттогава YouTube също направи промени в своите правила относно видовете съдържание, които са приемливи за публикуване. Поради тези и много други непрекъснато променящи се фактори, представените тук констатации могат или не могат да представляват активността на популярните канали по друго време в миналото, настоящето или бъдещето.