Беларусь
  • 632
  • Аналіз праўладных каментароў на форумах TUT.BY



    Практычнае ботаведзенне, альбо аналіз праўладных каментароў на форумах TUT.BY


    Аляксандр Казлоў: a.v.kazlou.gmail.com Дадзеныя і код для рэплікацыі у адкрытым доступе
    Кароткія высновы
    * Нікі з ніжнім падкрэсліваннем, нізкая колькасць папярэдніх каментароў, а таксама істотнае перавышэнне колькасці дызлайкаў над колькасцю лайкаў з'яўляюцца адметнымі маркерамі 'праўладнага' характару каментароў на форумах TUT.BY.

    * Абсалютная большасць праўладных каментароў пішуцца з 11.00 па 14.00.

    * Не гледзячы на адсутнасць розніцы ў колькасці каментароў на аднаго карыстальніка, праўладныя каментары з розных акаўнтаў маюць значна больш гамагенную (альбо нізкаварыятыўную) сінтаксічную структуру — у іх актаўна ужываюцца дэфісы, коскі, а таксама прапісныя літары ў пачатку сказаў.

    Уводзіны
    Напэўна, амаль кожны, хто чытаў каментары на форумах TUT.BY заўважаў феномен масавых, аднатыпных каментароў у падтрымку дзеючай улады. Дадзены тэкст з'яўляецца спробай прааналізаваць пласт такіх каментроў, звяртаючы ўвагу на такія асаблівасці, к характарыстыкі іх аўтараў, лінгвістычную структуру і некаторыя іншыя. Для гэтай мэты была створана база дадзеных, куды ўвайшлі першыя 50 каментароў з кожнай навіны пад тэгам Александр Лукашенко у перыяд з 15 студзеня па 15 сакавіка 2017 года, калі агульная колькасць каментароў да навіны перавышала 50. Усяго ў базу трапілі 1323 каментары (усе дадзеныя па стане на 21 сакавіка 2017).

    Вызначаем who is who
    Як ж выглядае аўтар аднатыпных праўладных каментароў (альбо, для эканоміі месца, бот), сыходзячы з базавай гіпотэзы, што яны сапраўды існуюць? Зразумела, што як ступень аднатыпнасці, так і ступень праўладнасці з'яўляюцца вельмі суб'ектыўнымі катэгорыямі. Тым не меней, на падставе аналізу пэўных ускосных чыннікаў, можна з даволі вялікай ступенню дакладнасці класіфікаваць такія каментары, чым мы зараз і займемся.

    Так, даволі часта адзначаецца, што праўладныя каментары пішуцца ад імя карыстальнікаў, у ніках якіх прысутнічае сімбал ніжняга падкрэслівання. З улікам спецыфікі сістэмы стварэння нікаў на TUT.BY, гэта наўрад ці можа лічыцца ўнікальнай рысай. Тым не меней, існуе моцная асацыяцыя паміж наяўнасцю ніжняга падрэкслівання ў ніках і тым, як каментары ацэньваюцца — так, сярэдні памер нета ацэнак (лайкі мінус дызлайкі) каментароў ад карыстальнікаў без ніжняга падкрэслівання ў ніках складае 93.17, тады як для каментроў карыстальнікаў, азораных дадзеным сімбалам, дадзеная велічыня складае 34.6. Шанец, што такая розніца ў структуры размеркаванняў двух груп узнікла выпадковым чынам роўны ~0.00000000000004405% (падрабязней пра метад ацэнкі можна пачытаць тут). Таксама з графіку ніжэй можна заўважыць, што нікі з ніжнім падкрэсліваннем маюць больш працяглы хвост негатыўных ацэнак — менавіта на іх абрушваецца праведны гнеў тутбаеўскага каментатара.

    Такім чынам, можна лічыць наяўнасць ніжняга падкрэслівання адметным сімбалам тутбаеўскага бота. Але для таго, каб забяспечыць больш высокую планку, у фінальную катэгорыю бот-каментароў трапілі толькі каментары ад карыстальнікаў з меньш чым 583 паведамленнямі (медыяна па ўсім масіве), калі колькасць дызлайкаў перавышае колькасць лайкаў у 10 ці больш разоў. Дадзеная межы, безумоўна, з'яўлецца арбітральнымі, і такім чынам не з'яўляюца ні неабходнымі, ні дастатковымі, каб катэгарызаваць каментары ўмоўных ботаў. Аднак, як сведчыць скрыншот-прыклад ніжэй, менавіта такая камбінацыя з'яўляецца тыповай для праўладных каментароў на форумах TUT.BY.



    Такім чынам, сукупны масіў каментароў быў падзелены паміж ботамі і не-ботамі як 100 і 1215 каментары ў адпаведнасці. Пры гэтым, на аднаго бота прыходзіцца 1.61 каментары, тады як на аднаго звычайнага карыстальніка — 1.76, што не з'яўляецца статыстычна значным адрозненнем

    Bots never sleep (насамрэч не)
    Як дэманструе графік ніжэй, у тутбаеўскіх ботаў даволі спецыфічны жыццёвы цыкл: асноўная маса іх каментароў прыходзіцца на перыяд з 11.00 да 14.00, у той час як каментары астатніх карыстальнікаў адносна прапарцыйна размеркаваны цягам усяго дню. Пры гэтым, у перыяд з 15.00 па 20.00 колькасць каментароў максімальна нізкая, а у перыяд з 21.00 па 5.00 каментары цалкам адсутнічаюць.



    Сінтаксічныя асаблівасці
    Наступным крокам варта звярнуць увагу на сінтаксічную структуру бот-каментароў. Так, размяжуем наш аналіз паміж знакамі прыпынку, якія пазначаюць мэту і інтанацыю — клічнік і пытальнік, і іншымі сінтаксічнымі элементамі — коскай, дэфісам, а таксама схільнасці пачынаць сказы з маленькай літары. Частата ўжывання той ці іншай сінтаксічнай адзінкі можа лічыцца маркерам індывідуальнага стылю асобы. З улікам ідэнтычнай колькасці каментароў на душу бота і на душу звычайнага карыстальніка, у якасці нулявой гіпотэзы можна чакаць адсутнасць статыстычнай розніцы у размеркаванні сінтаксічных элементаў паміж гэтымі двума групамі. У выпадку прапісных літар у пачатку сказаў будзе ацэньвацца частотнасць. У выпадку іншых сінтаксічных адзінак ацэнка будзе праводзіцца з папраўкай на даўжыню каментароў



    Як паказвае аналіз, у бот-каментарах нашмат радзей сустракаюцца пытальнікі, пры прыкладна аднолькавай колькасці клічнікаў, у параўнанні са звычайнымі карыстальнікамі. Кажучы прасцей, тутбаеўскія боты не схільныя задаваць пытанні. Але яшчэ больш цікавая сітуацыя назіраецца з размеркаваннямі іншых сінтаксічных элементаў. Так, аўтары бот-каментароў нашмат часцей злаўжываюць коскамі, дэфісамі, а таксама маюць схільнасць пачынаць каментары з маленькай літары. З улікам узгаданай вышэй структуры сярэдняй колькасці каментароў на аднаго карыстальніка, дадзенаму назіранню можна даць два тлумачэнні:

    * Карыстальнікаў, якія маюць сукупна меньш за 583 каментары, ніжнія падкрэслівання ў ніках і якія атрымліваюць моцна негатыўныя ацэнкі сваіх каментароў, аб'ядноўвае ўнікальны сінтаксічны стыль.

    * Большая гамагеннасць (альбо меньшая варыяцыя) сінтаксічнай структуры праўладных каментароў абумоўлена меньшай колькасцю рэальных людзей за колькасцю акаўнтаў, з якіх гэтыя каментары публікуюцца.

    Для таго, каб ацаніць верагоднасць першай гіпотэзы аналіз быў дапоўнены 'плацэба'-выбаркай, у якую ўвайшлі каментары, прапорцыя лайкаў да дызлайкаў да якіх перавышала +1.25 стандартныя дэвіяцыі, каб забеспечыць падобныя памеры выбарак (n = 101). Логіка ў дадзеным выпадку заключана ў тым, што калі экстэрнальныя ў дачыненні да сінтаксічных асаблівасцяў характарыстыкі, такія як ацэнка каментароў іншымі карыстальнікамі, маюць статыстычную асацыяцыю з гэтымі сінтаксічнымі асаблівасцямі, гэта можа назірацца і ў іншых выпадках. Такім чынам, параўнанне паміж сінтаксічнымі структурамі каментароў з высокай пазітыўнай ацэнкай і астатнім масівам каментароў (мінус бот-каментары) дазволіць праверыць дадзеную гіпотэзу. Вынікі аналізу прадстаўлены ў табліцы ніжэй.

    Як можна бачыць з дадзенай табліцы, меншае ўжыванне пытальнікаў з'яўляецца характэрным як для бот-каментароў, так і для плацэба-каментароў, аб чым сведчыць статыстычна значнае (меньш .05) p-value (Падрабязней пра інтэрпрэтацыю гэтага параметру можна пачытаць тут альбо тут ). Такім чынам, гэта не дазваляе лічыць меншае ўжыванне пытальнікаў спецыфічнай рысай бот-каментароў.

    Прынцыпова іншая сітуацыя назіраецца ў размеркаваннях астатніх сінтаксічных адзінак. Так, статыстычна адрозная ў параўнанні з астатнім масівам каментароў частата ўжывання першай прапісной, дэфісаў і косак з'яўляецца ўнікальнай рысай толькі бот-каменароў. Размеркавання гэтых сінтаксічных элементаў для плацэба-каментароў не адрозніваецца ад каментароў звычайных карыстальнікаў. Пры гэтым, розніца ў параметры p-value для бот-каментароў і плацэба-групы велізарная — ад 112 да 1.5 міліярдаў разоў.

    Заключэнне
    Такім чынам, можна адзначыць дзве асноўныя асаблівасці праўладных каментароў на форумах TUT.BY: 1) яны пішуцца ў перыяд з 11.00 па 14.00, 2) Яны маюць нашмат больш гамагенную сінтаксічную структуру як у параўнанні з агульным масівам каментароў, так і ў параўнанні са сваёй супрацьлегласцю — найбольш пазітыўна ацэненымі каментарамі. З улікам індуктыўнасці дадзенага аналізу, а таксама прынцыповай немагчымасці 100% элімінацыі альтэрнатыўных тлумачэнняў, гэта не можа лічыцца дакладным доказам таго, што пад дзясяткамі нікаў з 11 па 14 невялікая колькасць чалавек страчыць на форумах TUT.BY праўладныя каментары. Тым не меней, камулятыўна, атрыманыя ў дадзеным даследванні вынікі выглядаюць досыць пераканаўча.

    5 комментариев

    avatar
    Ольгино местного розлива))) Интересно, это у них доп.нагрузка вместо обеда? Учитывая время с 11 до 14 — весьма вероятно)) Они хоть с разных айпишников пишут, или не заморачиваются даже такими мелочами? И где у них гнездо? В ОАЦ сидят в open-space, или в каждом отделе КГБ нашли по 2-3 добровольца за лишний шницель?
    0
    avatar
    В Ольгино номерные, а у нас нижнеподчеркнутые шунявки.

    Я вот иногда хожу в комменты тутбая посмотреть мнения народа.
    С этими ботами раньше кое-кто соглашался.
    Так вот в последнее время — они реально выпадают. Минусуют их по-черному.
    Лукашенко самый лучший!
    Лукашенко лучше всех!
    0
    avatar
    А я думаю, чего-то меня здесь в последнее время минусуют. *lol* Оказывается это «незримые» тутбаевцы набежали и по привычке настрочили мне за нижнее подчеркивание в нике, видимо даже не особо вдаваясь в суть написанного.
    Пусть лучше будут эти тролли, потому что если информационные идеолухи поймут, что битва в онлайне уже проиграна, то закроют этот тутбай нафиг, или сделают филиалом какой-нибудь совбелии.
    0
    avatar
    Что характерно, емнип, у меня на тутбае тоже ник с подчёркиванием *lol* *lol* *lol*
    0
    avatar
    Самое смешное, что еще 2-3 года назад, когда экономическая и социальная обстановка в Беларуси была весьма спокойной и управляемой, на ТУТ БАЙ уже зверствовали и остервенело «унтерпришибействовали» свои, местечковые модераторы--держиморды…
    Кто заходил тогда на ТУТ БАЙ, тот помнит такую одиозную кликуху, как «максей»…
    Тупость и остервенелость этого холуя от спецуры была настолько дикой, что даже ТУТ БАЕвское начальство его «сквитировало»…
    Одиозный «максей» исчез, но ТУТ БАЕвская начальница Ольга Сытько сохранила и развила держимордовские порядки на ТУТе…
    Меня «банили» только за цитирование прямых выдержек из публичных выступлений гр. А.Г.Лукашенко.
    Поражала тупая остервенелость «модеров» от ТУТ БАЙ…
    Доводилось видеть групповые фотографии модеров с ТУТ БАЙ.
    Внешне это были вроде благопристойные и даже приличные люди…
    Но вот их служебная суЧность временами просто поражала.
    Поэтому нисколько не удивляюсь, что на ТУТ БАЙ сегодня панует серость и злобная упАртость в комментах по событиям в Беларуси.
    Только я все равно удивляюсь…
    А где и с кем жить собрались эти же «модеры» с ТУТ БАЙ, если у них такое озверение против инакомыслия на сайте ??
    Ведь молодежь и трезво мыслящие белорусы получают информацию в том числе и с ТУТ БАЙ…
    И если думающие люди уезжают из Беларуси в том числе и потому тоже, что не видят для себя житейских перспектив в Беларуси, то «модеры» с ТУТ БАЙ останутся здесь жить с держимордами и дармоедами в черной униформе, которые сегодня избивают всех неугодных этой власти на улицах Минска и других городов Беларуси.
    Выедут из Беларуси все неугодные власти, тогда эти черно-мундирные опричники доберутся и до «модеров» с ТУТ БАЙ и до самого хозяина ТУТ БАЙ.
    Вы хоть судьбу Александра Фадеева заново перечитайте, гражданка «Казбич» со товарищи, когда будете с гыгыканьем снова крестить и удалять «крамольные» комменты с лент «ТУТ БАЙ…
    +1
    У нас вот как принято: только зарегистрированные и авторизованные пользователи могут делиться своим мнением, извините.