Википедия:Как разбирать завалы при патрулировании

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Введение[]

Сначала напомним, о чём идёт речь. Патрулирование (англ. flagged revisions) — первичная проверка качества статей. Патрулированная статья — это, грубо говоря, статья без очевидных недостатков — в ней нет текстов, явно нарушающих авторские права; она не подпадает под быстрое удаление; она не была только что вандализирована; в ней есть категории, не используются удалённые шаблоны, а серьёзные недостатки помечены шаблоном {{rq}}. Вопреки распространённому мнению, статьи без источников и интервик тоже могут быть отпатрулированы. Подробнее это расписано в правилах. При патрулировании не требуется проверка статьи на истинность информации — очень грубо говоря, если там не написана явная чушь, то можно её патрулировать.

В нашем разделе патрулирование было введено в январе 2008 года после недолгой тестовой фазы, вторым из всех разделов фонда Викимедиа после Немецкой Википедии. Это было так называемое «старое патрулирование» — можно было патрулировать лишь новые статьи (выбрав их из списка новых статей) и только один раз. Как только статья в списке новых помечалась «белым», или, оставаясь «жёлтой», уползала за пределы списка (устарев на месяц), её нельзя было больше патрулировать. Затем, после довольно долгих перипетий, среди которых была заявка в Арбитражный комитет, были приняты новые правила патрулирования и изменён механизм. Этот механизм и правила действуют до сих пор. Теперь патрулировать можно каждую правку. Если какая-то правка отпатрулирована, то считается, что состояние статьи, отвечающее этой правке, в порядке. Независимо от того, что было до и после правки.

На январь 2008 у нас было около 220 тысяч статей; сегодня (7 апреля 2016), в нашем разделе 1,3 миллиона статей[1]. Из этого не прошли первичное патрулирование сравнительно малое число статей, около 49 тысяч[2] — то есть их никто и никогда не патрулировал, ну, или в очень небольшом числе случаев, патрулировали, а пометку о патрулировании потом сняли. Около 225 тысяч первичное патрулирование прошли, но последняя версия у них не патрулирована[2]. Давайте разберёмся, что это означает, и как помочь разобрать эти 225 тысяч статей.

Сначала давайте поймём, почему их вообще нужно разбирать. Дело в том, что, если у статьи последняя версия не патрулирована, то это может означать что угодно. Например, что кто-то навандалил, или залил плагиат, а его вклад не откачен. Такое бывает редко, но вот что бывает всегда — на вкладке сверху у такой статьи показываются две версии сразу: стабильная (последняя патрулированная) и черновик (просто последняя). Большинству редакторов, естественно, неприятно, когда их правки уходят в «черновик». Кроме того, есть небольшое количество статей — они называются «стабилизированными» — когда непатрулированные правки вообще не показываются. Если редактор внёс правку в такую статью, а флагов патрулирующего или автопатрулируемого у него нет, то придётся ждать, пока кто-то придёт и отпатрулирует. Как правило, стабилизированные статьи — либо высококачественные статьи, когда велика вероятность того, что статья будет испорчена случайной правкой, или популярные статьи, которые часто вандалят или вносят в них недостоверную информацию.

Как легко видеть, ситуация постоянно улучшается, по крайней мере, в процентном исчислении: так, если бы мы не включили патрулирование в январе 2008, у нас бы сейчас было более миллиона непатрулированных статей, а так у нас только 225 тысяч — менее 20 % — а ни разу не проверялись менее 4 % статей. Тем не менее, количество устаревших патрулированных страниц постоянно растёт[3]. На самом деле у нас ещё очень много статей, которые совсем легко отпатрулировать. Действительно проблемные статьи, по моим наблюдениям, составляют лишь малую часть.

Стабилизированные статьи[]

Стабилизированные статьи нужно разбирать в первую очередь, так как именно там новые правки не видны читателям. Вот так можно посмотреть, какие стабилизированные страницы не патрулированы на последней версии. Сейчас таких около тысячи. Можно поставить некоторые из них к себе в список наблюдения и по мере появления непатрулированных правок (они в списке наблюдения показаны красным восклицательным знаком) просто их патрулировать либо отменять.

Как найти статьи для патрулирования[]

Во-первых, в вашем списке наблюдения время от времени появляются непатрулированные правки. Не всегда, но довольно часто их можно просто отпатрулировать. Иногда можно пройти по всей статье, убедиться, что она отвечает требованиям, и её тоже отпатрулировать.

Во-вторых, вы могли сами написать статьи, про которые вы точно знаете, что в них нет плагиата, и всё в порядке с оформлением. Пройдитесь по ним и отпатрулируйте. Первое, что я сделал, получив флаг (точнее, после того, как были приняты новые правила патрулирования — флаг у меня к тому времени давно был, я являюсь одним из первых патрулирующих нашего раздела) — прошёл по тем статьям, которые писал сам, или которые много правил, и отпатрулировал их все.

В-третьих, если вы интересуетесь какой-то тематикой, можно патрулировать статьи этой тематики, ходя по категориям. В каждой категории слева сверху стоят ссылки на список непатрулированных статей в ней и на список устаревших непатрулированных статей. Так, однажды я за несколько дней таким образом первично отпатрулировал все статьи о станциях метро (их было несколько сот, но по большей части стабы). Так как участники без флага автопатрулируемого у нас часто и пишут новые статьи, и редактируют старые, число непатрулированных статей в категориях может увеличиваться, так что категории можно посещать регулярно. Для поиска в подкатегориях (чтобы сразу видеть, что внутри большой категории патрулировано, а что нет), есть два полезных инструмента с тулсервера:

Эти инструменты позволяют искать вглубь дерева категорий, причем глубину можно задавать. Очень полезные инструменты для работы над статьями в «своей» области или любой интересующей категории. Вдобавок, новый CatScan2 тоже умеет отбирать статьи с непатрулированной последней версией.

Есть ещё три способа, о которых я расскажу отдельно.

По списку устаревших патрулированных[]

Список устаревших патрулированных статей находится тут. Число в скобках означает, сколько дней назад была сделана первая непатрулированная правка. Эти числа растут в реальном времени: через день все они будут на единичку больше. Если отпатрулировать более позднюю правку, число уменьшается, и статья уходит в этом списке вниз (обычно вообще уходит с первой страницы). Если её отпатрулировать на последней версии, она исчезает из списка. Если статья была патрулирована на последней версии, а потом в неё внесли непатрулированную правку, она попадает в конец списка, а потом движется в нём «вверх», пока её кто-нибудь не отпатрулирует.

По первой странице видно, что на конец марта 2013 года первая статья имеет задержку 830 дней.

Патрулирование таких устаревших статей обычно не очень сложная работа, но она требует аккуратности. Сначала надо посмотреть статью и убедиться, что с ней всё в порядке. Потом пойти по истории правок, начиная от патрулированной версии, и смотреть, что там тоже всё в порядке — то есть не вносили копивио и не вандалили. При обнаружении добавления массива текста следует воспользоваться интернет-поисковиком и проверить, находились ли фрагменты добавленного текста в Интернете на момент до добавления его в Википедию. Часто анонимы любят исправлять цифры, это, пожалуй, самый труднообнаружимый вандализм. За последнюю неделю мне из примерно сотни статей попалось лишь три, где явно было неоткаченное копивио — пришлось его из последней версии убрать. Но с большинством статей проблем нет. Ещё одно обстоятельство, на которое надо обращать внимание — в старых версиях (даже в патрулированных) иногда присутствуют ссылки на удалённые файлы и шаблоны. По возможности старайтесь при патрулировании дойти до такой версии, где их уже нет — в стабильной версии они смотрятся не очень хорошо.

По списку непатрулированных[]

Список никогда не патрулировавшихся страниц (или страниц со снятой отметкой патрулирования) находится на этой служебной странице. Интерфейс позволяет задавать категорию поиска и выбирать пространство имён. Хотя данные на этой странице всегда актуальные, главное неудобство состоит в том, что сортировка страниц возможна только по алфавиту, а не по дате, хотя в большинстве случаев при «сплошном» патрулировании более полезно начинать с самых старых непатрулированных страниц. Поэтому использовать эту страницу рекомендуется для патрулирования какой-либо категории, или для патрулирования в пространстве имён с заведомо небольшим количеством непатрулированных страниц (к таким пространствам имён обычно относятся пространства шаблонов и категорий).

Упомянутый выше недостаток (невозможность сортировки по дате) позволяет обходить набор страниц, созданный в пространстве имён участника Vlsergey и регулярно (раз в час) обновляемый ботом:

В каждом из этих списков находится самая старая тысяча непатрулированных страниц, попадающих под какой-либо критерий. Начинать патрулировать их лучше с вершины списка. Главной проблемой при патрулировании самых старых статей является поиск и выявление нарушения авторских прав, поэтому рекомендуется очень тщательно сверять источники и проверять историю правок каждой патрулируемой статьи.

По списку новых страниц[]

Это, пожалуй, самая тяжёлая работа. Список новых страниц находится здесь, и после знакомства с его содержимым обычно хочется вызвать санитаров. По моему опыту, если статью не отпатрулировали в первые два дня после её создания, то её уже и не отпатрулируют, пока кто-нибудь на неё не наткнётся. Так как совсем свежие статьи ещё часто дорабатывают, лично я начинаю с самого низа первой страницы и иду вверх. Большинство страниц там — стабы с не вполне ясной значимостью и с отсутствием какого-либо оформления. Сначала смотрим на значимость, если нет — помечаем к КБУ или выносим на КУ. Перед тем, как вынести на КУ, проверяем на наличие копивио. Если надо выносить на КУ, проставляем категории, ставим хотя бы одну внутреннюю ссылку, чтобы статья не была тупиковой, и патрулируем. Если статья будет оставлена, то администратор или подводящий итоги должен будет её проверить на соответствие минимальным требованиям. Если значимость есть, а копивио нет — начинаем приводить статью в человеческий вид: категории (обязательно), интервики (очень желательно), внутренняя викификация (обязательно), разбиение на разделы, вводное предложение, шаблон {{rq}}, патрулируем. Вся процедура целиком может легко занять до получаса.

Послесловие[]

Общая модальность этого эссе — что патрулирующих, в общем, не хватает, и дело движется существенно медленнее, чем надо бы. Это правда. Но с одним исключением. Если вы патрулируете — делайте это хорошо. Исправить вашу ошибку — убедиться, что статья на патрулированной версии не соответствует правилам, снять пометку, а потом отпатрулировать самому — занимает гораздо больше времени, чем если делать самому с нуля. Никогда не халтурьте.

Примечания[]

  1. В принципе, кроме статей основного пространства, можно патрулировать также шаблоны, категории и файлы, но категории и шаблоны почти все отпатрулированы, а файлы всё равно нельзя патрулировать, не разбираясь в лицензиях и критериях добросовестного использования, так что их всерьёз и не начинали патрулировать, поэтому в этом эссе я ограничусь только статьями
  2. 1 2 Эта статистика доступна здесь.
  3. Ведётся статистика динамики патрулирования, на которой наглядно отображаются количественные изменения.