Як поліпшити конкурс? Роздуми про ефективність і справедливість…
Вітчизняна частина конкурсу Wiki Loves Monuments проводилася вже вшосте. За шість років Вікісховище поповнилося двома сотнями тисяч зображень пам’яток архітектури, історії, археології… Автор цих рядків брав участь в конкурсі 4 рази як конкурсант та двічі як член жюрі, двічі перемагав у кількісній номінації, ще раз – в якісній. Накопичений чималий досвід, в тому числі бачення проблем, які заважають проводити конкурс якнайефективніше з метою наповнення Вікіпедії та сховища зображення якмога більше об’єктів культурної спадщини.
Мова тут йтиме про кількісну номінацію. Питання якості зображень, звичайно ж є актуальним також, але здебільшого проявляється воно знову ж таки через намагання конкурсантів забезпечити якмога більшу кількість завантажень.
Ще з часів першого конкурсу у 2012 році конкурсантам стала зрозумілість певної несправедливості розподілу балів в кількісній номінації, коли об’єкт зфотографований, приміром, в центрі Львова (на хвилиночку, лише одна площа Ринок містить 50 об’єктів!!!), і об’єкт освітлинений в далекому глухому селі (а він там часто один-єдиний) оцінювався однаково. Тобто витрати часу, сил, грошей, зрештою, для добирання до далеких об’єктів правилами конкурсу нівелювалися. Вже тоді зайшла мова про врахування назвімо його умовно «регіонального коефіцієнту» який такі зусилля стимулював би. Але тоді не було чіткого бачення, якими би ці коефіцієнти мали б бути.
За 3 роки проблема проявила себе, коли стало зрозуміло, що конкурсантам в погонею за кількістю вигідінше використовувати вже накопичені архіви, аніж їздити далекими регіонами в пошуках нових неосвітлинених пам’яток. В конкурсі 2015го року був використаний коефіцієнт 2 (а з 2016-го – 3) для неосвітлинених об’єктів. Це певним чином пожвавило конкурс, проте в цілому проблему не вирішило. Відкрийте та порівняйте конкурсні списки об’єктів в м.Київ та, приміром, Вінницької області. Коли перші можуть похвалитися світлиною в кожному рядку, то другі (обласний центр та міста обласного значення не беремо до уваги) – здебільшого скупим «Завантажити фото». Кожен дотичний до конкурсу знає, що це значить – жодного фото даного об’єкту у Вікісховищі досі немає.
То чому ж коефіцієнт 3 для неосвітлинених слабо стимулює конкурсантів полювати за такими об’єктами? Бо, ж якщо послуговуватися попередніми підсумками кількісної номінації 2017 року, у лідерів перегонів завантажених фото неосвітлинених об’єктів 300–400, тоді як загальна кількість у тих же лідерів збільшується щороку на 1000.
Поясню на власному прикладі. Влітку у відпустку я чесно простував «неосвітлиненими» просторами рідної Черкащини та сусідньої Вінничини. «Врожай» був різним. Якогось дня вдалося вполювати аж 18 (то мій власний рекорд) об’єктів в далекому Томашпільському районі Вінничини, а якогось всього 2 – сусідній Канівський район (та й то, 1 з цих 2 об’єктів згодом виявився освітлиненим, бо напередодні конкурсу робот таки знайшов його світлину у Вікісховищі). От і порахуємо, витративши цілий день, намагаючись освітлинити те, чого бракує у Вікісховищі, я зміг заробити на конкурс від 4х (1*3+1) до 54х (18*3) балів.
Прийшов вересень – місяць конкурсу, видалися вільні вихідні і я мав вибір – чи далі простувати «неосвітлиненою» Черкащиною і привозити свої 10-50 балів, а чи таки постаратися перемогти в загальному заліку за діючими правилами. Всі ми маємо амбіції, іноді, як в моєму випадку, більше ніж совісті 🙂 Тому я поїхав до Києва. За 2 дні я перефотографував весь музей в Пирогові, значний кавалок Байкового кладовища, ще й побіжно ВДНГ та не відвідувані раніше з фотоапаратом вулиці. В підсумку за 2 дні такої прогулянки я привіз 500!!! балів на десятки (якщо не сотні) разів заїжджених об’єктах. Мені добре, (знову ж таки за попередніми даними) я високо піднявся у загальному рейтингу. Але чи є від цього користь Вікіпедії??? Вікісховищу реально бракує ще одного (серед десятків подібних) фото могили Максима Рильського?
Ну та Бог із ним, із Рильським. Але, врахуйте наступне – із своїх 5687 завантажень у 2017 р. автор цих рядків завантажив 1126 фото об’єктів з м.Київ, 883 фото зі Львова, 739 фото з м.Одеса та 105 світлин з м.Харків. Тобто сумарно кількість постійно і масово фотографованих міст з надвисокою концентрацією пам’яток склало… рівно ПОЛОВИНУ загального завантаження. Пропустимо той факт, що іноді через лінь інших конкурсантів (виявляється, ніхто до мене не здогадався шукати неосвітлинені об’єкти Личаківського чи Байкового кладовища всередині полів), а часто через проблему несвободи панорами (певен, що вілли в Професорській колонії м.Львова фотографували і до мене, але потім ті фото видаляли з Вікісховища) і в цих містах є неосвітлинені об’єкти. Все ж їх доступність значно вища, ніж приміром єдина церква віддаленого села. Яку проблему це породжує? Дуже просто. Щорічні лідери перегонів обросли вже такими фотоархівами, що формують занадто високий вхідний бар’єр для новачків, які б хотіли позмагатися в кількісній номінації. Якщо правила не змінити, ми так і змагатимемося між собою, і зрештою, перемагатиме той, хто матиме більше вільного часу у вересні для завантаження фото в рамках конкурсу 🙂
З цим стають зрозумілими причини ще однієї проблеми, вже згаданої вище якості. Не скажу за інших, але на власному прикладі – оті нещасні 2 об’єкти далеких сіл на Канівщині чи як на заглавному фото на Крижопільщині я фотографував довго і ретельно. Ще б пак, я витратив стільки енергії, щоби сюди дістатися! Я шукав вигідні ракурси та чекав гарного світла. Що я робив в Києві? Правильно, я швидко йшов вулицею, озираючись навкруги, на постійно клацав затвором не зупиняючись біля кожного об’єкту та лінуючись навіть іноді міняти об’єктив, коли того вимагав сюжет. Бо ж об’єктів купа, а час обмежений, треба встигнути якмога більше. До того ж якість знимка жодним чином не впливає на кількість балів. То яка різниця? Знову ж таки, для мене як конкурсанта, не Вікіпедії. Більше того, в погоні за кількістю завантажень я часто просто ті знимки не редагував. Просто вирівняти вертикалі і то бракувало часу серед тисяч цих безкінечних фото чиншових кам’яниць на львівських, київських та одеських вулицях. Звісно, фото вантажаться за вільною ліцензією і те редагування може зробити хтось інший. Але покладемо руку на серце, хто за вас редагуватиме ваші знимки, тим паче, якщо фото цих об’єктів і так не бракує на Вікісховищі?
То ж чи потрібні Вікіпедії такі перегони? Мені здається, що ні. Цього року Україна знову посіла 1ше місце серед всіх країн-учасниць по кількості завантажень. То може вже досить прагнути кількісного лідерства і боротися за якісне?
Що я пропоную? Звичайно оцінити важкодоступність кожного об’єкта – задача не під силу ні оргкомітету, ні волонтерам. Проте можна піти простішим шляхом, встановлюючи той «регіональний коефіцієнт» таким чином:
1ша група. Міста з високою концентрацією пам’яток. Як правило списки пам’яток в таких містах розміщуються на декількох сторінках і досягають подекуди декілька тисяч. За досвідом, гуляючи вулицями цих міст за день легко можна отримати фото 150-200 об’єктів. До них належать Київ, Харків, Одеса, Львів, Івано-Франківськ, Полтава та Кропивницький (останні 3 – дискусійно, позаяк кількість об’єктів там все ж значно нижча ніж в перших 4, тож їх можна віднести і до 2ї групи). Фото кожного об’єкту з цієї групи оцінюється в 1 бал.
2га група. Обласні центри та міста обласного значення. Виділити їх програмно при підрахунку балів не складно. Формат ID для них «хх-1хх-хххх» на відміну від «хх-2хх-хххх» для наступних категорій. За день в середньому в таких містах можна отримати 50-100 світлин різних об’єктів культурної спадщини. Звісно, розподіл нерівномірний. Приміром місто обласного значення Черкаської області Ватутіне містить лиш 4 пам’ятки, але для спрощення процедури таким можна знехтувати. Тим паче, як правило дістатися таких міст не складає жодної проблеми. Отже фото кожного об’єкту з цієї групи оцінюється в 2 бали.
3тя група. Районні центри (крім міст обласного значення). Виділити їх з сільського регіону складніше, позаяк вони мають перші 5 цифр в ID такі з самі, що і весь район. Проте, гадаю, це завдання під силу нашим ІТ-геніям з Вікімедії. Ці населені пункти мають в середньому значно меншу концентрацію пам’яток, ніж міста з 2ї групи. В середньому 10-30, але транспортна інфраструктура все ж розвинутіша, ніж у випадку останньої групи. То ж фото кожного об’єкту з цієї групи оцінюється в 5 балів.
І нарешті 4та група. Сільська місцевість. Всі інші населені пункти та об’єкти за їх межами. Звісно, різниця тут може бути дуже відчутною. Приміські села є легкостоступними в плані розвинутої транспортної інфраструктури та відстані, сіл за 30 км від райцентру з убитою дорогою дістатися дуже складно. В одному селі може бути з десяток об’єктів, в іншому – лиш 1. Але врахувати всі ці розбіжності нереально. Тому усереднено – фото кожного об’єкту з цієї групи оцінюється в 10 балів.
На перший погляд коефіцієнт в 10 балів може здатися завеликим. Але порахуємо. Ще раз – мій особистий рекорд за день для сільської місцевості, це 18 об’єктів. То ж 180 балів. Для міст з першої групи отримати ті самі 180 не є аж такою проблемою.
Тому все паритетно. Хто хоче – фотографує об’єкти в далеких селах, хто ні – лишається і гуляє з фотоапаратом вулицями Києва, Львова, Одеси… Обоє отримають однакову винагороду за свою працю.
Звісно, щоби стимулювати фотографувати неосвітлинені об’єкти, в чому зацікавлена Вікіпедія в першу чергу, варто зберегти коефіцієнт 3. Іншими словами – вперше освітлинений об’єкт в м.Львів оцінюватиметься в 3 бали, а в сільській місцевості в 30. Але, гадаю, це справедливо.
Звісно, пропоновані зміни мають застосовуватися до нового конкурсу. Сподіваюся вони стануть темою для жвавого обговорення і можливого вдосконалення. Але бажано, щоби за результатами обговорення оргкомітет якмога скоріше ухвалив зміни до регламенту конкурсу з тим, щоб конкурсанти могли ефективніше підготуватися до наступного конкурсу за новими правилами.
Сергій Криниця (Haidamac)
От як можна створювати таку складну систему підрахунку якщо цьго року впродовж конкурсу навіть неспромоглися запустити онлайн таблицю із підрахунком завантажених фото по участниках і областях?! І тоді було все набагато простіше або 1 або 3 бали. А якщо реалізувати хочаб половину пропозицій це така бухгалтерія почнеться що огого!
Я не проти заохочень знімання того до чого складно дістатися, але дивлячись на цьогорічний конкурс наврядчи всю цю бальну систему реалізують. Притому щоб вона була готова хочаб за пів року до старту наступного конкурсу, а не за кілька днів до початку.
Олександре, якщо оргкомітет не встиг належним чином технічно підготуватись до проведення конкурсу (хоча писали, що вони готуються чи не півроку) – це не означає, що ми не маємо поліпшувати наповнення Вікіпедії якісними зображеннями пам”яток у віддалених і не таких популярно туристичних місцяї України. Я дуже сподіваюсь, що невтішний результат підготовки до цьогорічного конкурсу змусить членів оргкомітету провести “роботу над помилками”, заздалегідь розставити пріорітети, підготуватись морально та, головне, технічно і не повторювати прикрощі, через які конкурс та учасники пройшли цього року. Принцип “ну, ми якось так зробимо” вже не має працювати на шостому році проведення конкурсу. Заздалегідь вдячна! Дуже вірю у здатності та натхненність нашого оргкомітету
я так і знав, що лідери будуть проти :)))))))
А якщо серьозно – що ж тут складного? Застусувати в алгоритмі замість 3 інші коефіцієнти до окремих ID. Те що оргком трішки підвід зі статистикою цього року – ну то проблеми іншого штибу, аніж алгоритм
(Science mode on, кхм)
Важкодоступність об’єкта оцінити елементарно, використаємо для цього власний доробок проекту, адже за 6 років розподілення показника кількості фото на об’єкт, відбулося саме за доступністю. Я це пропонував на обговоренні після нагородження в 15 році. Достатньо вводити не цілочисловий компенсаційний коефіцієнт 2 чи 3 чи 10, а обернено пропорційний коефіцієнт (саме для таких речей і використовують за логікою обернену пропорційність), що рахується за елементарною формулою К = 1 / (кількість фотографій об’єкта у Вікісховищі). Таким чином, добре освітлинені об’єкти будуть брати участь в якісній номінації не впливаючи при цьому на кількісну. А учасники кількісної номінації отримають фантастичний по силі стимул знімати лише нове. Це зробить їх квест цікавішим і справді потребуючим зусиль, а кожен об’єкт цінністю. Кількість же фото кожного окремого об’єкта на Вікісховищі я думаю порахувати неважко, адже всі фото промарковано тегом конкретного об’єкта (залишається порахувати кількість існуючих посилань для кожного об’єкта), плюс є галереї, якщо іти іншим шляхом, напевно існують і інші варіанти.
І мені не подобається проста прив’язка до кількості фото, бо сотня поганих знімків у Вікісховищі не означає, що нам не треба одного гарного звідти.
Можливо, коефіцієнт краще вираховувати не через кількість фото, а через кількість користувачів, які знімали об’єкт? А то в учасників не буде ніякого стимулу, робити світлини з декількох ракурсів.
Погоджуюсь із Вадимом. Припустимо, два учасники зробили та завантажили по 10-15 фото церкви із далекого села – це не означає, що не варто поїхати та подивитись, а у якому вона стані через рік чи два.
такі алгоритми (кількість фото на об’єкт, як ото прононуєту Ви, ранг доріг і віддаленість, як нижче – Віра Моторко, щільність пам’яток – як пропонував Ілля Корнійко) мабуть більш справедливі з т.з. зусиль та потрібності. Але всі вони мають один суттєвий недолік – конкурсанти мають знати коефіцієнти до об’єктів, які вони фотографують, а при таких підходах довелось би їх прописувати в списках пам’яток до кожного ID окремо (у випадку з кількістю фото, ще й змінювати щороку). Уявляєте собі обсяг роботи?
Тому моя пропозиція – такий собі компроміс між справедливістю та трудозатратами
Сергію, на погоджувальній зустрічі з оргкомітетом ми якраз і зійшлись на тому, що пропишемо бали для КОЖНОЇ пам”ятки. Це зовсім не так складно, як здається. Можу це стверджувати як людина, яка щоденно працює із великими обсягами інфо. Треба просто один раз однозначно пропсиати алгоритм – далі справа техніки та уважності. Якщо кожен із учасників-лідерів кількісних номінацій, наприклад, візьме на себе як волонтер 2 області і буде потроху робити – ми впораємось за 2-3 місяці. Дуже чекаю, коли Віра пропише фінальний погоджений варіант умов конкурсу із балами. Віра обіцяла це зробити ще наприкінці минулого тижня.
“Якщо кожен із учасників-лідерів кількісних номінацій, наприклад, візьме на себе як волонтер 2 області і буде потроху робити – ми впораємось за 2-3 місяці”
занадто оптимістично ІМХО, тоді виявиться, що хтось не впорався, бо ж не конкурсом єдиним, і не встигли до настпуного
3-тю і 4-ту групу можна було б легко виділити, якби був тип нас. пункту у списку, я пропонував вказувати для населених пунктів тип у списках, але колеги з оргкому мене не підтримали, вирішили, що достатньо лише назви нас. пункту. Тож наразі реалізувати це важко.
ну якраз це можна відносно швидко зробити, я можу поволонтерити. Районів у нас не так вже і багато 🙂
Анатолію, це не важко. Усі населені пункти України до найменших з їх типом можна подивитись у тій же Вікіпедії. За місяць у відпочинковому темпі можна по вечорах проставити статуси по 2-3 областях. Можете призначити мені особисто кілька областей (чи я виберу сама, як вам зручніше), я вам продивлюсь та проставлю тип, сподіваюсь, ще знайдуться волонтери
І пропозиція друга, на фото-сезон 2018-2019 років – взагалі виключити вже освітлинені пам’ятки першої групи (Київ, Львів, Одеса, Харків, Івано-Франківськ, Полтава та Кропивницький, я б додала на 2018-2019 ще Кам’янець-Подільський, Хотин, Ніжин та взагалі УСІ обласні центри) із підрахунку балів за кількісну номінацію, тобто їх коефіцієнт буде 0. Це дуже пожвавить конкурс на цей час та дуже простимулює подорожі та фотографування пам”яток у нечасто відвідуваних регіонах та освітлинення ще несфотографованих об’єктів. Звичайно, усі фото пам”яток вищеперелічених міст можуть брати участь у конкурсі на найкраще фото України та окремої області. “Нам нічого буде фотографувати, це дуже складно та довго!” – будуть кричати деякі. Та перестаньте. Я цього року об’їздила Кіровоградську область, де були неосвітлинені практично УСІ районні центри (до яких нескладно дістатись), окрім Олександрії, Знам”янки та Світловодська, та привезла фото більше 200 об’єктів (райцентри+трохи сел). Насправді, кількість сфотографованих об’єктів по областях складає від 15 до 30-40%, так що є величезне поле для корисної роботи. А у не дуже якісному сотому та двохсотому фото однієї і тієї ж пам”ятки Києва, Львова чи Одеси зараз особливої потреби немає, як мені здається
Підтримую Сергія абсолютно, на 1000% відсотків. Маю дві додаткові пропозицію. Перша – на постійній основі – додати навіть п”яту групу для сільської місцевості з коефіцієнтом у 20 балів – віддалені від основних трас села, у які автобус ходить один чи два рази на день (За власним досвідом – якщо села розташовані вздовж траси, більш-менш реально охопити за день від 5 до 7, якщо виїхати о 6-00-6-30 ранку і фотографувати до 19-30, проводячи у кожному селі по годині-півтори. Якщо село віддалене від траси – фактично витрачаєш на його відвідування увесь день, можливо, доведеться там і ночувати). Розділити села за таким принципом – не дуже проблематично, я особисто можу узяти на себе 2-3 області для проведення класифікації до березня 2018 року, сподіваюсь, знайдуться і інші волонтери.
Я задумалась, як це зробити, і мені порадили: «поділити в залежності від типу доріг, які там проходять. Класифікація доріг ніби є, база даних робиться в ГІС. Можливо зв’язатися з Діпромісто, які займаються плануванням територій і таку інформацію повинні враховувати; у них і карти з різними зонами доступності мають бути».
З цим треба бути теж обережним. Припустим, є райцентр Кіровоградської області Новоукраїнка. В ньому порядка 35-40 об’єктів. Але дорога туди з Кропивницького, яка проходить через кілька немаленьких селищ…хм…вона заросла до асфальту і вже давно виключена із складу основних навіть на рівні області, бо усі в основном їздять іншою по бетонці… При цьому вона у відносно непоганому стані і веде у райцентр.
тип дороги 1) не означає ї якість (іноді до села може бути значно краща, ніж дорга національного значення)
2) не враховує легкість добирання до віддаленого села (громадський транспорт). Все залежить від попиту на транспортні послуги. Має село працюючий цукрозавод приміром – отуди маршрутки і їздять, ще й доволі часто. Не має нічого такого – може бути раз на тиждень, і то, графік розкладу не гарантує поїздку 🙂
Чому ж тільки до 19.30 фотографувати? Можна й опівночі знімати пам’ятки 🙂
https://commons.wikimedia.org/wiki/File:WLM2017foto361.jpg
ну та, не найгірше
можна ж, чому ні?
читай вище мою відповідь WDKeeper’у. Поволонтерити можна, але лопатити всі списки, щоб прописувати, який коефіцієнт для якого ID (а це доведеться робити і у випадку з виділенням ще 1 групи)? Чи варто?
Може спробуємо 1 рік без цих складнощів, а там практика покаже?
Варто. І не складно. І це полегшить усім життя. Ми довше будемо розмовляти про те, як це складно, ніж сісти, розподілити роботу та зробити.
А я не збирався довго говорити, що складно. Я пропонував простий компромісний варіант, хочете мороки – ОК, покажеш приклад 🙂
Покажу, не сумнівайся 😉