Як гартувалась грамота (Інтерв’ю із засновником української “Вікіпедії”)
18.08.08Що на сьогодні являє собою українська «Вікіпедія»?
Українська «Вікіпедія» — це близько 80 тисяч статей та близько 8 тисяч користувачів (так іменуються люди та роботи-користувачі системи). Українська «Вікіпедія» — це найбільша і найповніша на сьогодні серед українських довідкових інтернет-видань енциклопедія. Найповніша за охопністю тем, динамікою поповнення, розробки тощо. І… досить сира. Дуже багато коротких статей, без джерел, з позначками того чи іншого ступеню недоробленості.
Коли ви приєднались до проекту і в якому стані (порівняно з нинішнім) він перебував тоді?
Я приєднався у 2004 році. На моїй сторінці в українському розділі «Вікіпедії» наявна оновлювана статистика днів протягом, яких я у ній працюю http://uk.wikipedia.org/wiki/Користувач:Albedo.
В якому стані перебувала тоді українська «Вікіпедія»? Було близько 22–23 тисяч статей, буквально двома-трьома тисячами менше, аніж у російській. На час мого приходу уже була розвинута тема античної міфології (грецької, римської — зауважу, що антична спадщина, як класична, мусить бути ознакою «Вікіпедії» як такої), було чимало статей, які охоплювали історію (зокрема України), різну термінологію, більшість наявних на сьогодні статей з «Енциклопедії українознавства», статті щодо метеорології тощо. Тобто основа уже була. Якщо порівняти 23 тисячі із форматом паперового видання, це була б книжка-енциклопедія, вірніше, енциклопедичний словник формату А5 із 500 сторінок. Згодом пішла ширша розкрутка проекту, і користувачі активніше почали долучатися до справи. Це з позитивного боку.
З негативного — тисячі статей були без категорій, не існувало якісного дерева категорій. Категорія (тема) — це риса, яка дозволяє групувати статті одного плану, тематики, галузі чи хронології. А дерево категорій (система, граф) — це та річ, яка виникає з поєднання категорій у щось більше, вона дозволяє працювати (переходити, ознайомлюватися, обробляти) з великою кількістю категоризованих статей.
Статті, що з’являлись у той час, були доволі короткими, подеколи вони й залишились такими по сьогодні, хоч матеріал для доповнення існує, і потрібно зовсім небагато, щоб допрацювати їх.
Завдяки розробкам програмування ми отримали можливість бачити розміри статті, доповнень (у байтовому вимірі), а з боку користувачів, вірніше, Спільноти — отримали правила і поправки щодо, скажімо, мінімального розміру статті чи критеріїв якості.
До речі, чимало правил, довідок уже було перекладено на момент мого приходу у «Вікіпедію» (зараз, наприклад, довідок перекладається не так багато).
Щодо медіа (звуки, зображення, таблиці тощо). Це питання якості та оформлення статей, і воно було доволі непростим. Зображення були абсолютно некатегоризовані, що виключало можливість повторного їх використання у схожих статтях. Правове підґрунтя завантажених медіа було неясне. А якісні статті (наприклад, з тієї ж біології, серед якої багато вибраних статей) вимагають окрім усього іншого якісних зображень. Знайти такі, та ще й з вільною ліцензією — доволі важко.
Написання статті, її оформлення, у тому числі розмітка та текст, пошук зображень, категоризація, посилання на схожі статті в «Вікіпедіях» — усе це покладалось практично на одну людину — автора. Зараз ситуація покращилась завдяки збільшенню користувачів, що беруть участь у проекті, а також частковій автоматизації рутини.
Як би ви оцінили темпи зростання вітчизняної «Вікіпедії»?
— Темпи зростання вітчизняної Вікіпедії наочно відображаються графіком, укладеним одним із наших користувачів, у минулому адміністратором, який можна побачити тут: http://uk.wikipedia.org/wiki/
Вікіпедія:Історія_української_Вікіпедії. Інформацію по цьому питанню було зведено у таблицю як частину історії української «Вікіпедії». Графічні чи табличні дані можна знайти на цьому сервері: http://en.wikipedia.org/wikistats/EN/Sitemap.htm/, як щодо будь-якого мовного проекту, так і щодо українського зокрема.
У березні ми вели дискусію стосовно того, чи зможемо досягнути обсягу 100 тисяч статей. За наявних темпів, ми уже мали перетнути рубіж. Однак на поточний день, щоб увійти з 100-тисячною статтею в наступний рік, необхідно давати в день 1000 статей. Тобто зростання не прогнозоване, стохастичне.
Можливе також автоматизоване створення заготовок (заливка статей ботом), але, по-перше, зараз вона технічно нереалізована, по-друге, технічно необґрунтована, і без погодження із Спільнотою може викликати протест. Хоч завдяки заливкам, які видно з графіку, в певні моменти ми подолали певні кількісні рубежі, інколи навіть випереджаючи інші мовні проекти із приблизно такою ж кількістю статей. Відзначу, що для певних мовних проектів сама автоматизація, заливка, випередження якогось іншого мовного проекту є чи не одним із основних завдань, і можна тільки порадіти, що наша «Вікіпедія» не скотилась до цього.
Щодо якісної оцінки: українська «Вікіпедія» не відповідає вимогам часу, або, принаймні, відповідає їм недостатньо. Тут що головне? Відбулися, скажімо, вибори у Хорватії нещодавно? Слід написати про це у рубриці: Дати. Слід також поглянути, чи є розділ Вибори у статті Хорватія, і внести дані. А можливо, є стаття про вибори у Європі, чи виборчу систему, і якщо вона відрізняється у Хорватії, слід доповнити цю статтю. Про партії Хорватії статей, припускаю, взагалі немає. А про них вже можна сказати пару слів на даному етапі, беручи інформацію з відкритих джерел, преси, поповнюючи та актуалізуючи її у міру зміни ситуації. Так розвиваються найбільші «Вікіпедії», і хоч такі статті подеколи можуть бути дуже короткими, зате вони «вловлюють момент». Звичайно, єдиного методу творення енциклопедії, тим паче «Вікіпедії», не існує, але такими методиками слід користуватись.
Які теми та напрямки в енциклопедії є найактуальнішими серед україномовних авторів?
Історія України, гірництво, сучасні події, кіно, література, біографічні статті, географія, біологія, генетика, інформаційні технології.
Загальновідомо, що автором статті в енциклопедії може стати кожен. З огляду на це постає питання конфліктних ситуацій, суперечок. Чи мають вони місце?
Конфлікти бувають, але слід розрізняти надуманість, тролінг, та власне суперечки. Тролінг — це відволікання від всього актуального у русло, яке нікуди не веде. Надуманість виникає там, де стаття містить усі погляди, наприклад, про УПА, але хтось старається видати котрийсь за єдино правильний. Можуть бути суто технічні конфлікти, коли декілька людей працюють в один і той же момент над однією статтею, і лише система вирішує, хто був перший. Але це не конфлікт думок, тому про це не говоритиму.
Суперечки загалом бувають різні: щодо статей, поводження з користувачами, повноваженнями, з приводу наявності змін тощо, тому тут надати загальний опис усього не вийде. Загалом, більше про це можна довідатись на самому просторі «Вікіпедії».
На головній сторінці проекту завжди можна побачити актуальну кількість зареєстрованих користувачів. А який відсоток з них реально та регулярно працює над енциклопедією?
У нас є сторінка Вікіпедія:Найактивніші (http://uk.wikipedia.org/wiki/Вікіпедія:Найактивніші), де зазначено користувачів із вагомим внеском. У нас є сторінки з авторами добрих і вибраних статей. Поточну активність можна відслідковувати зі сторінки останніх редагувань та нових статей, а також зі свого списку спостереження (для зареєстрованих користувачів). Ведеться статистика на відповідному розділі Фонду Вікіпедія.
Загалом, діє принцип Парето, коли 20% користувачів роблять внесок в проект розміром 80% і навпаки.
Чи не володієте ви даними про регіональну структуру серед авторів нашої «Вікіпедії»? Скажімо, чи можна стверджувати, що більшість авторів проживає в Києві чи іншому місті?
Сказати можна. Найбільша кількість— з Києва, Львова, Донецька (за поданою користувачами інформацією). Колись була ідея подавати своє розміщення на мапі, це виглядало б досить цікаво.
Які вони, трудові будні адміністратора «Вікіпедії»?
Це, мабуть найважче питання із запропонованих…
Є люди-адміністратори, це помітно, які практично днюють і ночують при «Вікіпедії» — це риса не якоїсь конкретної версії, а фактично процесу. Процесу, в який включена українська версія. Досвід та внесок кожного — індивідуальний, й не можна зводити співпрацю чи роботу до якогось спільного мірила. Одні адміністратори можуть активізуватись на якісь вагомі моменти життя Спільноти, решту часу роблячи посильний чи косметичний внесок, але у нас у розділі немає людей, які, так би мовити, не заробили б свого адмінства.
До речі, є навіть така хвороба як вікіпедіоголізм (http://en.wikipedia.org/wiki/Wikipedia:Wikipediholic).
Часто робота адміністратора може нести й непопулярні кроки, коли приведення контенту, змісту і вмісту до наявних чи потенційних вимог може обертатись осудом окремих користувачів, їх груп, затягувати у конфлікти чи тролінг.
Можна сказати, що на адміністраторів покладається виключне право, чи пак, обов’язок у актуалізації контенту. Цього від адміністраторів вимагають як зареєстровані, так і незареєстровані користувачі. Оскільки статей, в яких зміни впроваджувались би автоматично, обмаль, то роботи вистачає.
Окремо можна виділити роботу адміністраторів у плані проведення зборів вікіпедистів, так званих вікізустрічей, промоушену «Вікіпедії» тощо. Хоч я практично не маю причетності до цього, однак не слід забувати про діяльність моїх колег у цьому напрямку.
Ще одне загальне міркування — можливо, воно буде цікаве для ваших читачів. Про активність кожного адміністратора можна довідатись на спеціальній сторінці. Крім того, можна пройтись по усіх редагуваннях адміністраторів (для цього у нас є відповідний шаблон). З них, зокрема, можна довідатись про сотні, якщо не тисячі блокувань вандалів (активність яких була особливо високою у часи, коли можливостей «патрулювання», перевірки було куди менше, ніж зараз), дізнатись про війни редагувань тощо. Це все є свідченням того, що Спільнота жива, і ніщо людське їй не чуже 🙂 .
Багато поточних питань, які стосуються власне адміністраторів, публікуються на сторінці Запити до адміністраторів. Також з`ясувати багато питань з адміністраторами можна на сторінці Спільноти під назвою Кнайпа, де зібрана уся дискусійна сторона «Вікіпедії» поза основним її простором (статтями).
До діяльності адміністраторів слід додати заохочення новачків, а також перевірку і корекцію їх редагувань, обговорення з ними їхнього внеску.
Важливо сказати також про те, що творення лише однієї «Вікіпедії» — річ важка. З огляду на це постає питання співпраці міжмовних версій, окремих користувачів, розділів, груп користувачів, розробка спільних тем. Доводиться подавати запити на автоматизацію окремих процесів, користувачам у тих мовних версіях, у яких вони активні, за відсутності в українській версії програмістів, які б могли забезпечувати цей процес.
Ведеться робота над тематичними поповненнями, актуалізацією самого процесу, як у збиранні відсутніх статей-лінків, так і у творенні гілок-категорій для статей, формулюючи таким чином майбутні напрямки роботи над цими категоріями та статтями.
Скільки часу в середньому забирає така робота?
В кожного по-різному, але, мабуть, не менше 5 годин на добу. Зараз активність адміністраторів може варіюватись, як онлайн, так і офлайн. Не варто вирізняти адміністраторів у якусь касту, адже це звичайні користувачі, яким надано права вилучення/відновлення (якщо спрощувати). Багато адміністраторів пишуть якісні статті, а для цього теж потрібен час. Активність у мережі — не ознака того, скільки саме адміністрування займає часу.
Чи можна вести мову про певну групу користувачів, які складають «ядро» української «Вікіпедії» і на плечах яких лежить основна робота?
Така група є. Її складають найактивніші. І хоча до цього «ядра» і долучаються нові люди, темпи росту не надто великі. Для дослідження цього явища можна скористатись сторінкою Вікіпедія:Найактивніші, пройшовшись по певних архівних її версіях, зіставити. Якщо б ми мали понад 200 активних членів ядра, наприклад, «десятитисячників» (10 тисяч редагувань), це було б доволі непоганим показником. Це щодо якості ядра, вірніше, змін у ньому. А так можна сказати, що нинішня спільнота зробила все це для себе і несе свій хрест для майбутніх доповнювачів. Слід зазначити, що чимало користувачів з помітним внеском на сьогодні вже не ведуть активної роботи.
Але наша група «жива», і ті користувачі, які долучаються, пишуть свої статті на теми, які їм цікаві. Це і теніс, і війни, і мистецтво, і електроніка, і фізика. Можна також виділяти користувачів за інтересами, зазначеними на сторінці зацікавлень, можна переглядати внесок кожного, шукаючи статті, як зредаговані, так і створені ними.
Крім того, у нас все-таки більш-менш нормальна категоризація, що значно сприяє приросту нашої Спільноти.
З огляду на порівняно невелику кількість україномовних інтернет-джерел, значна кількість статей у вітчизняній «Вікіпедії» є простим перекладом відповідних статей з російської чи англійської «Вікі». Як ви оцінюєте такий стан речей?
Не підтримую цю думку. Українська «Вікіпедія» має свої джерела, свій шлях розвитку, хоч переклади теж є, але в цьому немає нічого поганого.
Статті не обов’язково базуються виключно на українському інтернет-контенті. Просто передрук сайтів, інтернет-джерел — це «копіво» (http://uk.wikipedia.org/wiki/Template:Copyvio), те, що вилучається як порушення авторських прав. Інтернет-джерела добрі як відкриті й доступні, це правда, і слід користуватись якнайбільше цією можливістю для верифікації, для джерельної бази.
Тепер приклад щодо статей з російської чи англійської «Вікі». Практично немає статей про Львів в українській «Вікіпедії», але в російській вони є. Якщо люди беруться розробляти тему, вони, мабуть, спершу перекладуть відповідну статтю.
До речі, на сторінці в Живому журналі, присвяченій українському розділові «Вікіпедії» — community.livejournal.com/ua_wikipedia, — вже йшлося про те, що слід впровадити політику якнайбільшого цитування інернет-джерел.
Web-droid редактор
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Видеонаблюдение от Ajax: обзор IP-камер DomeCam Mini, TurretCam, BulletCam и видеорегистратора NVR
Компания Ajax Systems продолжила расширение своей экосистемы устройств, представив камеры видеонаблюдения и видеорегистратор для управления видеопотоками. Достаточно консервативный и устоявшийся тип устройств, традиционно для компании подкрепили глубокой проработкой софта и комплектующих.
Новый Volkswagen Transporter будет выпускаться в электро и плагин-гибридной версии
Volkswagen автомобиль электротранспортМикроавтобус Volkswagen Transporter следующего поколения будет представлен в начале 2025 года.
Intel хочет заработать на производстве чипов для Министерства обороны США
Intel война процессор СШАХотя детали соглашения не разглашаются, существуют предположения, что Intel займется созданием чипов с искусственным интеллектом для военных дронов и вычислительных систем, использующих генеративный ИИ в разведке