Исследование показало, что Википедия влияет на науку

    У человечества ограничен доступ к наиболее полным источникам научного знания — научным журналам. Во многом такая печальная картина сложилась из-за коммерческой политики издательств и платных подписок, а также предположения, что факт публикации в «платном» журнале является доказательством научной значимости открытия.

    В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех (и это благо больше, чем «фильтрация» качественных статей в авторитетных изданиях, см. информационный парадокс Эрроу). Существует ряд научных проектов, которые финансируются в основном из государственных субсидий, при этом открыты бесплатно. Это, например, банки физических объектов, такие как банки семян и репозитории модельных организмов — ряд исследований показывает, что создание таких открытых банков способствовало научной активности в данном направлении. Есть и бесплатные открытые для всех информационные репозитории, как проект «Геном Человека» или StackOverflow.com (источник знаний в области компьютерного программирования).

    Википедия — крупнейший в мире источник научной информации для широкой публики. Это вообще 5-й по популярности сайт в интернете. Сейчас пара учёных из Массачусетского технологического института и Питтсбургского университета опубликовали научную статью в пользу того, что Википедия способствует распространению научных знаний, её читают и используют учёные, ставят на неё ссылки в своих научных работах, и Википедия во многом формирует направление научных исследований в принципе.

    В своей статье авторы цитируют Чарльза Дарвина из его письма к коллеге-биологу Томасу Генри Хаксли в 1865 году: «Я иногда думаю, что общие и популярные трактаты почти так же важны для прогресса науки, как оригинальное произведение». В конце концов, его «Происхождение видов» было одновременно и выдающейся научной работой, и бестселлером.

    Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.



    На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?

    В данном случае тема изучалась с помощью двух подходов. Во-первых, вычисление встречаемости научных терминов на страницах Википедии и на страницах научных журналов. Авторы обработали полную историю правок всех статей (20 терабайт данных) и все полные версии статей двух тысяч научных журналов Elsevier с 1995 года (0,6 терабайт).

    Разумеется, эти словарные базы во многом пересекаются. Так, 61% слов из научной литературы встречается в Википедии, а 63% слов из последней встречается в научной литературе. Однако относительная частотность слов в некоторых случаях заметно отличается.
    Слово Место в научной литературе Место в Википедии
    Acid 59 65
    Reaction 32 132
    Graphene 2143 3099
    Photovoltaic 5764 7651
    Gravity 6139 2375
    Pokemon 745 676 14 485

    В своих измерениях учёные, естественно, сделали поправку на языковой дрифт, то есть изменение частотности терминов со временем.


    Изменение частотности во времени некоторых терминов по химии

    Второй подход — экспериментальный. Экспертам по определённым темам предложили написать ряд статей для Википедии. Затем случайная половина этих статей реально публиковалась на сайте, а вторая половина сохранялась в качестве контрольной выборки. Впоследствии учёные изучали, насколько в научной литературе повысилась частотность слов из опубликованных статей и из статей контрольной группы. Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.



    Внедрение определённой информации в Википедию влияет на будущие научные исследования. Это означает не только большую значимость самой Википедии, но и большое значение открытых научных знаний в принципе. У статьи за платным файрволом гораздо меньше шансов оказать влияние на научное сообщество и на всё общество в целом, чем у статьи в открытом доступе. Получается, что открытая публикация статей — это очень экономически выгодный способ развивать науку. Эта выгода гораздо больше, чем выгода от «фильтрации» статей в платных журналах.

    Авторы научной работы уверены, что теперь никак неуместно говорить, что Википедия — это просто источник общеизвестных знаний.
    Поделиться публикацией
    Никаких подозрительных скриптов, только релевантные баннеры. Не релевантные? Пиши на: adv@tmtm.ru с темой «Полундра»

    Зачем оно вам?
    Реклама
    Комментарии 36
    • +2
      ставят на неё ссылки в своих научных работах

      А ничего, что такие ссылки не считаются авторитетными согласно правил самой же Википедии?
      • +4
        Более того, во многих отечественных учебных заведениях подобные ссылки автоматически ставят под сомнения такую научную работу и запрещают её принятие от студента\аспиранта и т.д.
        • +9
          Заходим на википедию, листаем до ссылок на которые она ссылается, копируем небольшую часть, вставляем в работу, профит
          • +5
            А ссылки на источники в тексте как расставите? Знаете такие в квадратных скобочках.
            Для этого придётся в источник заглянуть и цитату проверить. Т.о. мы приходим к честному использованию источников, а Википедия нам помогла их найти.
            • +1
              Если вы студент-халявщик, то заменяем ссылку на википедию на любую более подходящую к тексту ссылку из источников.

              С учётом того, что рецензент просил меня самого составить рецензию, а проверяющих на самом приёме диплома больше интересовали папочки в которые я завернул раздаточную литературу, чем сам диплом, никто не заметит и не будет проверять
              • +2
                Сочувствую.
                • +3
                  Получение высшего образования все же не помешало мне выучится в хорошего специалиста (наверное), поэтому нет смысла для сочувствий. Но да, хапнуть серьезного подхода к обучению мне таки не удалось
                • +1
                  «сам диплом, никто не заметит и не будет проверять»

                  Это либо было давно, либо вам повезло (или ВУЗ был такой).
                  Сейчас все источники пробиваются за пять минут.

                  Методика очень простая — работа просматривается по диагонали и в ней ищутся самые интересные места (преподаватель знает, какие именно :)
                  Остальное — дело техники.

            • +1
              Это естественное следствие неавторитетности источника.
            • 0
              В оригинальной статье об этом тоже сказано.
              Unfortunately, measuring the impact of Wikipedia using citations is difficult for two reasons. First,
              purported experts might be reluctant to admit that they referenced an encyclopedia for their
              knowledge, and thus not cite Wikipedia even if they used it. Indeed, university guidelines
              specifically discourage the citation of Wikipedia, as MIT citation guidelines make clear

              integrity.mit.edu/handbook/citing-your-sources/citing-electronic-sources
              Wikipedia is Not a Reliable Academic Source
              Many of us use Wikipedia as a source of information when we want a quick explanation of something. However, Wikipedia or other wikis, collaborative information sites contributed to by a variety of people, are not considered reliable sources for academic citation, and you should not use them as sources in an academic paper.


              Тем не менее, там есть отсылка к исследованию 2016 года:

              Tomaszewski and MacDonald (2016) find that only 0.01% of scientific
              articles directly cite Wikipedia entries.

              dx.doi.org/10.1080/0194262X.2016.1206052
              A Study of Citations to Wikipedia in Scholarly Publications

              For the study period from 2002–2015, citations in approximately 16.6 million
              peer-reviewed articles across the three WoS citation indexes were searched.
              This research identified a total of 1,551 citations to Wikipedia (Table 1). For the sake of expedient
              analysis, the authors assume one Wikipedia citation per article relationship.
              This suggests that approximately 0.0099% of scholarly articles contain a cita-
              tion to Wikipedia.


              Т.е из 16.6 миллионов работ, около ~1500 имеют ссылки на википедию (В основном Китай и США)
              • +2
                Похоже, в мировой науке наблюдается острый дефицит технических средств воспитания…
                • 0
                  Предположу, что существенная часть этих статей изучает влияние Википедии непосредственно. Ни один крупный зарубежный научный журнал не примет ссылку на Википедию, если она не является объектом исследования. Как пример: данная научная работа не может не иметь ссылки на Википедию, как источника, но этот факт не делает исследование менее значимым.
                • +1
                  С другой стороны в Википедии принято в конце статьи перечислять первоисточники.

                  Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник, который может оказаться достаточно авторитетным.
                  • +2

                    А может не найти. В википедии много статей в которых источники достаточно сомнительные или мертвые. Во втором случае можно поверить что там было что-то достаточного качества, но это так себе решение.

                  • 0
                    Есть и обратная сторона медали — ссылка на хорошую статью в вики еще не гарантирует того, что сама статья является хорошей.
                    arxiv.org/abs/1703.03827 как пример. 5 ссылок на вики, и даже одна на stackexchange.
                    (автор, кстати, д-р физ.-мат. наук iitp.ru/en/users/47.htm)
                    • +1
                      А почему было не сделать это автору статьи? Тогда и вопросов бы не было.
                      • 0

                        Автор-то делает, но викимодераторам виднее.

                        • 0
                          Причём тут викимодеаторы?
                      • +2
                        «Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник»

                        Поскольку такую проверку я делаю постоянно — могу сказать, что в русскоязычной вики «левых» источников достаточно много. Включая ссылки на сайты с явно бредовой информацией (типа РенТВ).
                        Не надейтесь, на то, что эти ссылки кто-то реально проверяет.
                    • 0
                      В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех

                      Ну что за демагогические приемы в текстах про пользу открытой науки? Ну некрасиво же.


                      Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.

                      На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?


                      На каком уровне? Кому очевидно? Мне — не очевидно. Я вообще не до конца понимаю что за цифры приведены в таблице. 93 + 47 != 100, значит они либо пересекаются, чего вроде бы не должно быть, если статья объясняет на уровне начального курса, то она не может одновременно объяснять и на уровне старшего. Либо второй процент берется от остатка, но этому противоречат уже цифры в таблице, остаток в первой строке 46, а во второй строке общее количество 136.

                      • +1
                        Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.
                        То есть учёные подтвердили, что студенческие работы в рецензируемые журналы делаются путём рерайтинга статей Википедии. Прэлэстно, просто прэлэстно.
                        • 0
                          скорее о нормализации терминалогии
                          между прочим во всём мире записывают математические выражения, в точности (почти =) как в одной книжке 17-го века
                        • 0
                          Некоторое время назад пытался распарсить википедию на базу данных. Так вот: к парсингу на базу она непригодна совсем. Шаблоны — они хоть и шаблоны, но данные в них в свободной форме. А для использования их надо нормализовать. Вот только для нормализации их надо корректно распарсить, но там формата как такового нет, в шаблонах зачастую вообще встречаются некорректные данные, в.т.ч с опечатками. Ссылки тоже чёрте как. Геморроиться не захотел и забил, так как оказалось не особо нужно. Может для исследователей нейросетей она и полезна, но вот для парсинга на базу оказалась почти бесполезна.
                          • +1

                            Проект dbpedia не смотрели? Он уже достаточно зрелый и вроде именно парсинг в базу и делает.

                          • +3

                            Я уж не знаю как там Вики может значительно влиять на науку, но конкретно в моей области (теория управления) содержание Википедии ограничивается первыми (вводными) курсами дисциплин. Т.е. грубо говоря базовые формулы и понятия.
                            Хотя согласен, что так или иначе она, естественно, используется (хотя, чем серьезнее исследование, тем меньше)

                            • +2

                              Тут ещё не стоит забывать, что исследовалась английская Википедия, а русская ей по уровню действительно во многом уступает.

                            • +1
                              Pokemon?
                              • –1
                                Статьи заблокированные, роскомнадзор, на науку в Рашке никак не влияют)) Ох и заминусуют, понеслась)))
                                • –1
                                  скорее через Википедию пытаются влиять
                                  • +3
                                    В научных статьях принято ставить ссылки на первоисточники, а Википедия первоисточником не является.
                                    К слову, SSRN — это сервис препринтов для социальных и гуманитарных наук, так что с большой вероятностью статья не была рецензирована, а раз так, то называть её научной рано.
                                    • +1
                                      Статья не про ссылки, а про слова/термины — она про нормализацию терминологии
                                      • 0
                                        Речь о том, что это структурированный источник. По нему быстрее можно найти факты и природу явлуний в новой области. А уж потом бегать по статьям.
                                        • +2

                                          К сожалению, Википедия все-таки не слишком надежна: в любой момент статья может стать жертвой вандала безответственного экспериментатора. Как на мой опыт — статья в Википедии это отличный способ начального знакомства с каким-то понятием или фактом, но потом надо очень многое перепроверить.


                                          С дугой стороны, встречался с ситуацией, когда автора вузовского учебника (американский профессор Аллен Дауни) совершенно спокойно и сознательно дает ссылки на Википедию по основным понятиям матстатистики — он обосновывал, что по его мнению в этой области материалы как правило высокого качества и будут однозначно подходить его студентам.


                                          Ну и последнее: по-моему, противопоставлять Википедию и научные статьи по меньшей мере некорректно. Еще в доинтерненую эпоху были энциклопедии, и отличнейшие, но для научной работы все равно надо было ссылаться на оригинальные статьи, иначе результат выглядел странно. Было бы интересно увидеть проценты ссылок из научных статей на, допустим, Британнику, за 20-й век :)

                                          • +1
                                            Еще со времен универа преподы говорили, что википедия не лучше телика. Ссылаться на нее нам попросту запрещали. И правильно делали.
                                            • +1
                                              Не, ну такое сравнение уже совсем ни в какие ворота.

                                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.