Меню
Главная
Авторизация/Регистрация
 
Главная arrow Экономика arrow Прикладная эконометрика

НАУКА И ОБРАЗОВАНИЕ

Цитируемость ученых и сети научного соавторства: анализ данных Google Scholar

В работе анализируются корреляции между параметрами сети соавторства и библио- метрическими характеристиками ученых в Google Scholar. Оценивание проводилось с помощью моделей счетных данных по выборке, состоящей из более чем 30 тысяч авторов с первым цитированием после 2007 года. Найдена положительная связь между цитируемостью ученого и числом соавторов, цитируемостью и центральностью автора в сети, цитируемостью ученого и средней цитируемостью его соавторов. Индекс Хирша и индекс ПО значимо связаны с числом соавторов и их средней цитируемостью.

Ключевые слова: наукометрия; сети соавторства; библиометрический анализ; Google Scholar; модели счетных данных.

JEL classification: А14; D83; Z13.

Введение

Одним из основных и актуальных вопросов, которые интересуют современную «науку о науке», является связь между библиометрическими показателями ученых и их вовлеченностью в сотрудничество с другими исследователями (Persson et al., 2004). Несмотря на то что строгие математические исследования в этом направлении начались сравнительно недавно, сами ученые уже давно заметили, что расширение контактов и сотрудничества повышает их «научный выход». Огромное число конференций проходит с целью не только обменяться информацией, но и интенсифицировать взаимодействия между научными группами.

Взаимодействие между учеными является неотъемлемой чертой научной деятельности. Одной из форм взаимодействия является работа над научной проблемой нескольких исследователей. В процессе сотрудничества между участниками происходит обмен идеями, обсуждение проблем, результатов, генерация новых идей. Такого рода взаимодействие способно повысить результативность последующих исследований ученых. Таким образом, социальные взаимодействия выступают важным ресурсом ученого и влияют на его положение в профессиональном сообществе.

Значимость и научный вклад публикаций принято оценивать таким параметром, как ци- тируемость — общее число ссылок на данную публикацию в других работах. В связи с этим, актуальным является вопрос, какие факторы влияют на показатели цитируемости ученого и как их можно оценить.

Н. Н. Матвеева, О. В. Польдин

С появлением интернета, электронных баз данных научного цитирования и научных поисковых систем, таких как Web of Science, Scopus, Microsoft Academic Search, Google Scholar и других, задача сбора информации об авторах и их публикациях значительно упростилась, после чего исследования в этом направлении существенно интенсифицировались (Meho, Yang, 2007; Kulkami et al., 2009; Abbasi et al., 2011; Li et al., 2013; Uddin et al., 2013; Orduna- Malea et al., 2015). Стоит отметить, что каждая электронная база данных имеет свою специфику, что необходимо учитывать при анализе используемых данных, в том числе, анализе сетей соавторства. Основные различия представленных данных связаны с количеством индексируемых изданий, охватом научных областей, способами анализа библиометрических характеристик, доступностью (Jacso, 2005; Bakkalbasi et al., 2006; Yang, Meho, 2006; Kulkami et al., 2009; Бедный, Сорокин, 2012; Bensman, 2013; Orduna-Malea et al., 2015; Ortega, 2015).

Представляемое исследование основано на анализе базы данных Google Scholar. В отличие от Web of Science и Scopus, Google Scholar имеет открытый доступ, индексирует большее число источников, содержит поддерживаемые авторами профили пользователей, однако не все индексируемые издания являются научными.

На сегодняшний день непосредственно на базе профилей сети Google Scholar проведено немного исследований. Возможными причинами этого являются ошибки идентификации авторов и их работ, наличие «фантомных» авторов, а также неправильная идентификация года публикации, что, безусловно, влияет на показатели цитируемости (Jacso, 2008а). Несмотря на имеющиеся недостатки, стоит заметить, что библиометрические индексы, рассчитанные на основе Google Scholar, сопоставимы с аналогичными показателями, рассчитанными на основе Web of Science с традиционными импакт-факторами (Harzing, van der Wal, 2008; Wildgaard, 2015).

В данной работе исследуется связь сетевых характеристик ученого, таких как число соавторов (центральность по степени), среднее число соавторов и центральность по близости с его библиометрическими показателями: общим количеством цитирований, индексом Хирша, индексом НО. Используемые сетевые характеристики представляют собой метрики сети соавторства, построенной на основе анализа профилей ученых базы данных Google Scholar.

Сеть соавторства представляет собой граф, в котором узлами являются авторы, а связь между узлами — это научное сотрудничество, выраженное, как правило, в совместных статьях. Сети соавторства ученых позволяют не только визуализировать взаимодействия научного сообщества, но и определить тенденции его развития, ключевых участников, пути распространения информации.

В работах (Heffner, 1981; Kretschmer, 1994; Katz, Martin, 1997; Newman, 2001; Girvan, Newman, 2002; Glanzel, 2002; Newman, 2004) исследуются способы построения и виды сетей соавторства, а также представлены основные способы расчета метрик сети, которые используются в настоящей работе.

В рамках анализа сетей соавторства стоит уделять внимание поиску закономерностей и различий между метриками сети разных научных областей, поскольку параметры сети соавторства ученых могут различаться в зависимости от принадлежности авторов к той или иной научной области (Kretschmer, 1994).

Сетевой анализ соавторства позволяет выявить тенденции и законы взаимодействия участников сети, отражая тем самым формы социального взаимодействия между авторами. Социальное взаимодействие, в свою очередь, может выступать фактором, влияющим на результативность научной деятельности. Вопрос оценки эффективности научной деятельности в настоящее время весьма актуален, поскольку, если в долгосрочной перспективе важность тех или иных результатов научных исследований уже можно оценить, например, по их влиянию на экономическое развитие общества и рост уровня жизни, то в краткосрочной перспективе такое влияние может быть еще не очевидным. Основные способы оценки эффективности научной деятельности представлены в работах (Hirsch, 2005; Egghe, 2006; Bergstrom et al., 2008; Bommann, Daniel, 2008; West et al., 2010; Kreiman, Maunsell, 2011; Fooladi et al., 2013; Писляков, 2010).

Количественная оценка значимости научных результатов, как правило, базируется на индексе цитируемости публикаций, в которых эти результаты опубликованы. В работах (Glanzel, Schubert, 2004; Newman, 2004; Abbasi et al., 2011; Mendez-Vasquez et al., 2012; Uddin et al., 2013) исследуется наличие зависимости между сетевыми характеристиками и эффективностью научной деятельности, выраженной, как правило, в цитируемости и зависимых от нее параметров (индекс Хирша, индекс НО).

Ограничения предыдущих исследований связи библиометрических и сетевых характеристик ученого связаны с использованием небольшого числа соавторов из разных областей науки (Zuckerman, 1967) или же данных об ученых одной научной сферы (Avkiran, 2013; Uddin et al., 2013; Puuska et al., 2014; Yu et al., 2014), что в обоих случаях влияет на достоверность выводов. Также на качество анализируемых данных влияет использование для построения сети соавторов информации о статьях, а не о самих авторах, поскольку возникает проблема поиска соответствия между авторами с одинаковыми фамилиями и их работами (Mendez-Vasquez et al., 2012). В настоящей статье удалось избежать данных ограничений. Специфика Google Scholar позволяет использовать данные об ученых и их соавторах, не прибегая для этого к анализу разрозненных записей об отдельных публикациях или к перекрестному анализу других библиографических баз данных. Непосредственный анализ профилей ученых позволяет избежать проблем при нахождении соответствий авторов и их работ, которые возникают в случае формирования базы данных по отдельным публикациям.

Научная новизна представленной работы заключается в использовании объема данных, значительно превосходящего объемы данных в аналогичных публикациях. Исследование впервые основано на анализе данных профилей Google Scholar, с учетом разделения ученых по научным специализациям и стажу. Кроме того, насколько известно авторам, впервые изучается наличие статистической связи между показателями цитируемости ученого и средней цитируемостью его соавторов.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы