Dlaczego nie lubię Google Scholar?

Google Scholar to najbardziej znana na świecie wyszukiwarka naukowa. Korzystanie z niej jest szybkie i wygodne. Zawsze masz do niej dostęp, a intuicyjny interfejs wymaga od ciebie minimalnego zaangażowania. Wpisujesz hasło i już – oczekujesz, że Google Scholar przecież sam będzie filtrować i ograniczać wyniki wyszukiwania, by pokazać dokładnie to, o co ci chodzi. Tylko czy na pewno Google Scholar potrafi to zrobić?

Wyszukiwarka naukowa – co to jest?

Wyszukiwarki naukowe to takie, które przeszukują źródła naukowe – tylko i wyłącznie. Istnieją wyszukiwarki, które gromadzą dane dotyczące wielu dziedzin – tu przykładem jest właśnie Google Scholar, ale istnieją też takie, które dedykowane są zasobom naukowym z jednej dziedziny, np. naukom ścisłym, medycznym, biomedycznym czy technicznym. Dzięki wyszukiwarkom naukowym znajdziesz publikacje naukowe bądź informacje o nich w repozytoriach, katalogach, archiwach czasopism czy bibliotekach cyfrowych. Zwykle obejmują bardzo szeroki zakres literatury naukowej tj.: książki, rozprawy naukowe, abstrakty, artykuły, strony czasopism, materiały konferencyjne, szarą literaturę i in.

Czym się różni wyszukiwarka naukowa od bazy danych, katalogu czy bibliografii?

Google Scholar działa na zasadzie – szukam wszystkiego wszędzie (to uogólnienie – sic!). Crawlery wyszukiwarki automatycznie lokalizują materiały akademickie w internecie – na stronach www wydawnictw akademickich, uniwersytetów, towarzystw naukowych i zawodowych, ale też na dowolnych stronach, które taki typ materiałów zawierają. Dzięki temu Google Scholar w wynikach podaje miliony dokumentów wśród których znajdziesz abstrakty, artykuły, prace dyplomowe, książki, rozdziały z książek, referaty konferencyjne, raporty techniczne lub ich projekty, pre-printy, post-printy, patenty i opinie sądowe.

Inne typy zasobów – bazy danych, katalogi biblioteczne czy bibliograficzne bazy danych – mocno różnią się od tego, jak działa wyszukiwarka naukowa, co zasadniczo wynika z tego, że mają inne założenia i inne są cele ich istnienia. Choć ciągle podstawową rolą każdego z tych narzędzi jest rola informacyjna czyli dostarczanie informacji o istnieniu jakiegoś zasobu/zbioru/rekordu. W skrócie:

  • baza bibliograficzna – gromadzi w jednym miejscu w miarę kompletny wykaz publikacji z wybranych dziedzin, zakresów, tematów lub wykaz konkretnych typów wydawnictw (np. wykaz map czy płyt CD). Jest informacja o zasobie, nie musi być jego pełnej wersji w bazie. Chciało być się rzec – wszystko na konkretny temat;
  • katalog biblioteczny – opisy egzemplarzy, które fizycznie biblioteka posiada na swoich półkach;
  • biblioteka cyfrowa – zdigitalizowane zasoby, których fizyczne wersje posiada biblioteka. Ze względu na ograniczenia prawa autorskiego, w wolnym dostępie na stronie www widzimy tylko niektóre publikacji. Do części dostęp będzie zablokowany i zobaczysz jedynie informację o tym, że publikacja istnieje (nie będziesz widział jej pełnej wersji cyfrowej).

Co za dużo, to niezdrowo?

Różne systemy wyszukiwawcze różnią się między sobą. Różnią się funkcjonalnością, charakterem, zapleczem technicznym, zakresem. Niektóre bazy danych mogą być bardziej odpowiednie do gromadzenia informacji na temat konkretnego tematu lub mają większy zasięg historyczny niż inne. Musisz pamiętać, że nie ma źródła idealnego. Jednego i idealnego, bo żadne pojedynczy system wyszukiwania nie jest doskonały. Opieranie się na jednym źródle bądź korzystanie z nieodpowiednich wyszukiwarek/baz może prowadzić do tego, że nie odnajdziemy wszystkich istotnych publikacji. A jeśli nie zgromadzimy wszystkich danych (wszystkich dostępnych), to jaki może być efekt syntezy czy przeglądu systematycznego, który robimy? Poza tym to samo pytanie skierowane do innego systemu może skutkować innymi wynikami. Dlatego zasoby, do których mamy dostęp w internecie musimy traktować jako źródła komplementarne czyli wzajemnie uzupełniające się i nie poprzestawać nigdy tylko na jednym.

Tak jak rzemieślnicy mają konkretne narzędzia do konkretnych zadań, tak musisz zrozumieć, że nasze cyfrowe narzędzia nie są rozwiązaniami uniwersalnymi. Wyszukiwarki oparte na indeksie, takie jak Google Scholar czy Microsoft Academic, funkcjonują inaczej niż dostawcy baz danych czy platformy czasopism. Gdy szukasz zasobów Open Access to warto oprócz Google Scholar odwiedzić też CrossRef, DOAJ, OpenDOAR czy ROAR – dopiero wtedy możesz mieć pewność, że zrobiłeś wszystko, by zadbać o odpowiednią ilość publikacji naukowych OA.

Jak działa Google Scholar?

Po wpisaniu słowa kluczowego Google Scholar skanuje słowa kluczowe w dokumentach (całej ich treści), a nie indeksowane terminy tematyczne nadawane dokumentom w źródłach bazodanowych (chodzi tu o hasła przedmiotowe czy tematy). Powoduje to, że w efekcie wyszukiwania otrzymujemy przytłaczającą liczbę wyników. Nie znam śmiałka, który próbował przejrzeć wszystkie wyniki, które otrzymał!

Nie znamy dokładnej wielkości baz danych Google Scholar. W 2019 r. szacowano, że obejmuje swoim zasięgiem 389 milionów rekordów, co sprawia, że faktycznie jest obecnie najbardziej wszechstronną wyszukiwarką akademicką. Ale w tym wypadku to chciało by się rzec, że to „przekleństwo urodzaju”.

Google Scholar, podobnie jak Google, wyniki szereguje za pomocą algorytmu, który bierze pod uwagą dużą liczbę zmiennych, np. to gdzie artykuł został opublikowany, prze kogo napisany, jak często i jak niedawno był cytowany itd. itp. Dokładnie elementy tego algorytmu i waga poszczególnych zmiennych nie jest znana, bo stanowi własność przemysłową. Badania empiryczne wykazują jednak, że jednym z kluczowych czynników rankingowych jest liczba cytowani otrzymywanych przez dany dokument.

Minusy Google Scholar

O Google Scholar powstała już naprawdę spora ilość artykułów. Badacze starają się oszacować zarówno jego wielkość, jak i system działania. Rozpracowują wyszukiwania, jakość wyników, sposób raportowania. Dokonują obliczeń, rankingów, porównań. Niektóre minusy, o których piszę poniżej, to rzeczy, które użytkownik może sam wychwycić. Inne to te, które „wyłapali” naukowcy. Wszystkie punkty to takie podsumowanie tego, co się w tych artykułach na przestrzeni lat pojawiało, a co spędza sen z powiek naukowcom:

  • brak funkcji filtrowania;
  • ograniczone opcje tworzenia złożonych ciągów i wyrażeń wyszukiwawczych;
  • skromna liczba operatorów i znaków umożliwiających precyzowanie kwerendy;
  • brak funkcji przycinania, jaka jest stosowana w bibliograficznych bazach danych (jest przycinanie dla brakujących słów, ale nie brakujących liter);
  • brak kontrolowanego słownictwa;
  • brak stabilności wyszukiwania – trudno replikować wyszukiwania przeglądów systematycznych;
  • pliki cookie i lokalizacja mogą sprawiać, że wyniki dostępne bliżej naszej lokalizacji będą na wyższej pozycji wyników wyszukiwania;
  • nie znamy algorytmu i zasad na jakich wyniki są wyświetlane;
  • tylko pierwsze 1000 wyników jest widocznych, niezależnie od podanej liczby wyników wyszukiwania;
  • przykłada wagę do tych artykułów, które są najczęściej cytowane (starsze idą na dalszy plan)
  • rzadka aktualizacja baz danych (jak na tempo naukowe) – raz na miesiąc.

Kiedy korzystać z Google Scholar?

Google Scholar świetnie się sprawdza, gdy szukasz konkretnego tytułu lub autora – bezsprzecznie. Jest też przydatny, gdy interesuje cię tylko kilka wyników z pierwszej strony wyników wyszukiwarki (pod warunkiem, że masz dość precyzyjnie określone słowa kluczowe i faktycznie ta pierwsza strona zaprezentuje się sensownie). Możesz śmiało korzystać z Google Scholar gdy dopiero rozpoczynasz research i chcesz się zorientować w temacie, albo traktujesz wyszukiwarkę jako uzupełniające źródło po kwerendzie, której dokonałeś już też w innych bazach czy źródłach.

Inne systemy wyszukiwania, takie jak bibliograficzne bazy danych czy komercyjne platformy, odbierane są jako trudniejsze, bo wymagają od użytkownika znajomości zasad i reguł poruszania się po nich. Zwykle nie są one tak proste, jak w Google Scholar, choć do ich opanowania wystarczy odrobina treningu. Zwykle kierujemy się wygodą i łatwością użycia, ale w przypadku wyszukiwania naukowego nie zawsze idzie to w parze z kompletnością i wiarygodnością. My – internauci – często nie mamy świadomości niedociągnięć poszczególnych źródeł, ale nie chodzi o to, by nie korzystać z nich w ogóle, ale by korzystać z narzędzi z pełną świadomością ich mocnych i słabych stron. Warto zapamiętać, że odpowiedni dobór baz danych jest kluczowym czynnikiem w procesie przeszukiwania literatury.

Jeśli chcesz poczytać więcej o Google Scholar i różnych doświadczeniach, których na jego tkance naukowcy dokonywali, zerknij do bibliografii poniżej. A jeśli marzysz o tym, by nauczyć się robić kwerendy w Google Scholar, poznać naukowe bazy danych i zobaczyć w czym się przydają oraz jak się po nich poruszać, to zapraszam na szkolenie z informacji naukowej w internecie, które prowadzę pod egidą Infobrokerska.pl. Nauczysz się, jak skutecznie docierać do danych, wykorzystując zaawansowane narzędzia i sprawdzone źródła.

Bibliografia

Bates, J., Best, P., McQuilkin, J., & Taylor, B. (2017). Will Web Search Engines Replace Bibliographic Databases in the Systematic Identification of Research? The Journal of Academic Librarianship, 43(1), 8–17. https://doi.org/10.1016/j.acalib.2016.11.003

Falagas, M. E., Pitsouni, E. I., Malietzis, G. A., & Pappas, G. (2008). Comparison of PubMed, Scopus, Web of Science, and Google Scholar: Strengths and weaknesses. The FASEB Journal, 22(2), 338–342. https://doi.org/10.1096/fj.07-9492LSF

Gardner, S., & Eng, S. (2005). Google Scholar a repozytoria i biblioteki cyfrowe w Polsce. Library Hi Tech News, 22(8), 42–45. https://doi.org/10.1108/07419050510633952

Giustini, D., & Boulos, M. N. K. (2013). Google Scholar is not enough to be used alone for systematic reviews. Online Journal of Public Health Informatics, 5(2), 214. https://doi.org/10.5210/ojphi.v5i2.4623

Google Scholar—Zaawansowane narzędzia wyszukiwania. (b.d.). Pobrano 9 luty 2021, z https://otwartanauka.pl/analysis/case-studies/google-scholar-zaawansowane-narzedzia-wyszukiwania

Grzybowski, P., & Marszałek, K. (b.d.). (Nie)upowszechnianie w Internecie polskojęzycznego dorobku z pedagogiki międzykulturowej. 14.

Gusenbauer, M. (2019). Google Scholar to overshadow them all? Comparing the sizes of 12 academic search engines and bibliographic databases. Scientometrics, 118(1), 177–214. https://doi.org/10.1007/s11192-018-2958-5

Gusenbauer, M., & Haddaway, N. R. (2020). Which academic search systems are suitable for systematic reviews or meta-analyses? Evaluating retrieval qualities of Google Scholar, PubMed, and 26 other resources. Research Synthesis Methods, 11(2), 181–217. https://doi.org/10.1002/jrsm.1378

Liu, J., Zamir, H., Li, Y., & Hastings, S. K. (2018). Search systems and their features: What college students use to find and save information. Library & Information Science Research, 40(2), 118–124. https://doi.org/10.1016/j.lisr.2018.06.002

Loan, F. A., & Sheikh, S. (2018). Is Google scholar really scholarly? Library Hi Tech News, 35(3), 7–9. https://doi.org/10.1108/LHTN-11-2017-0078

López-Fitzsimmons, B. M., & Nagra, K. A. (2019). Google vs. library databases: Engaging twenty-first century undergraduate students in critical thinking. Journal of Electronic Resources Librarianship, 31(4), 219–231. https://doi.org/10.1080/1941126X.2019.1669959

Martín-Martín, A., Costas, R., van Leeuwen, T., & Delgado López-Cózar, E. (2018). Evidence of open access of scientific publications in Google Scholar: A large-scale analysis. Journal of Informetrics, 12(3), 819–841. https://doi.org/10.1016/j.joi.2018.06.012

Martín-Martín, A., Thelwall, M., Orduna-Malea, E., & Delgado López-Cózar, E. (2021). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: A multidisciplinary comparison of coverage via citations. Scientometrics, 126(1), 871–906. https://doi.org/10.1007/s11192-020-03690-4

Orduña Malea, E., Martín-Martín, A., & Delgado-López-Cózar, E. (2017). Google Scholar as a source for scholarly evaluation: A bibliographic review of database errors. Revista española de Documentación Científica, 40(4), 1–33. https://doi.org/10.3989/redc.2017.4.1500

Orduna-Malea, E., Martin-Martin, A., & Lopez-Cozar, E. D. (2017). Google Scholar and the gray literature: A reply to Bonato’s review. arXiv:1702.03991 [cs]. http://arxiv.org/abs/1702.03991

Osiński, Z. (b.d.). Historia Polski w czasopismach indeksowanych w bazie Scopus. 16.

Pozsgai, G., Lövei, G. L., Vasseur, L., Gurr, G., Batáry, P., Korponai, J., Littlewood, N. A., Liu, J., Móra, A., Obrycki, J., Reynolds, O., Stockan, J. A., VanVolkenburg, H., Zhang, J., Zhou, W., & You, M. (2020). A comparative analysis reveals irreproducibility in searches of scientific literature. BioRxiv, 2020.03.20.997783. https://doi.org/10.1101/2020.03.20.997783

Yasin, A., Fatima, R., Wen, L., Afzal, W., Azhar, M., & Torkar, R. (2020). On Using Grey Literature and Google Scholar in Systematic Literature Reviews in Software Engineering. IEEE Access, 8, 36226–36243. https://doi.org/10.1109/ACCESS.2020.2971712

4.5 4 votes
Article Rating
Subscribe
Powiadom o
guest
0 komentarzy
Inline Feedbacks
View all comments