Skip to main content

Web Content Display Web Content Display

Pracownia Web Scrapingu

Pracownia Web scrapingu ISI UJ

Web scraping służy zautomatyzowanemu gromadzeniu danych i informacji ze stron Web. Przy pomocy tej techniki możliwe jest zgromadzenie wielkich zasobów informacji pochodzącej ze stron Web dotyczących ściśle określonych zagadnień. Znacznie ułatwia to i przyśpiesza penetrację wielkich zasobów danych dostępnych online. Gromadzone dane nieustrukturyzowane są konwertowane do postaci ustrukturyzowanej, dzięki czemu mogą być następnie przetwarzane przy użyciu technik big data i/lub metod NLP.

Zadaniem utworzonej pracowni Web scrapingu ISI jest realizacja badań na obu wymienionych etapach: zarówno gromadzenia danych badawczych pochodzących z Web, jak również ich dalszych analiz. W podobnym kierunku skierowane są działania dydaktyczne mające na celu zainteresowanie studentów ISI problemami Web scrapingu i realizację konkretnych rozwiązań.

Pracownia Web scrapingu ISI powstała z inicjatywy pracowników Zakładu Metodologii Badań Informacyjnych ISI w 2022 r. Jej utworzenie możliwe było dzięki grantowi uzyskanemu w ramach projektu POB DigiWorld w ramach Inicjatywy Doskonałości UJ pt. Web scraping w analizie poziomu danetyzacji polskich instytucji naukowych, który pozwolił na zakup sprzętu komputerowego. Z funduszy zadania "Strategiczna infrastruktura" pozyskanych przez Dyrekcję ISI UJ zakupione zostało oprogramowanie oraz przeprowadzono szkolenia pracowników.

Stali członkowie zespołu:
Dr hab. Marek Nahotko, prof. UJ
Dr Aneta Januszko-Szakiel,
Dr Małgorzata Jaskowska,
Mgr Magdalena Zych.
Współpracują:
Dr Paloma Korycińska,
Dr Marek Deja.

Dotychczasowe efekty badań:

1.    Nahotko, M., Zych, M., Januszko-Szakiel, A., Jaskowska, M. (2023). Big data-driven investigation into the maturity of library research data services (RDS). Journal of Academic Librarianship, vol. 49, art. 102646.

2.    Nahotko, M. Januszko-Szakiel, A., Jaskowska, M. Zych M. (2022). Obecność problematyki zarządzania danymi badawczymi na stronach Web polskich bibliotek naukowych. Pod red. M. Nahotko. Kraków: UJ, BJ.

3.    Nahotko, M. (2022). Metoda meta-syntezy w diagnostyce systemów informacyjnych. W: S. Cisek, M. Wójcik (red.), Diagnostyka w zarządzaniu informacją. Perspektywa nauk o komunikacji społecznej i mediach w kontekście rozwoju badań interdyscyplinarnych (s. 157-170). Kraków: UJ, BJ.

4.    Zych, M. (2022). Diagnostyczne aspekty działalności podmiotów zarejestrowanych w AIIP. W: S. Cisek, M. Wójcik (red.), Diagnostyka w zarządzaniu informacją. Perspektywa nauk o komunikacji społecznej i mediach w kontekście rozwoju badań interdyscyplinarnych (s. 171-192). Kraków: UJ, BJ.