Początek formularza

Dół formularza

 


Szczegółowa informacja o przedmiocie


Wersja przedmiotu

Początek formularza

Dół formularza

Kod przedmiotu:

TASS

Nr wersji:

1

Nazwa:

Techniki analizy sieci społecznych

JD:

4

ECTS:

4

JK:

30

Zaliczanie:

B

Ocenianie:

5

Semestr wprowadzenia:

14Z

Osoba odpowiedzialna:

dr inż. Piotr Przemysław Arabas

Opis:

Studia II stopnia (PZ-OWJ)

Początek formularza

Dół formularza

Wymiary

Typ zajęć

Wymiar

W

2

P

2

 

Początek formularza

Dół formularza

Poprzedniki

Typ poprzedzania

Nr poprzednika

Przedmiot poprzedzający

Nazwa

Z

1

PROZ

Programowanie zdarzeniowe (I)

 

Początek formularza

Dół formularza

Początek formularza

Dół formularza

Przynależność do klas tematycznych i programowych

Klasa

Nazwa

Typ klasy

OT

Przedmioty obieralne techniczne

Programowa

PZ

Przedmioty zaawansowane techniczne

Programowa

PZ-OWJ

Przedmioty zaawansowane SID

Programowa

 

Początek formularza

Dół formularza

Konspekt

Streszczenie

Celem przedmiotu jest przedstawienie studentom fenomenu powiązań społecznych, reprezentowanych przez obfitość i różnorodność śladów cyfrowych, pozostawianych przez ludzi. Struktura tych śladów może być ściśle zdefiniowana (np. w rejestrach połączeń telefonicznych, śladach GPS tras ruchu, danych biomedycznych), częściowo otwarta (dane opatrzone etykietami) lub zupełnie swobodna (wiadomości tekstowe, artykuły itp.). Kojarzenie ze sobą danych z różnych źródeł, choć w sposób naturalny niedoskonałe, prowadzi do uzyskania baz o zupełnie nowej wartości. Kojarzone dane są obecnie stosunkowo łatwo dostępne, a proste techniki ich analizy wspomagają uzyskiwanie informacji niezbędnej w objaśnianiu, przewidywaniu lub inżynierii określonych zjawisk, takich jak np. tworzenie grup, rozprzestrzenianie informacji. Wiedza ta ma obecnie konkretną wartość użytkową. Studenci zostają zapoznani z podstawowymi pojęciami dotyczącymi modelowania sieci, oraz z dostępnymi narzędziami i technikami pozyskiwania, magazynowania i obróbki danych. Poznają również techniki prezentacji wyników oraz przykłady tworzenia konkretnych, specjalizowanych aplikacji autorskich, wykorzystujących analizę danych społecznych różnorodnego pochodzenia. Przedstawiane są techniki analizy powiązań semantycznych definiowanych w sposób formalny, jak i nieformalny. Dodatkowo, przedstawiane są przykłady zrealizowanych projektów, wykorzystujących w sposób nieoczywisty grafy powiązań społecznych.

Studenci, zaliczający ten przedmiot, będą umieli wytypować źródła danych, zastosować istniejące mechanizmy lub opracować własne, w celu pobrania i połączenia danych, wybrać sposób przechowywania danych, a następnie zastosować techniki i narzędzia analizy powiązań społecznych, adekwatne do rozwiązywanego zadania.

Treść wykładu

  • Wstęp, podstawowe pojęcia z teorii grafów
  • Własności sieci
  • Oprogramowanie analityczne – Pajek, NetworkX, PGX
  • Pozyskiwanie i przechowywanie danych – BeautifulSoup i CouchDB
  • Pozyskiwanie i przechowywanie danych – API i Cassandra
  • Semantyka w sieciach
  • Grafy dwudzielne
  • Wizualizacja sieci
  • Narzędzia analizy języka naturalnego
  • Mapy jako źródło danych i tło dla danych
  • Aplikacje typu mashup
  • Otwarte dane połączone i język zapytań SPARQL
  • Mechanizmy rekomendacji
  • Modele dynamiki sieci
  • Kaskady opinii
  • Antologia zagadnień

Zakres projektu

Studenci realizują dwa zadania projektowe. Pierwsze, indywidualne, (3 tyg.) polega na pobraniu danych, skonstruowaniu grafu i wyznaczeniu szeregu jego standardowych parametrów. W tym projekcie zarówno dane, jak i narzędzia ich analizy są gotowe, istniejące, wcześniej zbadane. Funkcją pierwszego projektu jest zaznajomienie studentów z istniejącymi, gotowymi modułami programistycznymi. Drugie zadanie (5 tyg.) jest realizowane w zespołach dwuosobowych i polega na wykonaniu aplikacji typu mashup, tj. łączącej dane z wielu źródeł i dokonującej ich analizy, albo sporządzeniu raportu z prac analitycznych. W tym projekcie zarówno pobranie danych, jak i ich połączenie oraz analiza wymaga albo wytworzenia przez studentów fragmentów specyficznego oprogramowania, albo właściwego skonfigurowania oprogramowania istniejącego.
Przykładowe projekty:

·         Mapa czasów dojazdu ze wskazanego miejsca w Warszawie, https://ztm.plur.tech/#500/52.24178172042019/21.014270782470703 [P. Stępień, P. Łada, sem. 2015Z]

·         Bilans płatniczy pomiędzy krajami UE, dla przetargów publicznych w wybranej branży

·         Statystyki współwystępowania języków programowania w zmianach kodów źródłowych (commits)

Warunki zaliczenia

Kolokwium: 45 pkt, projekty: 25+30 pkt.
Warunek zaliczenia: co najmniej 23 pkt z kolokwium, co najmniej 13 pkt z pierwszego i 16 pkt z drugiego projektu, łącznie co najmniej 51 pkt.

Literatura

  1. J. Wojciechowski, K. Pieńkosz, Grafy i sieci, PWN 2013
  2. A. Fronczak, P. Fronczak Świat sieci złożonych, PWN 2009
  3. E. Kolaczyk Statistical Analysis of Network Data, Springer 2009
  4. M. Russell Mining the Social Web, O'Reilly 2011
  5. M. Tsvetovat, A. Kouznetsov Social Network Analysis for Startups, O'Reilly 2011
  6. J.G. Breslin, A. Passant, S. Decker The Social Semantic Web, Springer 2009
  7. M. Kamola, P. Arabas Sieci społeczne i technologiczne. Jak zrozumieć, jak wykorzystać. PWN 2018

Streszczenie (po angielsku)

The aim of the course is to present a number of ways the social data can be obtained, stored and used in further analysis. Basic concepts related to graph theory are accompanied in the course by a scope of techniques and software tools providing insight into graph specifics, as statistical properties, important nodes, cliques etc. Semantics of a graph can be either declared explicitly or inferred from any extra information available. Suitable approaches and reasonable application examples are presented to the students. The course is supplemented with practical use cases of nonstandard application of social network analysis techniques, as churn reduction, social graph reconstruction from incomplete data, and traffic matrix estimation.

The students are taught skills for data source selection, choice and application of techniques for data storage and analysis - in order to be able to accomplish highly customized mashup applications. Practical skills get verified in two projects each student is supposed to complete.