Początek formularza

Dół formularza

 


Szczegółowa informacja o przedmiocie


Wersja przedmiotu

Początek formularza

Dół formularza

Kod przedmiotu:

TASS

Nr wersji:

1

Nazwa:

Techniki analizy sieci społecznych

JD:

4

ECTS:

4

JK:

30

Zaliczanie:

B

Ocenianie:

5

Semestr wprowadzenia:

14Z

Osoba odpowiedzialna:

dr inż. Piotr Przemysław Arabas

Opis:

Studia II stopnia (PZ-OWJ)

Początek formularza

Dół formularza

Wymiary

Typ zajęć

Wymiar

W

2

P

2

 

Początek formularza

Dół formularza

Poprzedniki

Typ poprzedzania

Nr poprzednika

Przedmiot poprzedzający

Nazwa

Z

1

PROZ

Programowanie zdarzeniowe (I)

 

Początek formularza

Dół formularza

Początek formularza

Dół formularza

Przynależność do klas tematycznych i programowych

Klasa

Nazwa

Typ klasy

OT

Przedmioty obieralne techniczne

Programowa

PZ

Przedmioty zaawansowane techniczne

Programowa

PZ-OWJ

Przedmioty zaawansowane SID

Programowa

 

Początek formularza

Dół formularza

Konspekt

Streszczenie

Celem przedmiotu jest przedstawienie studentom fenomenu powiązań społecznych, reprezentowanych przez obfitość i różnorodność śladów cyfrowych, pozostawianych przez ludzi. Struktura tych śladów może być ściśle zdefiniowana (np. w rejestrach połączeń telefonicznych, śladach GPS tras ruchu, danych biomedycznych), częściowo otwarta (dane opatrzone etykietami) lub zupełnie swobodna (wiadomości tekstowe, artykuły itp.). Kojarzenie ze sobą danych z różnych źródeł, choć w sposób naturalny niedoskonałe, prowadzi do uzyskania baz o zupełnie nowej wartości. Kojarzone dane są obecnie stosunkowo łatwo dostępne, a proste techniki ich analizy wspomagają uzyskiwanie informacji niezbędnej w objaśnianiu, przewidywaniu lub inżynierii określonych zjawisk, takich jak np. tworzenie grup, rozprzestrzenianie informacji. Wiedza ta ma obecnie konkretną wartość użytkową. Studenci zostają zapoznani z podstawowymi pojęciami dotyczącymi modelowania sieci, oraz z dostępnymi narzędziami i technikami pozyskiwania, magazynowania i obróbki danych. Poznają również techniki prezentacji wyników oraz przykłady tworzenia konkretnych, specjalizowanych aplikacji autorskich, wykorzystujących analizę danych społecznych różnorodnego pochodzenia. Przedstawiane są techniki analizy powiązań semantycznych definiowanych w sposób formalny, jak i nieformalny. Dodatkowo, przedstawiane są przykłady zrealizowanych projektów, wykorzystujących w sposób nieoczywisty grafy powiązań społecznych.

Studenci, zaliczający ten przedmiot, będą umieli wytypować źródła danych, zastosować istniejące mechanizmy lub opracować własne, w celu pobrania i połączenia danych, wybrać sposób przechowywania danych, a następnie zastosować techniki i narzędzia analizy powiązań społecznych, adekwatne do rozwiązywanego zadania.

Treść wykładu

  • Organizacja przedmiotu. Demonstracja przykładowej interaktywnej aplikacji analizującej sieć zrekonstruowaną z danych heterogenicznych, np. będących wynikiem połączenia danych o ruchu drogowym z danymi o gęstości zaludnienia. Podstawowe pojęcia z teorii grafów.
  • Pojęcia podstawowe cd. (ścieżka, podgrafy itp.). Miary statystyczne dla grafu. Miary dla wierzchołka (stopień, pośrednictwo, ranking itp.). Algorytmy do wyznaczania w/w miar.
  • Specyfika grafów opisujących sieci społeczne - rozkład potęgowy stopni wierzchołków, kręgi i role społeczne w grafie, istotność słabych powiązań, dyfuzja w grafie. Koncepty związane z dynamiką grafu (model Erdősa-Rényiego, powstanie spójnej składowej grafu).
  • Prezentacja narzędzi do analizy grafów (gotowych aplikacji i modułów dostępnych w różnych językach programowania). Przegląd dostępnych źródeł danych i sposobów tworzenia z nich grafowych reprezentacji powiązań.
  • Semantyka powiązań i węzłów - mikroformaty i HTML5. Taksonomie i folksonomie. Wstęp do analizy języka naturalnego: korpus językowy i podobieństwo TF-IDF.
  • Narzędzia i techniki pozyskiwania danych. Przechowywanie pozyskanych danych - bazy nieustrukturyzowane.
  • Grafy dwudzielne.
  • Techniki rozmytego dopasowania tekstów.
  • Dane mapowe i podkłady mapowe.
  • Techniki tworzenia dedykowanych aplikacji interaktywnych łączących dane z wielu źródeł (mashups).
  • Język zapytań semantycznych SPARQL i zastosowania praktyczne.
  • Kaskady informacyjne.
  • Algorytmy rekomendacji.
  • Algorytmy wizualizacji grafów.
  • Dynamika struktury grafów.
  • Dyfuzja informacji w grafie.
  • Autorskie przykłady praktyczne: modelowanie procesu odejść klientów, procesu sprzedaży, rekonstrukcji grafu na podstawie rejestru połączeń telefonicznych, estymacji macierzy ruchu.
  • Kolokwium.

Zakres projektu

Studenci realizują indywidualnie dwa zadania projektowe. Pierwsze (3 tyg.) polega na pobraniu danych, skonstruowaniu grafu i wyznaczeniu szeregu jego standardowych parametrów. W tym projekcie zarówno dane, jak i narzędzia ich analizy są gotowe, istniejące, wcześniej zbadane. Funkcją pierwszego projektu jest zaznajomienie studentów z istniejącymi, gotowymi modułami programistycznymi. Drugie zadanie (5 tyg.) polega na wykonaniu aplikacji typu mashup, tj. łączącej dane z wielu źródeł i dokonującej ich analizy. W tym przypadku zarówno pobranie danych, jak i ich połączenie oraz analiza wymaga albo wytworzenia przez studentów fragmentów specyficznego oprogramowania, albo właściwego skonfigurowania oprogramowania istniejącego.
Przykładowe projekty:

·        Mapa czasów dojazdu ze wskazanego miejsca w Warszawie, https://ztm.plur.tech/#500/52.24178172042019/21.014270782470703 [P. Stępień, P. Łada, sem. 2015Z]

·        Bilans płatniczy pomiędzy krajami UE, dla przetargów publicznych w wybranej branży, http://przetargipubliczne.eu [F. Gralewski, P. Pawlukiewicz, sem. 2016Z]

·        Bilans płatniczy pomiędzy krajami UE, dla przetargów publicznych w wybranej branży – aplikacja mobilna dla Windows 10, https://www.microsoft.com/pl-pl/store/p/eu-procurement-analysis/9n864njlwstb [A. Sadowski, P. Olechno, sem. 2016Z]

·        Statystyki współwystępowania języków programowania w zmianach kodów źródłowych (commits), http://ec2-35-166-148-8.us-west-2.compute.amazonaws.com/DevCA/languages/, [A. Syroka. M. Chołodziński, sem 2016Z]

Warunki zaliczenia

Kolokwium: 45 pkt, projekty: 25+30 pkt.
Warunek zaliczenia: co najmniej 23 pkt z kolokwium, co najmniej 13 pkt z pierwszego i 16 pkt z drugiego projektu, łącznie co najmniej 51 pkt.

Literatura

  1. J. Wojciechowski, K. Pieńkosz, Grafy i sieci, PWN 2013
  2. A. Fronczak, P. Fronczak Świat sieci złożonych, PWN 2009
  3. E. Kolaczyk Statistical Analysis of Network Data, Springer 2009
  4. M. Russell Mining the Social Web, O'Reilly 2011
  5. M. Tsvetovat, A. Kouznetsov Social Network Analysis for Startups, O'Reilly 2011
  6. J.G. Breslin, A. Passant, S. Decker The Social Semantic Web, Springer 2009

Streszczenie (po angielsku)

The aim of the course is to present a number of ways the social data can be obtained, stored and used in further analysis. Basic concepts related to graph theory are accompanied in the course by a scope of techniques and software tools providing insight into graph specifics, as statistical properties, important nodes, cliques etc. Semantics of a graph can be either declared explicitly or inferred from any extra information available. Suitable approaches and reasonable application examples are presented to the students. The course is supplemented with practical use cases of nonstandard application of social network analysis techniques, as churn reduction, social graph reconstruction from incomplete data, and traffic matrix estimation.

The students are taught skills for data source selection, choice and application of techniques for data storage and analysis - in order to be able to accomplish highly customized mashup applications. Practical skills get verified in two projects each student is supposed to complete.