12 // Netzwerke als Daten

Trockenübungen

  1. Netzwerke, also die soziale Darstellung von Knoten und Kanten, lassen sich insbesondere auf zwei Dimensionen jeweils in zwei Gruppen einteilen. In welche?
  2. Wie berechnet sich in ungewichteten Graphen die Distanz?
  3. Was beschreibt die Nähenzentralität / Closeness?
  4. Was sagt eine hohe Transitivität über einen Graphen aus?
  5. Der Durchmesser eines fiktiven Netzwerks beträgt 24. Lässt sich etwas darüber aussagen, wie viel das ist?
  6. Was ist “community detection”?

Praxisübungen

Beantworten Sie die folgenden Fragen (ggf. von Hand) zu diesem Graphen:

beispielhaftes Netzwerk

  1. Um was für eine Art von Graphen handelt es sich?
  2. Ermitteln Sie die Anzahl an Knoten, Kanten und die Dichte.
  3. Ermitteln Sie für den Knoten N dessen In- und Outdegree.
  4. Unter Berücksichtigung der gerichteten Kanten (also nur “in Fahrtrichtung”), wie hoch ist die Distanz zwischen F und C?
  5. Finden Sie auch den Durchmesser des Graphen?
  6. Welches ist der Knoten mit der höchsten Zwischenzentralität (Betweenness)?

Um soziale Netzwerkdaten mit Python oder R umzusetzen, gibt es mittlerweile soviel Literatur und soviel angepasste Übungen (online), dass dieser Komplexität mit ein paar Übungen hier nicht gerecht werden würde. Stattdessen soll gute Literatur hier entsprechend gewürdigt und verlinkt werden:

Lösungsansätze

Ab hier folgen nun verschiedene Lösungswege zu den oben vorgestellten Übungen. Damit Sie die nicht “versehentlich” überscrollen und so Ihrer Übungsmöglichkeiten beraubt werden, folgt hier zunächst ein visueller Bruch.

Winkende weiße Katze als GIF

Trockenübungen

  1. Gerichtet/Ungerichtet (sind die Kanten Pfeile oder einfach nur Linien) und gewichtet/ungewichtet (sind Kanten unterschiedlich viel wert, also zB dicker/dünner).
  2. Als kürzeste Anzahl der Kanten, die notwendig sind, um von einem bestimmten Knoten zu einem bestimmten anderen Knoten zu gelangen.
  3. Als Maß beschreibt sie die möglichst nahe Distanz zu möglichst vielen anderen Knoten. Inhaltlich interpretierbar ist sie als Maß der (starken) Vernetzung.
  4. Zunächst einen hohen Anteil “vollständiger” Dreiecksbeziehungen (alle drei Knoten sind mit allen anderen beiden Knoten vernetzt). Inhaltlich interpretierbar sind solche Graphen als Netzwerke mit hohem (sozialem) Zusammenhalt, also wahrscheinlich einer großen Nähe und Ähnlichkeit.
  5. Jein. Typischerweise sind Netzwerke mit Menschen als Knoten dichter, sodass der Durchmesser in der Regel ein- oder niedrig zweistellig (zB 6-12) ist.
  6. Eine Verfahrensfamilie zur automatisierten Erkennung von Gruppen/Clustern.

Praxisübungen

  1. Einen gerichteten aber ungewichteten Graphen.
  2. 15 Knoten, 26 Kanten, d = 0,12 (12% aller möglichen Kanten).
  3. Indegree = 1 (eine eingehende Kante), Outdegree = 4 (vier ausgehende Kanten).
  4. 3 (F > N > G > C).
  5. Der Durchmesser beträgt hier 5.
  6. K, mit einer Zwischenzentralität von 30 (bei Berücksichtigung der gerichteten Kanten, also nur “in Fahrtrichtung”).