Archive

Chapter 1. Introduction and Overview 본문

통계/네트워크분석

Chapter 1. Introduction and Overview

neonii 2025. 1. 26. 07:22
728x90

참고: Statistical Analysis of Network Data

 

  • 이 책은 statistical analysis of network data 설명할 것! network science와 관련된 연구에서 사용되는 tasks and tools로 구성된 methological foundation을 소개하는 것이 목표.
  • 이 chpater은 network science를 birds-eye view로 소개할 것!

Why Networks?

  • network가 주로 다양한 형태의 graph를 사용하여 표현되기 때문에, 두 단어는 종종 혼용됨. 이 책에서는 일반적인 개념과 수학적 형식화 간의 구별을 강조하기 위해, network를 가장 일반적인 의미로 사용하고, 이를 나타내기 위한 수단을 network graph라고 칭할 것임.
  • The seeds of network-based analysis in the sciences are often placed in the - 1735년 Euler 가 해결한 Konigsberg bridge problem: 각 다리를 한 번씩만 건너는 방법으로 그 도시의 7개의 다리를 모두 건너는 것은 불가능함을 증명함.
  • 이후, 특히 19세기 중반 이후로 these seeds thave grown in a number of key areas.
    • 20세기 중반부터는 operations research와 computer science가 발전하면서 transportation, allocation과 같은 문제에서 활용되기 시작함.
    • 또 일부 사회학자들은 사회 집단 내 상호작용을 특성화하는 데에 network를 활용하기도.
    • 지금은 그보다 더 나아가 computer networking and internet, biology and gene networks, library science and webs of knowledge까지 포함하고 있음.
    • 이러한 성장에 기여한 두 가지 중요한 요인은:
      • reductionism을 벗어나 systems-level perspective를 취하고자 하는 경향
      • high-throughput data collection, storage, and management
    • 현재 challenge는 data that are either high-dimensional, dependent, or massive in quantity
      • In the analysis of network data, all three are often 독특한 방식으로 나타남.

Examples of Networks

  • Newman의 접근법을 따라, 네 가지 유형으로 구분: technological, social, biological, and informational networks. 엄격한 구분은 아니라서 한 네트워크가 둘 이상의 범주에 속할 수 있음.

Technological Networks

  • representing: network form으로 만들어진 human constructions
    • 만들어낸 것인 만큼, some or all of the topology of such network는 특정 주체에 의해 알려져 있음.
    • connectivity는 광섬유 케이블이나 가스관과 같은 물리적 연결 형태일 수도 있고, 송신탑 간의 무선 링크처럼 가상의 연결 형태일 수도 있음.
  • Interest in these networks는 보통 network를 통해 흐르는 commodity

Social Networks

  • representing: a collection of social entities or actors 간의 상호작용
  • 연구 역사가 가장 긴 유형
    • 전통적으로 사회과학 연구자들의 주요 연구 영역이었으나, 최근에는 여러 다른 분야 연구자들도 관심을 갖고 있음.
    • 최근 몇 년간 internet의 영향을 많이 받음. 상호작용 내용이 상대적으로 쉽게 수집 가능해졌지만, 그만큼 network 규모도 커지면서 시각화와 같은 단순한 작업조차도 매우 복잡해짐.
  • measurement challenges가 있음
    • social entities of interest 식별하는 것
    • 연구에 참여하도록 설득하는 것
    • 응답에서 발생할 수 있는 bias

Biological Networks

  • representing: the internal workings of biological systems 다양한 규모에서
    • e.g. network or neurons, ecological networks (i.e. describing predator-prey 관계)
  • 원래 이런 network를 구축하는 작업은 엄청난 시간이 소요되었음. 근데 with the advent of high-throughput measurement techniques in genomics, 반자동 또는 완전 자동 방식으로 추론 가능해짐. 따라서 지금은 system-wide network을 구축하고 시스템 전반적인 패턴을 익히는 데에 집중하는 중 (e.g. mapping of underlying biological system, motifs: 의미있는 clusters or sub-networks 탐색, 세포 기능에서의 역할 추론)

Information Networks

  • representing: relationship among elements of information
    • e.g. networks of citations between 학술지, WWW world wide web (node는 web page, link는 한 페이지가 다른 페이지를 참조), P2P peer to peer (node는 인터넷 사용자, link는 network protocol)
    • often virtual communities 나타내는 social network로도 간주됨
728x90

'통계 > 네트워크분석' 카테고리의 다른 글

Lab4  (0) 2025.03.16
Chapter 4. Descriptive Analysis of Network Graph Characteristics  (1) 2025.02.08
Chapter 3. Mapping Networks  (0) 2025.02.02
Chapter 2. Preliminaries  (0) 2025.01.26